交流一二:
- 让 AI 来管理代码的话,每次读 500 行反而比读 1000 行更费 Token,而且人工编排流程真不如让大模型自己定,「很多事儿,还是很反直觉的」
- 以前做生意,创造 100 份价值得赚 20 块钱才活得下来,现在赚 1 块钱就够了,「因为 AI 在干活,这并不消耗人力」
- 一个不写代码的律师,用 OpenClacky 一个人搞定了合同审查、阅卷分析、诉讼可视化等等一系列功能,定价 1999 元,「每天都有律师来找他买」
以上内容,来自我和 OpenClacky 创始人李亚飞的一次对话。
OpenClacky 是一个以省钱为核心优势的开源 AI Agent,对 Claude、DeepSeek、GPT、Kimi、MiniMax 等十几套模型 API 逐一做了响应格式和调用链的适配优化。

至于省钱的奥秘:上下文调优,以及 90% 的 Cache 命中率。

作为结果,比 OpenClaw 省 50%,更只有 Hermes 的 1/6。

李亚飞是 OpenClacky 的创始人,10 年全栈工程师经验。这个项目拿到了包括奇绩、真格、盈动、Variable、红杉中国、高瓴的投资。
四次下注
亚飞在 OpenClacky 之前做过三个产品,每一个都是对行业的重新下注,每一次都比上一次更往深处走一层。
ShowMeBug,2019 年启动,做技术面试和编程测评,做到了行业 TOP。支持 20+ 语言,几十个框架,秒级启动,也给团队带来了一个副产品:云端 IDE 的全栈自研能力。

1024Code,2023 年启动,比 Devin 早半年,也是在国内做出了第一个自主决策链 AI Agent。当时 AutoGPT 刚出来,他们的平台已经能一键托管 AutoGPT 了。但那时候 AI 写个稳定的贪吃蛇都做不到,他很清楚市场没到。后来想明白一件事:1024Code 还是在「帮程序员写代码」的框架里,而程序员的人群是窄的。关掉了。

Clacky.ai,2024 年 4 月立项。让不会写代码的人用一句话生出一个能跑、能收钱的全栈应用。有数据库、有中间件、有部署,一条龙。全团队干了一年多,有一批铁杆用户。

但到了去年 12 月,两个现实压过来了。第一,海外运营成本太高,云端并发 10 万级非常烧钱。第二,Agent 架构已经稳定了,Skill 加 Harness 工程这个模式可能好几年都不会变。
于是有了第四个产品——

他把 Clacky 前面加了个 Open,就有了开源的 OpenClacky。
读 500 行代码,比读 1000 行更贵
这是一个非常反直觉的现象。做 coding agent 的时候,最吃 Token 的是读大文件。一个 5000 行的代码文件,塞进去可能 5 万到 10 万 Token。很自然地会想到先做个预处理,用语法解析器把密度降一下,或者只读前 200 行、300 行。
他们试了,大多数情况下无效,反而更贵。
你不知道 AI 这次读这个文件是想干嘛。你做的程序是死板的,再怎么优化也不如大模型自己来看。你给它一份只包含几个关键函数的摘要,AI 一看:我为什么只拿到这几个函数?我还得看所有的信息。然后它又去读一遍完整文件。虽然看着省了一次 Token,实际上多了两次调用。
也正是这个优化思路,让 OpenClacky 的请求数量,显著低于其他框架。

他们反复试了 200 行、300 行、500 行、800 行、1000 行。最后发现 1000 行是最优解。一次读 1000 行大约 1 万到 1.5 万 Token,看上去不便宜,但大多数时候够 AI 翻一翻就找到它要的东西了。500 行的成本反而翻一倍。
「这些东西就是慢慢测出来的,工程上没有捷径。」
下半场是账单
对于亚飞来说,他去年的 Agent 账单,一个月稳定在 1500 到 2400 美金,今年随着模型价格的暴涨,费用开始水涨船高,最近半年差不多有 3000-4000 美金了。
模型能力到了,接下来大家的瓶颈就是账单了。去年底到现在,中国已经出了几个真正能打的 agentic 模型。但你要真用,成本还是很高。
OpenClacky 有个 V2EX 的用户,用过所有热门 Agent,Claude Code、OpenClaw、Hermes、Codex 全试过。切到 OpenClacky,Token 消耗少了 8 倍。
对此,亚飞他们 4 月底花一周时间做了一次正式横评,把这四个 Agent 拎了出来进行测试:同模型、同 prompt、同 skill、独立 OpenRouter Key。



我问:你们这东西,跟 Claude Code 差距在哪?
亚飞直言:Claude Code 的 Cache 命中率 95.2%,比 Clacky 的 90.6% 好很多。毕竟 Claude Code 是 Anthropic 自家做的,从底层就懂自己的模型。但 OpenClacky 的请求数更少,51 个 vs 70 个,总账单基本打平。

OpenClacky 1.0.1 版本,实际使用中已经做到接近 100% 的 Cache 命中率。
只有 16 个工具
在 OpenClacky 里,一共有 16 个核心工具。作为对比,Claude Code 有 40+ 个,OpenClaw 有 23 个,Hermes 有 52 个。
是因为有一个叫 invoke_skill 的元工具,所有复杂能力全部 Skill 化。

工具越少,schema 越短,Agent 判断越准。每一次模型调用都要把所有工具描述塞进上下文,工具数量直接影响基础开销。这是请求数能压到 51 的核心原因。
渐进式安装也是他反复讲的一个设计。很多国产 Agent 一键安装,安完之后发现啥功能都没有。海外的那些开源 Agent 能力强,但安装就要死要活。他们的做法是只有用到某个依赖的时候才会帮你装。读 PDF、OCR 这些场景,第一次用到它才安装对应的依赖包。

一个律师,一个人
聊到 Skill 创作者生态,李亚飞给我看了一个案例:青狮龙虾。
qingclaw.com,做的人本身是一个律师,网站用 OpenClacky 开发,微信支付,完全国产。律师朋友付了钱,钱打到他自己的账户,然后他调 OpenClacky 的接口自动开通 license。

他一个人,用 OpenClacky 的体系搞定了自助审合同、阅卷分析、诉讼可视化、公众号一键排版。1999 元一份 license,每天都有律师过来交流、上课。

亚飞用了一个说法:全栈升级为一个科技公司。
100 份价值,赚 1 块钱
聊到最后,亚飞说他想做一个中国版的黑曜石(Obsidian)。
黑曜石是一个笔记软件,团队只有十几个人,没拿过大额融资,但用户众多、口碑极佳,活得很好。亚飞想做的就是这种:不需要很大的组织规模,但有着海量用户。

为什么呢?因为 AI 在干活、团队收缩了,也不需要大量的服务器资源和 VC 烧钱续命了,现在「也有点像一人公司了」。
「以前你创造 100 份价值,至少得赚 20 块钱才能活下来。但现在你创造 100 份价值,你只需要赚 1 块钱,你就活得很不错。」
OpenClacky 完全开源免费,不需要注册、用自己的 Key 就行。客户端的话,有腾讯云 CDN 加速,国内直接下载安装。
作为结果,目前处理每天 1 万多个五轮以上长任务,比上周翻了一倍。
所以吧:做好国内的 CDN 加速还是很重要的。

作为与 Claude Code 的对比……「你用 Claude Code 总感觉到你是外人,你舔着它用,信用卡搞两下随时封你。」
如果之后 OpenClacky 做成了,现在的那些事儿更能起到帮助,对此亚飞则说到:
「先把 Agent 的内核做扎实,让 Agent 能够经济的跑长任务,这样才有机会长出来。」
地基先做好,房子才有得盖。
OpenClacky 官网:openclacky.com
GitHub(MIT 开源):github.com/clacky-ai/openclacky
技术内幕(7 个工程决策):openclacky.com/docs/tech-deep-dive
横评数据(可复现):openclacky.com/benchmark
青狮龙虾(创作者案例):qingclaw.com