当前位置：首页 » AI智能体

OpenClacky 李亚飞：Agent 的下半场是账单，省钱才是硬道理

1月前 AI智能体 368 0

交流一二：

让 AI 来管理代码的话，每次读 500 行反而比读 1000 行更费 Token，而且人工编排流程真不如让大模型自己定，「很多事儿，还是很反直觉的」
以前做生意，创造 100 份价值得赚 20 块钱才活得下来，现在赚 1 块钱就够了，「因为 AI 在干活，这并不消耗人力」
一个不写代码的律师，用 OpenClacky 一个人搞定了合同审查、阅卷分析、诉讼可视化等等一系列功能，定价 1999 元，「每天都有律师来找他买」

以上内容，来自我和 OpenClacky 创始人李亚飞的一次对话。

OpenClacky 是一个以省钱为核心优势的开源 AI Agent，对 Claude、DeepSeek、GPT、Kimi、MiniMax 等十几套模型 API 逐一做了响应格式和调用链的适配优化。

至于省钱的奥秘：上下文调优，以及 90% 的 Cache 命中率。

作为结果，比 OpenClaw 省 50%，更只有 Hermes 的 1/6。

李亚飞是 OpenClacky 的创始人，10 年全栈工程师经验。这个项目拿到了包括奇绩、真格、盈动、Variable、红杉中国、高瓴的投资。

四次下注

亚飞在 OpenClacky 之前做过三个产品，每一个都是对行业的重新下注，每一次都比上一次更往深处走一层。

ShowMeBug，2019 年启动，做技术面试和编程测评，做到了行业 TOP。支持 20+ 语言，几十个框架，秒级启动，也给团队带来了一个副产品：云端 IDE 的全栈自研能力。

1024Code，2023 年启动，比 Devin 早半年，也是在国内做出了第一个自主决策链 AI Agent。当时 AutoGPT 刚出来，他们的平台已经能一键托管 AutoGPT 了。但那时候 AI 写个稳定的贪吃蛇都做不到，他很清楚市场没到。后来想明白一件事：1024Code 还是在「帮程序员写代码」的框架里，而程序员的人群是窄的。关掉了。

Clacky.ai，2024 年 4 月立项。让不会写代码的人用一句话生出一个能跑、能收钱的全栈应用。有数据库、有中间件、有部署，一条龙。全团队干了一年多，有一批铁杆用户。

但到了去年 12 月，两个现实压过来了。第一，海外运营成本太高，云端并发 10 万级非常烧钱。第二，Agent 架构已经稳定了，Skill 加 Harness 工程这个模式可能好几年都不会变。

于是有了第四个产品——

他把 Clacky 前面加了个 Open，就有了开源的 OpenClacky。

读 500 行代码，比读 1000 行更贵

这是一个非常反直觉的现象。做 coding agent 的时候，最吃 Token 的是读大文件。一个 5000 行的代码文件，塞进去可能 5 万到 10 万 Token。很自然地会想到先做个预处理，用语法解析器把密度降一下，或者只读前 200 行、300 行。

他们试了，大多数情况下无效，反而更贵。

你不知道 AI 这次读这个文件是想干嘛。你做的程序是死板的，再怎么优化也不如大模型自己来看。你给它一份只包含几个关键函数的摘要，AI 一看：我为什么只拿到这几个函数？我还得看所有的信息。然后它又去读一遍完整文件。虽然看着省了一次 Token，实际上多了两次调用。

也正是这个优化思路，让 OpenClacky 的请求数量，显著低于其他框架。

他们反复试了 200 行、300 行、500 行、800 行、1000 行。最后发现 1000 行是最优解。一次读 1000 行大约 1 万到 1.5 万 Token，看上去不便宜，但大多数时候够 AI 翻一翻就找到它要的东西了。500 行的成本反而翻一倍。

「这些东西就是慢慢测出来的，工程上没有捷径。」

下半场是账单

对于亚飞来说，他去年的 Agent 账单，一个月稳定在 1500 到 2400 美金，今年随着模型价格的暴涨，费用开始水涨船高，最近半年差不多有 3000-4000 美金了。

模型能力到了，接下来大家的瓶颈就是账单了。去年底到现在，中国已经出了几个真正能打的 agentic 模型。但你要真用，成本还是很高。

OpenClacky 有个 V2EX 的用户，用过所有热门 Agent，Claude Code、OpenClaw、Hermes、Codex 全试过。切到 OpenClacky，Token 消耗少了 8 倍。

对此，亚飞他们 4 月底花一周时间做了一次正式横评，把这四个 Agent 拎了出来进行测试：同模型、同 prompt、同 skill、独立 OpenRouter Key。

我问：你们这东西，跟 Claude Code 差距在哪？

亚飞直言：Claude Code 的 Cache 命中率 95.2%，比 Clacky 的 90.6% 好很多。毕竟 Claude Code 是 Anthropic 自家做的，从底层就懂自己的模型。但 OpenClacky 的请求数更少，51 个 vs 70 个，总账单基本打平。

OpenClacky 1.0.1 版本，实际使用中已经做到接近 100% 的 Cache 命中率。

只有 16 个工具

在 OpenClacky 里，一共有 16 个核心工具。作为对比，Claude Code 有 40+ 个，OpenClaw 有 23 个，Hermes 有 52 个。

是因为有一个叫 invoke_skill 的元工具，所有复杂能力全部 Skill 化。

工具越少，schema 越短，Agent 判断越准。每一次模型调用都要把所有工具描述塞进上下文，工具数量直接影响基础开销。这是请求数能压到 51 的核心原因。

渐进式安装也是他反复讲的一个设计。很多国产 Agent 一键安装，安完之后发现啥功能都没有。海外的那些开源 Agent 能力强，但安装就要死要活。他们的做法是只有用到某个依赖的时候才会帮你装。读 PDF、OCR 这些场景，第一次用到它才安装对应的依赖包。

一个律师，一个人

聊到 Skill 创作者生态，李亚飞给我看了一个案例：青狮龙虾。

qingclaw.com，做的人本身是一个律师，网站用 OpenClacky 开发，微信支付，完全国产。律师朋友付了钱，钱打到他自己的账户，然后他调 OpenClacky 的接口自动开通 license。

他一个人，用 OpenClacky 的体系搞定了自助审合同、阅卷分析、诉讼可视化、公众号一键排版。1999 元一份 license，每天都有律师过来交流、上课。

亚飞用了一个说法：全栈升级为一个科技公司。

100 份价值，赚 1 块钱

聊到最后，亚飞说他想做一个中国版的黑曜石（Obsidian）。

黑曜石是一个笔记软件，团队只有十几个人，没拿过大额融资，但用户众多、口碑极佳，活得很好。亚飞想做的就是这种：不需要很大的组织规模，但有着海量用户。

为什么呢？因为 AI 在干活、团队收缩了，也不需要大量的服务器资源和 VC 烧钱续命了，现在「也有点像一人公司了」。

「以前你创造 100 份价值，至少得赚 20 块钱才能活下来。但现在你创造 100 份价值，你只需要赚 1 块钱，你就活得很不错。」

OpenClacky 完全开源免费，不需要注册、用自己的 Key 就行。客户端的话，有腾讯云 CDN 加速，国内直接下载安装。

作为结果，目前处理每天 1 万多个五轮以上长任务，比上周翻了一倍。

所以吧：做好国内的 CDN 加速还是很重要的。

作为与 Claude Code 的对比……「你用 Claude Code 总感觉到你是外人，你舔着它用，信用卡搞两下随时封你。」

如果之后 OpenClacky 做成了，现在的那些事儿更能起到帮助，对此亚飞则说到：

「先把 Agent 的内核做扎实，让 Agent 能够经济的跑长任务，这样才有机会长出来。」

地基先做好，房子才有得盖。

OpenClacky 官网：openclacky.com
GitHub（MIT 开源）：github.com/clacky-ai/openclacky
技术内幕（7 个工程决策）：openclacky.com/docs/tech-deep-dive
横评数据（可复现）：openclacky.com/benchmark
青狮龙虾（创作者案例）：qingclaw.com

声明：本站原创文章文字版权归本站所有，转载务必注明作者和出处；本站转载文章仅仅代表原作者观点，不代表本站立场，图文版权归原作者所有。如有侵权，请联系我们删除。

未经允许不得转载：OpenClacky 李亚飞：Agent 的下半场是账单，省钱才是硬道理

请登录后发表评论