本来是想让 AI 干活,结果却变成了我在盯着它干活
写一段停一下,要我催;报错卡住,要我看;聊久了上下文一满,它就开始失忆
工具没有变差,但人却越来越累
问题到底出在哪?
最近读了 的一篇文章,慢慢想明白一件事:

文中核心思想是:建立一套标准的交接班机制
所以不是 AI 不够强,而是我们没有给它一套靠谱的工作方式
现在有了 OpenClaw 这个Agent的加持,于是我用OpenClaw + Claude Code把这套方法跑了一遍
结果欣喜:我不再需要盯着 AI 了
一、为什么 AI 写代码,总是需要你盯着?
如果你做过 AI Coding,这些情况大概率遇到过:
-
能写复杂项目,但离不开人
-
写到一半停住,需要你继续对话
-
报错卡住,要你接管
-
上下文一长,就开始乱说
这些问题看起来像模型能力不够,其实更像工作方式不对
AI 是一段一段工作的,每一轮对话都是新的开始
可软件开发是连续推进的,需要上下文、状态,还有明确的进度
这两种节奏放在一起,自然会冲突
那怎么解决?这个问题,正是 Anthropic 在那篇文章里想处理的
二、Anthropic 的思路:把 AI 当工程团队来用
他们用了一个很形象的比喻
把 AI 当成“轮班的工程师”,每一轮都是新人接手,但这个人没有记忆,只能靠留下来的信息继续干活
这样一来,重点就变成:
不是让 AI 一次做完,而是让它一段一段接着做
他们把这件事拆成两个角色
初始化 Agent
只在最开始出现,用来把环境搭好

它会做这些事情:
-
写一个
init.sh,保证项目能启动 -
建一个
claude-progress.txt,记录过程 -
初始化 Git
-
生成一个
feature_list.json
比如:
{
"category": "functional",
"description": "Markdown 编辑器支持实时预览",
"steps": [
"输入 Markdown 文本",
"右侧实时渲染 HTML",
"样式与公众号排版一致"
],
"passes": false
}
所有功能都被拆开,每一条都可以验证,而且默认都是未完成。
这样一来,项目就有了一条清晰的“任务主线”。
编码 Agent
后面的每一轮 AI,只推进一件小事
它会先看:
-
进度文件
-
Git 记录
-
任务清单
然后选一个还没完成的功能去做。
做完之后,它会:
-
自测
-
更新状态
-
提交代码
-
写一段进度说明
然后结束这一轮。
这里有一个很关键的点: 每次只做一个任务。
任务越小,越不容易出问题。
三、我把这套方法用在了开发上
我把这套机制直接丢给 Claude Code(并且接入智谱最新的 GLM-5-Turbo),做了一个实际项目

项目换成了一个更贴近内容创作者的工具:
易微编辑器(一个基于 Markdown 的微信公众号文章编辑器)
一开始,我和它反复对齐需求,比如:
-
Markdown → 微信排版渲染
-
一键复制到公众号
-
样式主题切换
-
图片处理和排版
需求清楚之后,它开始自己展开
先是生成完整的需求文档,然后是开发计划。再往下,它把所有功能拆进 feature_list.json。
当这些任务被列出来时,其实已经很像一个在运转的小团队了。
四、问题还剩最后一步
流程已经很顺了,但有个地方还是卡住。
每完成一个任务,我还是要手动按回车,让它继续。
这个动作不复杂,但它决定了流程能不能继续往下走。
所以问题变成:
👉 能不能连“推进流程”这件事也自动化?
五、用 OpenClaw 监工
这一步我交给了 OpenClaw
它不写代码,只做调度
我做了两件事
一件是把整套规则喂给它,让它理解任务结构
另一件是给它一个很简单的循环逻辑:
while true; do
check_feature_status
if done; then
trigger_claude_next_task
fi
sleep 300
done
并设置心跳它每隔 5 分钟检查一次任务状态
只要发现当前任务完成,就自动唤醒 Claude Code,继续执行下一个
整个过程不需要人工参与
六、真正的变化,从这里开始
这一步跑通之后,体验明显变了
我不再需要盯着 AI:
-
不用催它继续
-
不用接着上下文
-
不用担心它卡住
整个系统开始自己往前推进。
再回头看,会发现一个变化:
AI 不再只是工具,而像一个有流程、有节奏的团队。
每个环节都有明确职责,事情自然往前走。
七、几个我自己踩过的关键点
这套流程跑下来,有几个地方特别关键
feature_list 用 JSON,会更稳定,AI 不太会乱改结构。
进度文件和 Git 记录不能省,每一轮都是“重新开始”,没有这些信息,AI 只能猜
还有一个常见问题是,AI 很容易觉得“差不多完成了”,如果没有任务清单,它真的会停
测试也一样。如果只是简单验证,很容易漏问题。尽量用接近真实用户的方式去测试,效果会更好。
总结
这次实践下来,我的一个感觉很清楚
AI 的问题,很多时候不是能力,而是“怎么用”
以前更像是在写 prompt,希望一次搞定。现在更像是在搭系统,把问题拆开,让 AI 一步一步推进。
换个角度看:
-
prompt 是输入
-
workflow 才是生产方式
当任务拆解、进度记录、流程调度都交给 AI 之后,人就可以退出来了。
最后
体验下来,智谱这次发布的专门针对OpeClaw龙虾增强模型 GLM-5-Turbo在Agent上的能力非常强
目前GLM-5-Turbo在Coding Plan Max 套餐已支持,Pro 预计3月底支持,Lite 预计4月内支持,年付限时8折!

官方又送了我7张周体验卡

