这段时间,我把自己的那只“小龙虾”扒了个底朝天。
起因很简单:我装了 OpenClaw,试了几轮写 PRD、拉竞品、跑日报,体验不差;可一到“真做事”,就开始掉链子——该跟进的不跟进,昨天说过的话今天又忘。
换了好几版 Prompt,换模型、调温度,还是不稳。直到我把它当「可运营的系统」来设计,而不是「更能聊的机器人」,事情才开始成形。
这篇就是我作为产品经理的一些拆解与实践体会:OpenClaw 的价值不在“更聪明”,而在“可被运营”。你把这套运营骨架搭起来,它才像一个靠谱的同事,而不是一阵风的演示品。
为什么“聊得不错”,却“干不稳”?
我踩过两类典型坑:
- 记忆像细沙:对话里你以为它“记住了”,第二天全散了;能记住的又多是零碎边角料,真正影响决策的长期事实反而找不着。
- 状态像雾气:任务今天能跑通,明天卡在一个“等待”里没人拉起;你以为是 Prompt 问题,实际上是“没有可信的状态源”,自动化缺少参照物。
大模型对话的上下文是易变的,会话结束就蒸发;而工作需要“可追溯的事实”和“可重复的流程”。
这不是模型智力的问题,是你没有给它一套像产品系统那样的运营机制。
一张架构图背后的三块拼图:把“自治”拼出来
把 OpenClaw 的自动化骨架拎出来

会看到三件核心部件在配合工作:
A. project_TRACKER:任务追踪系统(真实状态源)
它维护任务的标准状态(Queue / Active / Waiting / Done)、提供标准操作(create / move / assign / complete),并对接 Todoist、Jira、Linear 等。
这里的设计关键不在“接了多少 API”,而在建立唯一可信事实:任何自动化都围绕 tracker 的状态变更来编排。
一些落地建议(来自踩坑后的“血泪”版):
- 把任务做成状态机而不是备注堆砌,状态少而稳,才能驱动可靠的自动化。
- 操作要幂等(多次触发不出事),避免“重复创建、反复提醒”的骚操作。
- 事件要可审计(谁在什么时候把什么从 Active 拉回 Waiting),这决定了你是否能复盘与复现。
B. Heartbeat:定期检查(上下文感知)
默认每 30 分钟运行一次,适合批量巡检、结合主会话上下文做优先级判断。它像运营同学的点名测温——看看哪些活发烧了,哪些活冷下来了。
适用的典型面:
- 批量扫描(邮箱、日历、任务池)
- 需要理解“我们目前在讨论的版本/风险/优先顺序”
- 把“失败”转成“可恢复的状态”(例如 Active → Waiting 并挂上阻塞原因)
不该塞给它的:精确到点的调度。那是 Cron 的活。
C. Cron Jobs:定时任务(精确调度)
关键词是精确时间、独立会话、做完就走。每天 7:00 的日报、固定时刻的竞品快照、单次提醒,都由它承接。为了避免“污染主会话”,Cron 默认在隔离的上下文里执行,这一点在大规模运营时至关重要。
两者怎么协同?Heartbeat 调和停滞,Cron 精准触发,最终都落回 tracker 的状态变化。这样,系统长期不会烂尾,也不会靠“对话记忆”拍脑袋。
三本“手册”:把人、边界、记忆写到磁盘
运营骨架之外,还有三份看似朴素的 .md 文件,决定了“小龙虾”的稳定性与一致性:USER.md / SOUL.md / MEMORY.md。
USER.md:关于“服务的那个人”
这是服务策略的输入:称呼、时区、沟通风格(简洁还是详尽)、决策偏好(数据优先还是直觉优先)、当前最重要的 OKR/项目。它不是“数据仓库”,而是“把体验做对”的最小集合。
实践建议:
- 写稳定信息,少塞日常碎碎念;把后者交给 daily log。
- 把“信息密度”对齐到行动:比如标注“遇到对外发布务必二次确认”。
- 隐私与合规要明确:哪些信息可被哪些会话读取,别让群聊读到个人偏好。
SOUL.md:关于“这只龙虾”的人格与边界
这份文件更像“员工手册”:价值观、风格一致性、授权边界。两句话特别值钱:
- Be genuinely helpful, not performatively helpful.(少表演,多解决)
- Earn trust through competence… be careful with external actions.(外部动作慎重、内部动作大胆)
我会在 SOUL 固化三类稳定策略:
- 可交付标准:先结论再细节,输出结构化,默认给可复制文本/表格/文件。
- 风险策略:对外发布、群聊发言、代替用户表达立场时必须先询问。
- 行动策略:能读就先读,能查就先查,别把“问用户”当捷径。
MEMORY.md + memory/YYYY-MM-DD.md:关于“我们一起经历过什么”
OpenClaw 把记忆的“事实源”落在Markdown 文件上:模型只“记住”写到磁盘里的内容。
- daily log(memory/YYYY-MM-DD.md):日记式、追加写;会话开始会默认加载今天+昨天,保证过程连续性。
- MEMORY.md:精选的长期记忆,只在主私聊加载,规避群聊泄露。
团队写入准则(建议贴墙):
- 长期事实/偏好/术语 → MEMORY.md
- 日常上下文/临时事项/运行日志 → daily log
- 当用户说“记住这个”,让智能体显式写入 memory,不要把“请记住”留在空口。
我还会给 daily log 加一个定期提炼机制:一周一次把关键沉淀挪到 MEMORY.md,避免“日志泥石流”。
从 PM 日常出发:这些场景值得“交给小龙虾”
有了 tracker + Heartbeat + Cron,你不再是“AI 帮我做一件事”,而是“AI 代我运营一个小系统”。这些场景我在团队里跑过,稳定性和价值都不错:
场景 1:需求池自动清点(Heartbeat 主场)
- 每 30 分钟巡检 Jira/Linear/Todoist。
- Active 超过 48 小时无进展 → 转 Waiting 并 @ 责任人。
- Waiting 超过 72 小时 → 拉出阻塞原因清单,抄送相关人。
为什么交给 Heartbeat?需要理解当前版本背景与优先级,且要批量扫。
场景 2:每天 7:00 竞品快照 + 风险雷达(Cron 主场)
- 定时拉取:竞品 changelog / 社媒 / GitHub release;监控关键指标(反馈、Crash、转化)。
- 输出 3 条事实 + 1 个对路线图的可能影响 + 待你拍板的问题。
为什么用 Cron?到点执行、会话隔离、做完就发到指定渠道。
场景 3:版本发布前的自动化前置检查(Cron + tracker)
- 发布前 30 分钟,自动检查 checklist 是否全 Done。
- 未完成项自动建任务并 assign;关键风险未确认则把 tracker 卡在 Waiting。
高风险流程要可审计,tracker 是你的“状态机场”。
场景 4:任务“停滞检测 + 复活”(Heartbeat 的经典价值)
- 每 30 分钟调和,把失败视作“进入 Waiting”,由后续机制拉起。
- 不是一次性 agent,而是持续巡检的运营循环。
加码两个我常用的场景
- OKR 对齐助手(Heartbeat + MEMORY):每周一拉取 OKR 进展,基于 MEMORY.md 的定义对齐术语与口径,自动生成“偏离清单”。
- 安全阈值看护(Cron + Tracker):关键配置或对外动作设阈值,触发时创建阻断任务并要求人工确认,减少“越权式热心”。
把架构落到产品:我抓的 5 个关键点
- 定义唯一的真实状态源:聊天记录不是数据库;tracker 是唯一可信状态,其他都是解释。
- 把上下文感知与精准调度拆开:需要理解/批量/判断 → Heartbeat;到点/一次性/隔离 → Cron。混用只会让两边都不稳定。
- 用 .md 做“可运营的配置面”:USER/SOUL/MEMORY 三件套,可审计、可版本、可迁移,换模型也不丢。
- 给记忆分层与权限:MEMORY.md 仅在主私聊加载。设计“哪些记忆在哪些场景可见”,记忆不是越多越好,而是越安全越好。
- 把失败做成状态,而不是异常:失败 = Waiting;复活 = Heartbeat 调和 + Cron 再触发。系统自然从“一次性 agent”进化为“长期自治”。
额外的“工程化补丁”:稳住你的小龙虾
- 幂等与去重:Cron 可能被重试,操作要保证多次执行不会制造幽灵任务。
- 可观测性:给 Heartbeat/Cron 做执行日志、成功率、SLA 告警;问题可定位,回滚有依据。
- 回放能力:关键动作保留输入/输出快照,支持灰度/回放,别让线上问题重演无门。
- 安全模式:外部动作默认“模拟执行 + 待确认”,确认后再实操。
小步起跑的落地清单
如果你准备把团队的小龙虾养起来,可以从这四步开始:
- 在 tracker 里建 4 态(Queue/Active/Waiting/Done),约定最小的状态迁移规则。
- 写三份 .md 的 MVP:USER(稳定画像)、SOUL(交付/风险/行动策略)、MEMORY(术语与长期事实)。
- 上一条 Heartbeat:需求池巡检 + 停滞转 Waiting + 阻塞清单。
- 上一条 Cron:每天 7:00 的竞品快照与风险雷达,独立会话,定向推送。
稳定跑一周,再迭代。把“记住这个”产品化为写入 memory,把“完成了吗”产品化为状态机,而不是对话里的口头约定。
收束一下:别再问它聪不聪明,问它能不能长期干活
OpenClaw 的“产品味”不在模型本身,而在它把智能体拆成了几种可组合的基建:
- 可审计的身份与边界(SOUL.md)
- 可演进的用户语境(USER.md)
- 可检索、可控的持久记忆(MEMORY + daily log)
- 可运营的自动化循环(tracker + heartbeat + cron)
当这些拼图卡住位置,你的小龙虾就不再是“演示时很能聊”,而是一个能被运营、能被修复、能被复用、能长期交付价值的 AI 同事。我的经验是:把注意力从“更酷的 Prompt”挪到“更稳的系统”,产出、口碑和团队信任,会一起上来。
如果你也在落地 OpenClaw,不妨给自己设个验收问题:这个系统能否在没有人盯的情况下稳定跑满一个月?能做到这点,你就从“做功能”跨进了“做系统”。