10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI编程开发

Claude Agent:长时间运行AI代理编码指南,适用于长期运行 Agents 的有效框架

3小时前 AI编程开发 20 0

在过去几个月深入使用Claude Code的过程中,我发现了一个有趣的现象:当我让Claude执行跨越多个会话的复杂任务时,它总是面临一个共同的困境——上下文窗口切换时的"失忆"问题。

每次新会话启动,代理都需要重新理解项目状态,这导致重复工作、遗漏测试、甚至功能半途而废。直到我读到Anthropic发布的《Effective harnesses for long-running agents》这篇工程文档,我才意识到这个问题有系统的解决方案。

今天我想和你分享这套框架的核心逻辑。

核心问题

想象一个软件项目由轮班工程师负责开发——每当新工程师到岗时,他对前一班发生的一切毫无记忆。

AI代理面临的正是这个问题:当上下文窗口重置时,代理对之前的工作、决策和环境状态一无所知。

这种"失忆"导致了三类典型失败模式:

  • 一次性尝试完成全部:代理试图在一个会话内完成整个应用,结果上下文耗尽,功能半途而废
  • 过早宣布完成:看到某些进展后就声明任务完成,跳过了关键的端到端测试
  • 环境状态混乱:留下有bug、缺少文档或代码不整洁的遗留物

关键洞察是:这不是模型能力问题,而是架构设计问题。

解决方案

Anthropic提出的方案采用分工制的双代理架构,通过外部状态管理和结构化流程,确保长期任务的连贯性。

2.1 初始化代理(Init Agent)

初始化代理在项目启动时运行一次,职责是为整个项目奠定基础。核心工作包括:

  • 分析用户需求,拆分为100+个细粒度的、可测试的功能点
  • 创建核心管理文件(feature_list.json、init.sh、claude-progress.txt)
  • 初始化版本控制和项目结构

init.sh 脚本示例:

#!/bin/bash
# init.sh - 环境初始化脚本

# 安装依赖
npm install

# 启动开发服务器
npm run dev &

# 等待服务器启动
sleep 5

# 基础健康检查
curl -f http://localhost:3000 || exit 1

echo "✅ 开发环境已就绪"

2.2 编码代理(Coding Agent)

编码代理在每个后续会话中运行,负责增量开发单个功能。会话启动时的关键流程:

  1. 运行 pwd 确认工作目录
  2. 读取 claude-progress.txt 了解最近进展
  3. 读取 feature_list.json 查看待完成功能列表
  4. 查看 git log --oneline -20 了解代码历史
  5. 运行 init.sh 启动开发环境
  6. 运行基础功能测试确保环境正常

三大核心文件的运作机制

3.1 功能列表文件(feature_list.json)

这是整个系统的"任务台账",记录所有功能及其完成状态。每个功能包含详细的测试步骤,确保验收标准明确。

结构示例:

{
  "features": [
    {
      "id": "F001",
      "category": "functional",
      "description": "用户可以创建新对话",
      "priority": 1,
      "steps": [
        "导航到主界面",
        "点击'新对话'按钮",
        "验证创建了新对话",
        "检查聊天区域显示欢迎状态",
        "验证对话出现在侧边栏"
      ],
      "passes": false
    },
    {
      "id": "F002",
      "category": "functional",
      "description": "用户可以发送消息并收到AI回复",
      "priority": 2,
      "steps": [
        "在输入框输入消息",
        "点击发送按钮或按回车",
        "验证消息显示在对话中",
        "等待AI回复",
        "验证AI回复正确显示"
      ],
      "passes": false
    }
  ]
}

⚠️ 严格规则:编码代理只能修改 passes 字段(true/false),绝不能删除或修改功能定义和测试步骤。这确保了功能列表的完整性和可审计性。

3.2 进度日志文件(claude-progress.txt)

这是代理之间的"交接笔记",记录每个会话的具体工作内容和决策。

格式示例:

# Claude 开发进度日志

## 2025-12-05 会话 1
- ✅ 初始化项目结构
- ✅ 配置开发环境
- ✅ 实现基础路由

## 2025-12-05 会话 2
- 🔧 修复了登录页面的样式问题
- ✅ 完成用户认证功能 (F001)
- 📝 下一步:实现对话创建功能 (F002)

## 待解决问题
- [ ] 移动端响应式布局需要优化
- [ ] 消息发送需要添加加载状态

这个文件让每个新会话的代理能够快速掌握历史脉络,避免重复工作或遗漏问题。

3.3 版本控制(Git)

每个功能完成后,编码代理必须:

  • 使用描述性的commit message记录变更
  • 确保代码处于可合并状态(无bug、有文档、符合代码规范)
  • 为下一个会话留下清晰的代码历史

核心原则

⚠️ 关键原则:每次会话只开发一个功能

这是解决"一次性尝试完成所有事情"问题的核心策略。具体做法:

  1. 编码代理从 feature_list.json 中选择优先级最高的未完成功能
  2. 完整实现该功能的所有步骤
  3. 使用浏览器自动化工具(如Puppeteer、Selenium)进行端到端测试,验证功能的每个步骤
  4. 只有所有测试步骤都通过,才将 passes 标记为 true
  5. 更新进度日志,创建Git提交,会话结束

这种约束强制了代理的"专注力",避免了多任务并发导致的上下文混乱。

常见问题

问题 初始化代理行为 编码代理行为
过早宣布项目完成 创建详细的功能列表文件 开始时读取功能列表,选择单个功能开发
环境状态混乱 初始化Git仓库和进度文件 开始时读取进度文件和Git日志,运行基础测试
功能标记完成太早 设置功能列表文件自我验证 所有功能通过自动化测试后才标记为"通过"
不知道如何运行应用 编写init.sh脚本 开始时读取init.sh状态恢复

实践清单

初始化代理清单

  • [ ] 分析用户需求,拆分为100+个细粒度功能
  • [ ] 创建 feature_list.json,所有功能初始状态为 "passes": false
  • [ ] 创建 init.sh 启动脚本,包含依赖安装、服务启动、健康检查
  • [ ] 创建 claude-progress.txt 进度文件
  • [ ] 初始化Git仓库并创建首次提交
  • [ ] 记录项目结构和详细的运行方式文档

编码代理清单(每次会话)

会话开始:

  • [ ] 运行 pwd 确认工作目录
  • [ ] 读取 claude-progress.txt 了解最近进展
  • [ ] 读取 feature_list.json 查看待完成功能
  • [ ] 查看 git log --oneline -20 了解代码历史
  • [ ] 运行 init.sh 启动开发环境
  • [ ] 运行基础功能测试

开发阶段:

  • [ ] 每次只选择一个功能开发
  • [ ] 实现功能后进行端到端测试
  • [ ] 使用浏览器自动化工具验证UI功能的每个步骤

会话结束:

  • [ ] 只有测试全部通过才将 passes 设为 true
  • [ ] 更新 claude-progress.txt
  • [ ] 创建描述性的Git提交
  • [ ] 确保代码处于可合并状态(无bug、有文档、整洁)

关键提示词模板

初始化代理提示词

你是一个项目初始化代理。你的任务是:

1. 分析用户的需求,将其拆分为100+个具体的、可测试的功能点
2. 创建 feature_list.json 文件,列出所有功能及测试步骤
3. 创建 init.sh 脚本,用于启动开发环境
4. 创建 claude-progress.txt 进度跟踪文件
5. 初始化 Git 仓库并创建首次提交

请确保每个功能都是独立的、可增量实现的。

编码代理提示词

你是一个编码代理,负责增量开发功能。每次会话请遵循以下流程:

1. 运行 `pwd` 确认工作目录
2. 读取 claude-progress.txt 和 git log 了解当前状态
3. 读取 feature_list.json 选择一个未完成的功能
4. 运行 init.sh 启动开发环境
5. 运行基础测试确保环境正常

开发时:
- 每次只开发一个功能
- 使用浏览器自动化进行端到端测试
- 只有测试通过才将 passes 设为 true

会话结束时:
- 更新 claude-progress.txt
- 创建 Git 提交
- 确保代码处于干净、可合并状态

⚠️ 严禁删除或修改 feature_list.json 中的功能定义!

参考资源

Claude Agent SDK :https://platform.claude.com/docs/en/agent-sdk/overview
自主编码快速入门:https://github.com/anthropics/claude-quickstarts/tree/main/autonomous-coding
声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Claude Agent:长时间运行AI代理编码指南,适用于长期运行 Agents 的有效框架
#Claude Agent #自主编码 
收藏 1
刚刚!阿里 Qwen3-TTS 发布,语音合成能力大幅提升!
ACE:最强上下文引擎 Augment Context Engine,已支持主流的 AI 工具进行集成
推荐阅读
  • Cursor代码生成器中文使用教程,Cursor新手入门完全指南,全网最全面详细的Cursor使用教程
  • Claude Code + Cursor 结合的高阶实战技巧(附Claude Code 官方指南精解)
  • Claude Code完成最后一块拼图,Claude Code支持远程 MCP 服务器,距离干翻Cursor仅一步之遥!
  • 我的最强开发组合:Claude Code 2.0 + GLM-4.6
  • 从零开始玩转MCP:手把手教你使用 MCP Server 快速搭建专属MCP Client
评论 (0)
请登录后发表评论
分类精选
手把手教你用支付宝订阅 Cursor Pro:国内用户最全开通教程(附取消自动扣费)
16558 5月前
学生党0元白嫖!手把手教你解锁Cursor Pro年VIP,超详细申请教程(附避坑指南)
11895 7月前
Cursor 0.46更新,新增支持Claude 3.7 + GPT 4.5,Cursor Pro 无限续杯攻略,全自动化工具使用说明
11724 9月前
Claude Code Rules:claude.md文件配置完全指南
11370 4月前
Claude Code 官方已支持Windows系统!手把手教你免费安装使用Claude Code
10769 4月前
Claude Code + MCP 实战教程:手把手教你如何在Claude Code里面使用MCP
10258 4月前
Cursor代码生成器中文使用教程,Cursor新手入门完全指南,全网最全面详细的Cursor使用教程
10195 11月前
手把手教你在VS Code & Cline/RooCode 中使用Kimi K2 模型,配置实录+开发实战体验
7861 4月前
手把手教你在Claude Code 中使用Kimi K2 模型,超简单配置教程分享
7812 4月前
Cursor新手3分钟快速搞懂 Ask/Manual/Agent 三种模式及高级技巧
7205 6月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 ACE:最强上下文引擎 Augment Context Engine,已支持主流的 AI 工具进行集成
2 Claude Agent:长时间运行AI代理编码指南,适用于长期运行 Agents 的有效框架
3 Claude-Mem:通过持久内存压缩系统,让 Claude 真正记住并复用长期上下文
4 cc-switch:Claude Code 环境变量快速切换工具
5 Claude用不起?最强平替 GLM-4.6 全平台编程开发接入实战教程
6 黑五特惠GLM-4.6,教你如何配置 Claude Code 套餐的图像分析、视频理解、联网搜索等MCP
7 从零开始的Claude Skill实操指南:10分钟对话搞定你的第一个自定义Skill
8 GLM-4.6 黑五Coding套餐,折上折!支持 Claude Code、Cline、OpenCode、Roo 代码等
9 Spec Kit 实战指南:用规范驱动开发告别 Prompt 工程难题
10 Cursor封号?claude-4.5用不了?替代方案新选择,Verdent AI深度使用指南
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联