在深度使用Claude Code的过程中,我一直在思考一个问题:为什么有些AI应用能够持续进化,而大多数Agent最终沦为"聪慧但无知"的工具?
Anthropic最近的一次技术复盘给了我启发,问题的关键不在于造更多的Agent,而在于如何让Agent获得专业知识的能力。这个观点值得深入讨论。
一、Agent通用性陷阱
早期的Agent设计遵循了一个朴素的逻辑——既然底层模型足够强大,那么不同领域的Agent应该本质相通。财务分析、数据处理、流程自动化,理论上都能通过编码能力统一解决。
这个假设的确在某些场景中成立。一个能力足够的Coding Agent可以作为"数字世界的通用接口",处理结构化的技术任务。但这种通用性带来了隐藏的成本:
- 领域专业度缺失:税务申报不同于一般的数据处理。它需要的不是IMO数学金牌得主的聪慧,而是有15年从业经验的会计师的专业判断
- 知识积累机制缺陷:当前Agent缺乏有效的专业知识吸收和持续学习机制,每次交互都像在和"天才新手"合作
- 可靠性与可控性矛盾:通用Agent往往需要更多的人工引导和验证,反而降低了实际工作效率
二、Skills范式:将知识显式化
Anthropic的解决方案是引入Skills——一套将领域知识、工具和资源显式管理的框架。
Skills的核心构成:
| 组件 | 说明 | 实例 |
| 任务说明(skill.md) | 用自然语言定义Skill的目的、边界和最佳实践 | 财务报表生成Skill的规范化模板 |
| 脚本工具 | 实现具体功能的可执行代码 | 税务计算、数据验证脚本 |
| 专业知识库 | 领域特定的规则、案例、参考资料 | 最新税法条款、常见错误案例库 |
| 素材资源 | 模板、样本、依赖配置 | 报表模板、API密钥、依赖声明 |
设计哲学的简洁性:Skills采用文件夹作为基本单位,而非复杂的框架或专有格式。这意味着:
- 可用Git进行版本控制和协作
- 支持云盘直接共享和团队分发
- 天然兼容现有的软件工程工具链
三、上下文窗口的智能管理
Skills能够支持Agent挂载数百个能力的核心机制在于渐进式的上下文加载:
运行时策略:
- 元数据层暴露:运行时仅向Agent展示Skill的索引和摘要("你有报税、工资核算、合规审计三个能力")
- 按需加载:当Agent选定某个Skill时,才将完整的规则、代码和案例加载到上下文
- 可组合性:多个Skill可在同一工作流中灵活组织
这种设计突破了传统Agent的"上下文天花板"限制,使其能够胜任更复杂的多步骤任务。
四、早期生态信号
自Skills框架发布以来,生态的响应超出预期:
- 数量增长:几周内积累了数千个社区贡献的Skills
- 参与者多元化:不仅技术团队,财务、法务、招聘等非技术岗位也开始编写Skill来扩展Agent的领域能力
- 实际案例:
- 财务团队:构建报税、审计合规Skill,将内部规范编码化
- 法务部门:创建合同审查、条款标准化Skill,确保法律一致性
- 招聘团队:开发候选人筛选、面试反馈Skill,提升招聘效率
五、Skills与MCP的关系定位
在Agent生态中,Skills和MCP(Model Context Protocol)并非替代关系,而是互补的两个维度:
| 维度 | Skills | MCP |
| 核心职责 | 封装专业知识与领域规范 | 连接外部系统与数据源 |
| 作用层级 | 应用层(知识与方法) | 集成层(系统互联) |
| 典型用途 | 将行业最佳实践编码化 | 实时获取数据库、API、第三方服务 |
实际工作流示例:
一个企业财务Agent处理月度报表时:
- 通过MCP连接ERP系统和数据库,获取原始交易数据
- 调用"财务报表生成"Skill,应用内部会计准则和合规规范
- 通过MCP将最终报表推送到档案系统
开发者已经开始用这种组合模式编排复杂的多工具工作流,而非简单的单点集成。
六、未来方向:将Skills视为软件制品
Anthropic的设想是将Skills纳入成熟的软件工程管理范畴:
需要引入的工程实践:
- 测试与评估体系:为Skill设计单元测试、集成测试、性能基准
- 版本控制:语义化版本管理,向后兼容性声明
- 依赖管理:显式声明Skill所需的模型能力、外部工具、数据依赖
- 文档标准化:API文档、使用场景、限制条件的规范化表述
迁移学习的新可能:
当Claude自身开始创建和优化Skill时,学习过程变得可迁移——你编写的专业知识Skill不仅当前版本能用,未来版本也能直接继承和改进。这打破了传统AI应用中"版本升级即重新适配"的循环。
七、分层架构的理想模型
Anthropic提出了一个清晰的分层类比:
| 层级 | 角色定位 | 参与者规模 |
| 处理器层 | 基础模型能力 | 少数(Anthropic、OpenAI等) |
| 操作系统层 | Agent运行时环境 | 少数(框架维护者) |
| 应用层 | Skills——专业知识编码化 | 数百万开发者和领域专家 |
这个架构的优势在于:应用层的繁荣不依赖于底层的创新,而是鼓励来自各行业的专业知识沉淀。企业会计可以写出比算法工程师更好的财税Skill。
总结
从我使用Claude Code的经验来看,这个范式转变具有深刻的意义。Agent元年的教训很清楚:通用聪慧无法替代专业深度。Skills框架的出现,本质上是在回答一个古老的问题——如何让AI系统真正"学会"特定领域的做事方式。
与其继续堆砌新的Agent,不如投入精力将你的专业知识结构化为可复用的Skill。这不仅提升了当前系统的可靠性,也为AI应用的长期演进奠定了基础。
未来的竞争不在于谁的Agent更聪明,而在于谁能积累更丰富、更精良的Skills生态。从这个角度看,Agent时代的下半场,才刚刚开始。