当前位置：首页 » 苏米杂谈

如何让AI系统真正学会特定领域的做事方式，Agent的下半场是Skill

3月前苏米杂谈 802 0

在深度使用Claude Code的过程中，我一直在思考一个问题：为什么有些AI应用能够持续进化，而大多数Agent最终沦为"聪慧但无知"的工具？

Anthropic最近的一次技术复盘给了我启发，问题的关键不在于造更多的Agent，而在于如何让Agent获得专业知识的能力。这个观点值得深入讨论。

一、Agent通用性陷阱

早期的Agent设计遵循了一个朴素的逻辑——既然底层模型足够强大，那么不同领域的Agent应该本质相通。财务分析、数据处理、流程自动化，理论上都能通过编码能力统一解决。

这个假设的确在某些场景中成立。一个能力足够的Coding Agent可以作为"数字世界的通用接口"，处理结构化的技术任务。但这种通用性带来了隐藏的成本：

领域专业度缺失：税务申报不同于一般的数据处理。它需要的不是IMO数学金牌得主的聪慧，而是有15年从业经验的会计师的专业判断
知识积累机制缺陷：当前Agent缺乏有效的专业知识吸收和持续学习机制，每次交互都像在和"天才新手"合作
可靠性与可控性矛盾：通用Agent往往需要更多的人工引导和验证，反而降低了实际工作效率

二、Skills范式：将知识显式化

Anthropic的解决方案是引入Skills——一套将领域知识、工具和资源显式管理的框架。

Skills的核心构成：

组件	说明	实例
任务说明（skill.md）	用自然语言定义Skill的目的、边界和最佳实践	财务报表生成Skill的规范化模板
脚本工具	实现具体功能的可执行代码	税务计算、数据验证脚本
专业知识库	领域特定的规则、案例、参考资料	最新税法条款、常见错误案例库
素材资源	模板、样本、依赖配置	报表模板、API密钥、依赖声明

设计哲学的简洁性：Skills采用文件夹作为基本单位，而非复杂的框架或专有格式。这意味着：

可用Git进行版本控制和协作
支持云盘直接共享和团队分发
天然兼容现有的软件工程工具链

三、上下文窗口的智能管理

Skills能够支持Agent挂载数百个能力的核心机制在于渐进式的上下文加载：

运行时策略：

元数据层暴露：运行时仅向Agent展示Skill的索引和摘要（"你有报税、工资核算、合规审计三个能力"）
按需加载：当Agent选定某个Skill时，才将完整的规则、代码和案例加载到上下文
可组合性：多个Skill可在同一工作流中灵活组织

这种设计突破了传统Agent的"上下文天花板"限制，使其能够胜任更复杂的多步骤任务。

四、早期生态信号

自Skills框架发布以来，生态的响应超出预期：

数量增长：几周内积累了数千个社区贡献的Skills
参与者多元化：不仅技术团队，财务、法务、招聘等非技术岗位也开始编写Skill来扩展Agent的领域能力
实际案例：
- 财务团队：构建报税、审计合规Skill，将内部规范编码化
- 法务部门：创建合同审查、条款标准化Skill，确保法律一致性
- 招聘团队：开发候选人筛选、面试反馈Skill，提升招聘效率

五、Skills与MCP的关系定位

在Agent生态中，Skills和MCP（Model Context Protocol）并非替代关系，而是互补的两个维度：

维度	Skills	MCP
核心职责	封装专业知识与领域规范	连接外部系统与数据源
作用层级	应用层（知识与方法）	集成层（系统互联）
典型用途	将行业最佳实践编码化	实时获取数据库、API、第三方服务

实际工作流示例：

一个企业财务Agent处理月度报表时：

通过MCP连接ERP系统和数据库，获取原始交易数据

调用"财务报表生成"Skill，应用内部会计准则和合规规范

通过MCP将最终报表推送到档案系统

开发者已经开始用这种组合模式编排复杂的多工具工作流，而非简单的单点集成。

六、未来方向：将Skills视为软件制品

Anthropic的设想是将Skills纳入成熟的软件工程管理范畴：

需要引入的工程实践：

测试与评估体系：为Skill设计单元测试、集成测试、性能基准
版本控制：语义化版本管理，向后兼容性声明
依赖管理：显式声明Skill所需的模型能力、外部工具、数据依赖
文档标准化：API文档、使用场景、限制条件的规范化表述

迁移学习的新可能：

当Claude自身开始创建和优化Skill时，学习过程变得可迁移——你编写的专业知识Skill不仅当前版本能用，未来版本也能直接继承和改进。这打破了传统AI应用中"版本升级即重新适配"的循环。

七、分层架构的理想模型

Anthropic提出了一个清晰的分层类比：

层级	角色定位	参与者规模
处理器层	基础模型能力	少数（Anthropic、OpenAI等）
操作系统层	Agent运行时环境	少数（框架维护者）
应用层	Skills——专业知识编码化	数百万开发者和领域专家

这个架构的优势在于：应用层的繁荣不依赖于底层的创新，而是鼓励来自各行业的专业知识沉淀。企业会计可以写出比算法工程师更好的财税Skill。

总结

从我使用Claude Code的经验来看，这个范式转变具有深刻的意义。Agent元年的教训很清楚：通用聪慧无法替代专业深度。Skills框架的出现，本质上是在回答一个古老的问题——如何让AI系统真正"学会"特定领域的做事方式。

与其继续堆砌新的Agent，不如投入精力将你的专业知识结构化为可复用的Skill。这不仅提升了当前系统的可靠性，也为AI应用的长期演进奠定了基础。

未来的竞争不在于谁的Agent更聪明，而在于谁能积累更丰富、更精良的Skills生态。从这个角度看，Agent时代的下半场，才刚刚开始。

声明：本站原创文章文字版权归本站所有，转载务必注明作者和出处；本站转载文章仅仅代表原作者观点，不代表本站立场，图文版权归原作者所有。如有侵权，请联系我们删除。

未经允许不得转载：如何让AI系统真正学会特定领域的做事方式，Agent的下半场是Skill

请登录后发表评论