开篇思考
Claude Skills 的价值仍然被严重低估。
一个设计良好的 Skill,所带来的智能能力足以匹敌,甚至超越完整的 AI 产品。更关键的是:任何人都能自己开发 Skill,不需要技术背景。
以我的 Article-Copilot 为例,只用一个 Skill,我就搭建了一个能从素材处理到实际写作全流程运行的 Agent 应用。
在深入研读 Anthropic 官方技术博客,并对 Agent Skills 做了系统性实验之后,我整理出这份自认为最完整的 Skill 指南,涵盖:

- 最通俗易懂的 Skills 概念与原理解释
- 对 Skills 的真实价值、技术优势与对 AI 产品设计影响的讨论
- 使用与开发 Skills 的完整教程
- 如何识别适合使用 Skills 的场景
从概念厘清到工作机理,从上手教程到实际应用,我会一步步带你走完。
第一部分:什么是 Skills?从起源到运行原理
2025 年 10 月中旬,Anthropic 正式发布了 Claude Skills。
两个月后,Agent Skills 作为开放标准进一步发布,旨在构建全新的 AI Agent 开发生态。

OpenAI、GitHub、VS Code 和 Cursor 随即跟进。

更好地理解它的话,可以把 Skills 想成「通用 Agent 的扩展包」:
一个 Agent 可以加载不同的 Skills 包,从而获得不同的垂直知识、工具使用能力,并可靠地完成特定任务。
最常见的问题是:这和 MCP 有什么不同?
- MCP 是一个开放标准协议,关注的是 AI 如何以统一方式调用外部工具、数据与服务;它不定义任务逻辑或执行流程。
- Skills 则是在教一个 Agent 如何端到端完成特定工作。它把执行方法、工具调用范式以及相关知识材料打包成完整的「能力扩展包」,让 Agent 具备稳定、可复用的完成路径。
以下是 Anthropic 官方的一些 Skill 示例:
- PDF:包含 PDF 合并、拆分和文本抽取的代码脚本。教会 Agent 如何处理 PDF 文件、抽取文本、创建新 PDF、以及合并或拆分文档。
- Brand-guidelines:包含品牌设计规范和 logo 资源。Agent 在设计网站或海报时,能参考这些设计资源并自动遵循企业设计标准。
- Skill-Creator:把创建 Skills 的方法打包成一个元 Skill,让 AI 主动发起 Skill 创建流程,引导用户产出符合需求的高质量 Skills。
Skill-Creator:教 Agent 如何帮助用户创造新的 Agent 能力
但 Skills 的价值天花板远不止于此。
把它视作一个从垂直 Agent 到 AI 产品开发的通用范式:你可以借力一个通用 Agent 核心,以近乎零门槛的方式,打造具备通用智能上限的垂直 Agent 应用。
先从 Skills 的工作方式说起。
先说,应该如何理解 Skills?
Anthropic 这样定义:
Skills 是扩展 Agent 功能的模块化能力。每个 Skill 打包了 LLM 指令、metadata 以及可选资源(scripts、templates 等),Agent 会在需要时自动使用它们。
我有个更直观的比喻:Skills 就像是给 Agent 准备的一份「工作交接包」。
想象你要把一项任务交接给新同事。如果不能面对面教,只能靠文档(并且你想一次性交接清楚,后面不被打扰),你会准备什么?
- 任务执行 SOP 和必要背景知识(大概该怎么做)
- 工具使用说明(用什么软件、如何操作)
- 需要的模板与材料(历史案例、格式标准)
- 可能的问题、规范与解法(补充细则与指导)
Skill 的设计架构,本质上就是这份交接包的数字化版本:

一个相对标准的 Skill 结构示例。在实际场景中,仅 SKILL.md 为必需;其他结构可选。
在一个 Skill 里,instruction 文档提供灵活指导,code 负责可靠调用,resources 用于事实检索与参考。
当 Agent 运行一个 Skill 时,它会:
- 以 SKILL.md 作为主要指南
- 根据任务情境,判断何时调用 code scripts、参考 documentation 或使用 asset resources
- 通过「计划-执行-观察」交替反馈循环完成任务目标
当然,Skills 也可以扩展 Agent 的 tool 与 MCP 使用边界。通过文档与脚本,你可以教 Agent 连接并使用特定的外部工具与 MCP 服务。
这是一个 PPTX Skill 的文件目录示例:

- 整个文件夹是支持 AI 创建、编辑、分析 PowerPoint 演示文稿的完整能力包。
- 核心文件是 SKILL.md,包含 skill 的 metadata 与任务指导,告诉 agent 在何时使用这个 skill、以及如何逐步处理任务。
- 需要注意的是,经常会把相对独立的子技能拆分到子文档(例如 html2pptx.md 教 AI 如何把 html 导出为 pptx),以避免一次性加载过长的 skill 文档,从而节省 Context Window 空间。
- scripts/ 下包含可供 Agent 使用的各种预写程序脚本,例如一键将 html 转换为 pptx 的脚本。这样 Agent 在运行任务时不必临时开发工具,直接调用就好,既省 token,又避免错误,并提升速度。
- 另有一些参考文档(这个项目的打包不算完全标准,但基于 SKILL.md,Agent 依然能理解可参考哪些文档),例如 ooxml.md,是 ooxml 格式文件的解析指南。
整个 Skill 以简洁形式,把能力指导文档、代码脚本、参考文档和可用资源组合起来,有方向地扩展 Agent 在 pptx 生成方面的工作能力。
Skills 的真实价值:垂直 Agent 的未来形态
我看好 Skills 的价值与未来生态,是因为 Skills 和其他 AI 应用开发方式,从底层机制上就不同:
人类提供专业知识与工具方法;通用 Agent 提供智能、自治理解与主动执行。
直白点说:人给出指导,最终由 Agent 凭智能执行。
而且「Agent + 文件」的形态足够通用。
这带来了相较于前辈(Workflows 和代码式 AI 应用)三个关键优势:
- 非技术人员可零代码、用自然语言编写
- 能突破预设限制,灵活响应用户输入,处理边界情况
- 多个 Skills 还可自由组合,应用方式极度灵活
这一节可能略深,但有完整例子其实不难理解。尽管这些是我的个人判断,但应该能帮助你把握 Skill 价值与 Agent 开发趋势。
1. 零代码、用自然语言,写出真的聪明的 Agents
回看此前的 AI 应用开发方式:
- 代码式开发不必多说,需要理解程序逻辑与技术实现。
- 即便是近来流行的 Workflow 平台(如 Coze、Dify、N8N),你仍需要理解节点配置、条件分支——其实还是「编程」,只是界面更友好。
而 Skills 的创作门槛完全不同:入门门槛低,智能上限高。
以 Anthropic 的 brand-guidelines skill 为最简单的例子:
只需要一个 SKILL.md,且完全用自然语言撰写。

- Metadata:何时使用该 Skill
- Body:品牌色、字体等的文字描述
但仅此就足以把 Agent 引导为遵循 Anthropic 品牌设计的垂直 Agent,可用于品牌网站、海报、PPT 设计。
当你要设计一个遵循 Anthropic 设计标准的 AI 搜索网站时,Agent 会自动运行这个 Skill。
Skills 有两种加载模式:explicit / implicit。
前者由用户查询直接指定;后者由 LLM 基于任务与 metadata 描述的相关性自动匹配触发。
下面这个网站就是由该 skill agent 一次性开发完成,样式接近 Claude 官方网站设计:


对于更复杂的案例,你可以参考其他官方示例,比如制作 PPT。
这些案例基本验证:仅用 Skill + Agent 构建的垂直 Agent 所达成的智能效果,可与同类 AI 产品持平,甚至超越。
而制作这些垂直 Agent,不需要写任何程序代码。
非技术的领域专家,只差一层纸就能做出自己的专业 Agent。
把你的专业经验与工作流程写清楚成文档,Agent 就能照着执行。
2. 突破预设限制,灵活处理真实场景
这个优势常被忽视。
Workflows 或传统程序的核心问题在于:它们假定所有情况都能预设。
比如,一个基于用户记忆的 AI 个性化助手,通常需要预先定义:
- 用户导入记忆文件的入口
- 支持上传的文件格式
- 数据应该包含哪些字段
- 以及可能出现的特殊情况与处理方式
但现实往往是:
- 你需要教用户到哪儿点击「导入」
- 用户只有预期外格式:你只支持 md,但他只有 doc
- 数据字段不匹配:你期望每个文件有标题,但用户文件没有标题
- 或者出现预设之外的边界情况

此时,Workflows 或传统程序就卡住了。它们只能沿预设路径执行,遇到意外就报错,或要求用户自行补洞。
但通用 Agent + Skill 的应用完全不同:
- 能在统一对话框接收各种用户数据(文本、文件、图片)
- 能自主调用其他 Skills,或临时写一个 doc2md 脚本,自动转换用户格式
- 能为每个文件抽取并补充标题,完成数据摄取
- 能基于 LLM 推理智能桥接各种边缘问题
用 Skills 打造的垂直 Agent,在 Skills 的知识与方法指导下,可以巧妙借力 Agent 内部的 LLM 智能,灵活处理各种问题。
3. 多个 Skills 的自由组合
Agent Skills 归根结底还是 Context engineering。Skills 只是把垂直领域知识、脚本调用方法等,挂载到 Agent 的 Context Window。
因此 Skills 在实际应用中非常灵活,甚至能在单个任务中调用多个 Skills。
例如:
- 结合 brand-guidelines + pptx 自动创建符合品牌规范的 pptx
也可以是更复杂的场景,比如做一份产品分析报告:
- 从网页抓取竞品数据(Web Scraping Skill)
- 从 PDF 抽取用户反馈(PDF Skill)
- 分析数据并生成图表(Data Analysis Skill)
- 按品牌标准创建 PPT(Brand Guidelines + PPTX Skill)
每新增一个 Skill,就新增一项能力。N 个 Skills 能覆盖远大于 N 的应用场景。
☞ Skill 的核心运行机制:Progressive Disclosure
本节讲解 Skills 运行的一个核心机制:Progressive Disclosure(渐进式披露)。
整体更偏技术;如果你只想用或制作 Skills,可以跳到下一节。
由于 Skills 的本质是 Context engineering,这个问题在 Skill Agents 中同样需要注意。
一个加载了 Skills 的完整 Agent 架构,大致如下:

Skill 包位于 Agent 的文件系统(右侧),默认不会加载进 Context Window。
根据不同的 Context 加载顺序与优先级,Skills 分为 3 层:

Skill 内容的三层渐进披露优先级

渐进披露流程图
- Level 1(Metadata,始终加载):
位于 SKILL.md 文档中的 metadata,包括 name 与使用描述。长度约 100 tokens。
Agent 启动时,会把 Skill 的 metadata 加载进 Context Window,包含在 system prompt 中。
AI 通过理解用户消息与 Skills metadata 的匹配度,判断是否自动使用相关 skills。
---
name: pdf
description: A comprehensive PDF toolkit for extracting text and tables, creating new PDFs, merging/splitting documents, and handling forms. Used when Claude needs to fill PDF forms or programmatically process, generate, or analyze PDF documents at scale.
---
默认只加载 metadata → 意味着你可以在一个 Agent 上安装很多 Skills,而不影响上下文性能。
- Level 2(Instructions,被触发时加载):
SKILL.md 文档的正文内容,即主要的 skill instructions,通常包含 workflow、best practices 与指导。
建议不超过 5000 tokens。
当用户消息与 Skill metadata 描述匹配且需要调用该 Skill 时,Agent 会用 bash 读取文档正文。文档内容在被读取时加载进 Context Window。

SKILL.md 的结构:分为 YAML metadata 与 MD body
- Level 3(Sub-skill Instructions / Resources / Code,按需动态加载):
由子技能文档、代码脚本、参考文档、可用资源等构成。
一些 Agent Skill 规范文档统称它们为「Resource」。相对而言,Level 3 的结构要求不那么严格。
- Sub-SKILL.md 子技能文档:相对独立、复杂的子技能说明,单独在 Level 3 加载

- 随着一个 Skill 的复杂度提升,可能因为 skill 知识上下文过长,或部分知识仅用于特定场景,不适合放在单个 SKILL.md,可拆到独立 instruction 文档中,仅在必要时加载。
- Scripts 代码脚本:被视作「Agent 的可执行资源」,不算作 tool use(tool use 是 Agent 外部调用的独立服务)
- Agent 在 Agent computer(virtual machine)中直接调用 scripts。脚本代码本身不会进入 Context Window;只有脚本运行后的输出才进入 Agent 的 Context。
- Reference 参考文档、Assets 可用资源,当然也属于 Level 3,仅在需要时动态读取并加载。
由于 Level 3 是按需加载,文件在未被访问前不占用 Context 长度,所以基本没有内容体量限制。可以按实际业务需要添加材料。
小结:在整个 Skill 运行过程中,Agent 会基于 Skills 的 metadata 自动判断任务相关的 skills,并按需动态加载完成任务所需的模块:
Level 1:SKILL.md metadata(name + description)
↓
Level 2:SKILL.md 正文
↓
Level 3:Resources 中的具体文件(按需读取)
不过,即便 Agent Skills 支持「渐进式披露」,在商业化 Agent 产品中,如何在单个或多个 Skills 组合使用时稳定控制 Context 长度,仍是绕不过去的工程性问题。
☞ Skills 对 AI 产品设计的影响
先讨论一个问题:
基于 Skills 的垂直 Agent 应用,会不会因推理依赖而产生响应时延问题?
- Skills 是一种很宽容的 Agent 设计架构。
- Skills 既可以设计成 token 很多的 instruction 文档,引导模型思考;也可以是毫不思考、直接指向可运行脚本代码的简洁指令。
- 因为 Skills 可以直接调用代码逻辑,且无需把代码放入 Context Window,使用 skills 并不要求 agent 持续推理;agent 也可以只扮演类似 hook 的角色,本质上和普通程序执行无异。
- 所以 Skills 既可以像 prompt 那样慢,也可以像 workflow 那样快。
再结合两个极端趋势判断:
- token 价格会下降
- Agent 速度会提升
这样看,基于 Skills 的垂直 Agent 的性能和成本问题,并非不可解的长期难题。
进一步外推 AI 原生产品的未来开发趋势:
以笔记应用为例,目前多数应用的逻辑还是:new note -> code -> process。新笔记按原样由代码逻辑直接入库。
而 AI 原生的笔记应用,可能内置类似 skill 的指导,包括:笔记入库、智能校正、冗余笔记合并等。部分 skills 以 prompt 为主(需要生成),部分基本就是代码逻辑(响应极快)。
当用户写下新笔记,AI 会迅速自行判断:能否直接入库?是否需要智能校正?是否有冗余的历史相似笔记需要合并?
各类情形都交由 agent 自动匹配不同 skills 处理。
这样,基于 Skills 的 Agent 产品就能用同一个多模态输入框处理各种用户输入,灵活应对未规划的边缘问题,并为用户提供高度个性化的生成结果。
第二部分:完整 Skills 教程——制作与使用
读到这里,Skills 对 AI 应用开发的价值无需赘述:
巧妙借力通用 Agent 核心,只需聚焦 Skills 设计,就能低成本打造具备通用智能上限的垂直 Agent 应用。
对 Agent 开发者,尤其是非技术团队或业务人员,这是巨大的开发红利:
- 零代码创建 Agent 应用。只需「写文档」,任何人都能做出能解决问题的垂直 Agent。
- 无需过度关注 Agent 工程细节。依托通用 Agent 智能,Skill Agent 能在运行时适配 Skill 设计中缺失的代码与功能逻辑,甚至跨越临时 bug(尽管会影响性能)。做 demo、MVP 乃至小型 Agent 应用来验证产品价值变得很容易。
- 而且你做出来的垂直 Agent 具备通用 AI 智能,拥有灵活的边界处理与个性化能力,智能上限非常高。
那么,如何开始使用或制作第一个 Skill?
1️⃣ 教程:如何使用 Skills?(Claude Code 版本)
如果你已经会了,可以跳过本节。
也可以把这份可能是全网最详细的 Skills 使用教程分享给刚入门的朋友。
使用 Skills 的方式很多。我先推荐一个我最常用的本地方式:Claude Code(简称 CC)。
注意:这只是使用工具,并不要求必须用 Claude 模型。
BTW:Codex、Cursor 等工具在逐步支持 skills 使用。有兴趣可以自行探索。
一个玩笑:
- Claude Code 是 Anthropic 发布的编程工具 ❌
- Claude Code 是一个通用 Agent 框架,可能连 Anthropic 自己都没预料到 ✅
CC 的能力远超 AI Coding:它可以代你操作电脑,包括上网搜索、操作浏览器、访问文件、使用底层计算机命令、运行 Python 脚本等。
这意味着 CC + Skills 就等于运行在你电脑上的垂直 Agent。通过安装或创建不同的 Skills,你可以完成:
- 搜索网页信息,汇总你感兴趣的新闻日报
- 自动审查项目文件夹,产出项目复盘文档
- 以及其他各类 Agent 任务
使用方式并不复杂,只是需要一点耐心:
Step 2: 安装与使用 Skills
在正式使用 Claude Code 之前,建议先在任意目录创建一个空文件夹,比如「test」,然后在终端切换到该目录。
接着在终端输入 claude,即可启动 CC。看到下图说明启动成功。

此举可以把 Claude Code 随后的 AI 行为限定在该目录内,减少对本地电脑其他文件的影响。
❶ 安装 Skill 前,你需要先获取所需的 Skill 文件包。
例如官方 Skills 仓库:https://github.com/anthropics/skills/tree/main, 里面已有很多开箱即用的 Skills。
你可以让 CC 自动帮你安装 Skills,比如在 CC 里发送:install skill,skill 项目地址是:
❷ 也可以手动下载 Skills,解压文件包后放到 Skills 安装目录:
你可以把要安装的 Skill 文件包放到当前项目文件夹的 /.claude/skills/ 目录下:(如下图所示为正确的项目 skills 路径配置)
也可以选择全局目录 ~/.claude/skills/(放在全局目录的 Skills 可被所有项目共享)
❸ 安装完成后记得重启 CC 👉 退出终端再打开,或双击 ctrl+c 终止 CC 进程即可)
使用 Skill 时,
只需在已安装的 CC 中发送「start using 」,或者当用户消息与 skill metadata 描述匹配时,例如:我想创建一个能自动检索每日新闻并把日报发到我邮箱的 skill。它会自动调用 Skills 并执行任务。
👉 如何找到好用的 Skills?
你大概会发现,面向 to-C 用户(即你自己的日常使用)时,上述方法有两个问题:
- 使用步骤确实比日常 App 更复杂
- 很难找到自己想要的 Skills
常规方法是去找第三方较大的 Skills 市场:https://skillsmp.com/zh
但不难发现,多数现有公共 Skills 市场缺少完整的评测与策展机制。所有 Skills 都缺乏合理的分类与排序体系,导致很难找到所需 Skills。

仅靠按 star 排序,很难找到真正合适、被策展过的 Skills
2️⃣ 如何制作一个 Skill?
回到正题。
如果你已经按上文学会了安装与使用 Skill,那么做出你的第一个 Skill 将会非常容易。
我们使用一个 Anthropic 官方 skill:skill-creator
顾名思义,它是一个用于自动开发 Skills 的 Skill(我的 AI-Partner 与 Article-Copilot Skills 也使用了它,极大提升了开发效率)。
❶ 先安装 skill-creator。项目地址:https://github.com/anthropics/skills/tree/main/skills/skill-creator. 安装流程与上面的教程一致,让 CC 帮忙自动安装。
❷ 安装完成后,你就可以调用 skill-creator 自动创建所需 skills。
例如,向 CC 发送创建请求:Create a new skill that can automatically convert user-pinned pdf to word documents.
CC 会自动调用 skill-creator,编写 SKILL.md 和 pdf2word 脚本

最后提示创建成功。
你也可以尝试:
- “Create skill that can write articles in my writing style”
- “Create skill that can automatically organize recent XX field news dailies”……
👉 如何安装你做好的 skills?
这种方式做出来的技能默认是 xx.skill 格式,与 zip 或文件夹格式略有不同。它是 skill-creator 创建的技能压缩格式。
把 .skill 文件的地址告诉 CC,让 CC 直接安装该 skill 即可。
如果是文件夹或 zip,则按前面的介绍,手动解压并放入相应的 skills 目录。
👉 【进阶】如果你需要微调一个 skill,或想完全手写一个 skill?
更详细的 Skill 规范与设计说明,请参考:https://agentskills.io/specification#skill-md-format
第三部分:什么时候该使用 Skills?
概念、价值、教程都讲完了。但更重要的问题是:
哪些场景值得「用 Skills 来解决」或「开发一个 Skill」?
这个问题对优化 AI 工作流的普通用户,和寻找 Skills Agent 创业机会的开发者同样重要。
基于 Anthropic 官方博客的建议与我的实践理解,我总结出 3 个明显的时机信号:
1️⃣ 发现自己在反复向 AI 解释同一件事
最典型的信号是:为了完成某个任务,你需要在多轮对话里不断向 AI 解释「这件事要怎么做」。
例如:
“帮我写一份技术文档” “不是这样的,我们公司的技术文档格式是这样的……” “而且代码示例要遵循这个模板……” “我不是跟你说过了吗,章节标题要用三级标题……”
“帮我分析这份数据” “先过滤掉异常值 > XX” “不对,你应该用中位数而不是平均数” “图表需要遵循我们公司文档的配色方案……”
这时你就该想:与其每次都解释,不如把这些规则打包成一个 Skill,一次创建,长期复用。
2️⃣ 有些任务需要特定知识、模板或材料才能做好
有时 AI 的通用能力足够,但缺乏「特定场景的知识材料」。
典型场景:
- 技术文档写作:需要参考代码规范、术语表,使用文档模板
- 品牌设计:需要参考品牌手册、色彩规范,使用 logo 资源
- 数据分析:需要参考指标定义、计算公式,使用报告模板……
这些都是典型的「通用 Agent + 垂直知识」场景:人类提供材料,Agent 才拥有场景 Context。
把对应的知识材料放进 Skill 包里,比如把模板、规范、案例放进 Skill 的 assets/、reference/ 目录,或直接写在 SKILL.md 中,
Agent 就能一把过输出满足任务要求的精确结果。
3️⃣ 发现一个任务需要多个工作流才能完成
有些任务更复杂,往往需要「组合多个工作流」才能完成。
- 竞品分析报告:抓取竞品数据 + 数据分析 + 创建 PPT
- 内容生产:收集参考材料 + 学习风格 + 大纲协作 + 正文写作
我相信你的工作环境里有很多类似任务。
把这类任务每一步的 instruction 文档、可执行脚本、参考材料与可用资源,打包进一个或多个 Skills,同样是很好的 AI 解法路径。
让 Agent 基于任务描述智能调用不同的 Skill 模块,通过交替的「计划-执行-观察」动作,一次性完成原本需要多个工作流协作的复杂任务。
🎐 收尾
写到这里,回到开头那个判断:Claude Skills 的价值仍然被严重低估。
Skills 是 Agent 的灵魂,就像 Steam 游戏 + Workshop。
借助这种高度可扩展的设计架构,Agent 开发者可以完全借力通用 Agent 核心,
只需专注于 Skills 设计本身,就能以低成本打造具备通用 AI 智能上限的垂直 Agent 应用。
对 Agent 创业者,甚至非技术领域专家而言,Skills 无疑意味着许多新机会:
如果用传统方式开发一个垂直 Agent 工具,至少需要数周。
而用 Skill 的思路,数小时甚至数分钟就能开始测试,智能与能力上限还有机会接近通用 Agent。
这并不意味着 Agent Skills 一定会完全取代传统开发。
两种方式各有适用场景,但 Skills 的确让更多人、更多场景更可行地获取 Agent 能力:
- 内部小工具不必开发完整产品,打包一个 Skill 就能解决。
- 不必说服 IT 团队理解你的需求,你可以自己造工具。
- 不必等待产品迭代,你可以随时调整 Skill 行为。
从这个角度看,Skills 降低了验证想法的成本。
另外换个角度:把 Skill Agent 的服务封装为 AI API,难道不是能很快为既有产品增添有用 AI 能力的方式吗?
我们仍处在 Skill 生态的早期。Agent Skills 开放标准发布还不到 1 个月。工具在打磨,社区在成长。
而有意思的是,这个方向终于让更多人、组织与行业能够参与到 AI 应用的创造中来。
参考
- Claude Doc - Agent Skills 文档:https://platform.claude.com/docs/en/agents-and-tools/agent-skills/overview
- Agent Skills Open Standard:https://agentskills.io/home
- Equipping agents for the real world with Agent Skills:https://www.anthropic.com/engineering/equipping-agents-for-the-real-world-with-agent-skills