当前位置：首页 » AI学习教程

Agent Skills 终极指南：从入门到精通的完整路线图

2小时前 AI学习教程 26 0

开篇思考

Claude Skills 的价值仍然被严重低估。

一个设计良好的 Skill，所带来的智能能力足以匹敌，甚至超越完整的 AI 产品。更关键的是：任何人都能自己开发 Skill，不需要技术背景。

以我的 Article-Copilot 为例，只用一个 Skill，我就搭建了一个能从素材处理到实际写作全流程运行的 Agent 应用。

在深入研读 Anthropic 官方技术博客，并对 Agent Skills 做了系统性实验之后，我整理出这份自认为最完整的 Skill 指南，涵盖：

最通俗易懂的 Skills 概念与原理解释
对 Skills 的真实价值、技术优势与对 AI 产品设计影响的讨论
使用与开发 Skills 的完整教程
如何识别适合使用 Skills 的场景

从概念厘清到工作机理，从上手教程到实际应用，我会一步步带你走完。

第一部分：什么是 Skills？从起源到运行原理

2025 年 10 月中旬，Anthropic 正式发布了 Claude Skills。

两个月后，Agent Skills 作为开放标准进一步发布，旨在构建全新的 AI Agent 开发生态。

OpenAI、GitHub、VS Code 和 Cursor 随即跟进。

更好地理解它的话，可以把 Skills 想成「通用 Agent 的扩展包」：

一个 Agent 可以加载不同的 Skills 包，从而获得不同的垂直知识、工具使用能力，并可靠地完成特定任务。

最常见的问题是：这和 MCP 有什么不同？

MCP 是一个开放标准协议，关注的是 AI 如何以统一方式调用外部工具、数据与服务；它不定义任务逻辑或执行流程。
Skills 则是在教一个 Agent 如何端到端完成特定工作。它把执行方法、工具调用范式以及相关知识材料打包成完整的「能力扩展包」，让 Agent 具备稳定、可复用的完成路径。

以下是 Anthropic 官方的一些 Skill 示例：

PDF：包含 PDF 合并、拆分和文本抽取的代码脚本。教会 Agent 如何处理 PDF 文件、抽取文本、创建新 PDF、以及合并或拆分文档。
Brand-guidelines：包含品牌设计规范和 logo 资源。Agent 在设计网站或海报时，能参考这些设计资源并自动遵循企业设计标准。
Skill-Creator：把创建 Skills 的方法打包成一个元 Skill，让 AI 主动发起 Skill 创建流程，引导用户产出符合需求的高质量 Skills。

Skill-Creator：教 Agent 如何帮助用户创造新的 Agent 能力

但 Skills 的价值天花板远不止于此。

把它视作一个从垂直 Agent 到 AI 产品开发的通用范式：你可以借力一个通用 Agent 核心，以近乎零门槛的方式，打造具备通用智能上限的垂直 Agent 应用。

先从 Skills 的工作方式说起。

先说，应该如何理解 Skills？

Anthropic 这样定义：

Skills 是扩展 Agent 功能的模块化能力。每个 Skill 打包了 LLM 指令、metadata 以及可选资源（scripts、templates 等），Agent 会在需要时自动使用它们。

我有个更直观的比喻：Skills 就像是给 Agent 准备的一份「工作交接包」。

想象你要把一项任务交接给新同事。如果不能面对面教，只能靠文档（并且你想一次性交接清楚，后面不被打扰），你会准备什么？

任务执行 SOP 和必要背景知识（大概该怎么做）
工具使用说明（用什么软件、如何操作）
需要的模板与材料（历史案例、格式标准）
可能的问题、规范与解法（补充细则与指导）

Skill 的设计架构，本质上就是这份交接包的数字化版本：

一个相对标准的 Skill 结构示例。在实际场景中，仅 SKILL.md 为必需；其他结构可选。

在一个 Skill 里，instruction 文档提供灵活指导，code 负责可靠调用，resources 用于事实检索与参考。

当 Agent 运行一个 Skill 时，它会：

以 SKILL.md 作为主要指南
根据任务情境，判断何时调用 code scripts、参考 documentation 或使用 asset resources
通过「计划-执行-观察」交替反馈循环完成任务目标

当然，Skills 也可以扩展 Agent 的 tool 与 MCP 使用边界。通过文档与脚本，你可以教 Agent 连接并使用特定的外部工具与 MCP 服务。

这是一个 PPTX Skill 的文件目录示例：

整个文件夹是支持 AI 创建、编辑、分析 PowerPoint 演示文稿的完整能力包。
核心文件是 SKILL.md，包含 skill 的 metadata 与任务指导，告诉 agent 在何时使用这个 skill、以及如何逐步处理任务。
需要注意的是，经常会把相对独立的子技能拆分到子文档（例如 html2pptx.md 教 AI 如何把 html 导出为 pptx），以避免一次性加载过长的 skill 文档，从而节省 Context Window 空间。
scripts/ 下包含可供 Agent 使用的各种预写程序脚本，例如一键将 html 转换为 pptx 的脚本。这样 Agent 在运行任务时不必临时开发工具，直接调用就好，既省 token，又避免错误，并提升速度。
另有一些参考文档（这个项目的打包不算完全标准，但基于 SKILL.md，Agent 依然能理解可参考哪些文档），例如 ooxml.md，是 ooxml 格式文件的解析指南。

整个 Skill 以简洁形式，把能力指导文档、代码脚本、参考文档和可用资源组合起来，有方向地扩展 Agent 在 pptx 生成方面的工作能力。

Skills 的真实价值：垂直 Agent 的未来形态

我看好 Skills 的价值与未来生态，是因为 Skills 和其他 AI 应用开发方式，从底层机制上就不同：

人类提供专业知识与工具方法；通用 Agent 提供智能、自治理解与主动执行。

直白点说：人给出指导，最终由 Agent 凭智能执行。

而且「Agent + 文件」的形态足够通用。

这带来了相较于前辈（Workflows 和代码式 AI 应用）三个关键优势：

非技术人员可零代码、用自然语言编写
能突破预设限制，灵活响应用户输入，处理边界情况
多个 Skills 还可自由组合，应用方式极度灵活

这一节可能略深，但有完整例子其实不难理解。尽管这些是我的个人判断，但应该能帮助你把握 Skill 价值与 Agent 开发趋势。

1. 零代码、用自然语言，写出真的聪明的 Agents

回看此前的 AI 应用开发方式：

代码式开发不必多说，需要理解程序逻辑与技术实现。
即便是近来流行的 Workflow 平台（如 Coze、Dify、N8N），你仍需要理解节点配置、条件分支——其实还是「编程」，只是界面更友好。

而 Skills 的创作门槛完全不同：入门门槛低，智能上限高。

以 Anthropic 的 brand-guidelines skill 为最简单的例子：

只需要一个 SKILL.md，且完全用自然语言撰写。

Metadata：何时使用该 Skill
Body：品牌色、字体等的文字描述

但仅此就足以把 Agent 引导为遵循 Anthropic 品牌设计的垂直 Agent，可用于品牌网站、海报、PPT 设计。

当你要设计一个遵循 Anthropic 设计标准的 AI 搜索网站时，Agent 会自动运行这个 Skill。

Skills 有两种加载模式：explicit / implicit。

前者由用户查询直接指定；后者由 LLM 基于任务与 metadata 描述的相关性自动匹配触发。

下面这个网站就是由该 skill agent 一次性开发完成，样式接近 Claude 官方网站设计：

对于更复杂的案例，你可以参考其他官方示例，比如制作 PPT。

这些案例基本验证：仅用 Skill + Agent 构建的垂直 Agent 所达成的智能效果，可与同类 AI 产品持平，甚至超越。

而制作这些垂直 Agent，不需要写任何程序代码。

非技术的领域专家，只差一层纸就能做出自己的专业 Agent。

把你的专业经验与工作流程写清楚成文档，Agent 就能照着执行。

2. 突破预设限制，灵活处理真实场景

这个优势常被忽视。

Workflows 或传统程序的核心问题在于：它们假定所有情况都能预设。

比如，一个基于用户记忆的 AI 个性化助手，通常需要预先定义：

用户导入记忆文件的入口
支持上传的文件格式
数据应该包含哪些字段
以及可能出现的特殊情况与处理方式

但现实往往是：

你需要教用户到哪儿点击「导入」
用户只有预期外格式：你只支持 md，但他只有 doc
数据字段不匹配：你期望每个文件有标题，但用户文件没有标题
或者出现预设之外的边界情况

此时，Workflows 或传统程序就卡住了。它们只能沿预设路径执行，遇到意外就报错，或要求用户自行补洞。

但通用 Agent + Skill 的应用完全不同：

能在统一对话框接收各种用户数据（文本、文件、图片）
能自主调用其他 Skills，或临时写一个 doc2md 脚本，自动转换用户格式
能为每个文件抽取并补充标题，完成数据摄取
能基于 LLM 推理智能桥接各种边缘问题

用 Skills 打造的垂直 Agent，在 Skills 的知识与方法指导下，可以巧妙借力 Agent 内部的 LLM 智能，灵活处理各种问题。

3. 多个 Skills 的自由组合

Agent Skills 归根结底还是 Context engineering。Skills 只是把垂直领域知识、脚本调用方法等，挂载到 Agent 的 Context Window。

因此 Skills 在实际应用中非常灵活，甚至能在单个任务中调用多个 Skills。

例如：

结合 brand-guidelines + pptx 自动创建符合品牌规范的 pptx

也可以是更复杂的场景，比如做一份产品分析报告：

从网页抓取竞品数据（Web Scraping Skill）
从 PDF 抽取用户反馈（PDF Skill）
分析数据并生成图表（Data Analysis Skill）
按品牌标准创建 PPT（Brand Guidelines + PPTX Skill）

每新增一个 Skill，就新增一项能力。N 个 Skills 能覆盖远大于 N 的应用场景。

☞ Skill 的核心运行机制：Progressive Disclosure

本节讲解 Skills 运行的一个核心机制：Progressive Disclosure（渐进式披露）。

整体更偏技术；如果你只想用或制作 Skills，可以跳到下一节。

由于 Skills 的本质是 Context engineering，这个问题在 Skill Agents 中同样需要注意。

一个加载了 Skills 的完整 Agent 架构，大致如下：

Skill 包位于 Agent 的文件系统（右侧），默认不会加载进 Context Window。

根据不同的 Context 加载顺序与优先级，Skills 分为 3 层：

Skill 内容的三层渐进披露优先级

渐进披露流程图

Level 1（Metadata，始终加载）：

位于 SKILL.md 文档中的 metadata，包括 name 与使用描述。长度约 100 tokens。

Agent 启动时，会把 Skill 的 metadata 加载进 Context Window，包含在 system prompt 中。

AI 通过理解用户消息与 Skills metadata 的匹配度，判断是否自动使用相关 skills。

---
name: pdf
description: A comprehensive PDF toolkit for extracting text and tables, creating new PDFs, merging/splitting documents, and handling forms. Used when Claude needs to fill PDF forms or programmatically process, generate, or analyze PDF documents at scale.
---

默认只加载 metadata → 意味着你可以在一个 Agent 上安装很多 Skills，而不影响上下文性能。

Level 2（Instructions，被触发时加载）：

SKILL.md 文档的正文内容，即主要的 skill instructions，通常包含 workflow、best practices 与指导。

建议不超过 5000 tokens。

当用户消息与 Skill metadata 描述匹配且需要调用该 Skill 时，Agent 会用 bash 读取文档正文。文档内容在被读取时加载进 Context Window。

SKILL.md 的结构：分为 YAML metadata 与 MD body

Level 3（Sub-skill Instructions / Resources / Code，按需动态加载）：

由子技能文档、代码脚本、参考文档、可用资源等构成。

一些 Agent Skill 规范文档统称它们为「Resource」。相对而言，Level 3 的结构要求不那么严格。

Sub-SKILL.md 子技能文档：相对独立、复杂的子技能说明，单独在 Level 3 加载

随着一个 Skill 的复杂度提升，可能因为 skill 知识上下文过长，或部分知识仅用于特定场景，不适合放在单个 SKILL.md，可拆到独立 instruction 文档中，仅在必要时加载。
Scripts 代码脚本：被视作「Agent 的可执行资源」，不算作 tool use（tool use 是 Agent 外部调用的独立服务）
Agent 在 Agent computer（virtual machine）中直接调用 scripts。脚本代码本身不会进入 Context Window；只有脚本运行后的输出才进入 Agent 的 Context。
Reference 参考文档、Assets 可用资源，当然也属于 Level 3，仅在需要时动态读取并加载。

由于 Level 3 是按需加载，文件在未被访问前不占用 Context 长度，所以基本没有内容体量限制。可以按实际业务需要添加材料。

小结：在整个 Skill 运行过程中，Agent 会基于 Skills 的 metadata 自动判断任务相关的 skills，并按需动态加载完成任务所需的模块：

Level 1：SKILL.md metadata（name + description）
         ↓
Level 2：SKILL.md 正文
         ↓
Level 3：Resources 中的具体文件（按需读取）

不过，即便 Agent Skills 支持「渐进式披露」，在商业化 Agent 产品中，如何在单个或多个 Skills 组合使用时稳定控制 Context 长度，仍是绕不过去的工程性问题。

☞ Skills 对 AI 产品设计的影响

先讨论一个问题：

基于 Skills 的垂直 Agent 应用，会不会因推理依赖而产生响应时延问题？

Skills 是一种很宽容的 Agent 设计架构。
Skills 既可以设计成 token 很多的 instruction 文档，引导模型思考；也可以是毫不思考、直接指向可运行脚本代码的简洁指令。
因为 Skills 可以直接调用代码逻辑，且无需把代码放入 Context Window，使用 skills 并不要求 agent 持续推理；agent 也可以只扮演类似 hook 的角色，本质上和普通程序执行无异。
所以 Skills 既可以像 prompt 那样慢，也可以像 workflow 那样快。

再结合两个极端趋势判断：

token 价格会下降
Agent 速度会提升

这样看，基于 Skills 的垂直 Agent 的性能和成本问题，并非不可解的长期难题。

进一步外推 AI 原生产品的未来开发趋势：

以笔记应用为例，目前多数应用的逻辑还是：new note -> code -> process。新笔记按原样由代码逻辑直接入库。

而 AI 原生的笔记应用，可能内置类似 skill 的指导，包括：笔记入库、智能校正、冗余笔记合并等。部分 skills 以 prompt 为主（需要生成），部分基本就是代码逻辑（响应极快）。

当用户写下新笔记，AI 会迅速自行判断：能否直接入库？是否需要智能校正？是否有冗余的历史相似笔记需要合并？

各类情形都交由 agent 自动匹配不同 skills 处理。

这样，基于 Skills 的 Agent 产品就能用同一个多模态输入框处理各种用户输入，灵活应对未规划的边缘问题，并为用户提供高度个性化的生成结果。

第二部分：完整 Skills 教程——制作与使用

读到这里，Skills 对 AI 应用开发的价值无需赘述：

巧妙借力通用 Agent 核心，只需聚焦 Skills 设计，就能低成本打造具备通用智能上限的垂直 Agent 应用。

对 Agent 开发者，尤其是非技术团队或业务人员，这是巨大的开发红利：

零代码创建 Agent 应用。只需「写文档」，任何人都能做出能解决问题的垂直 Agent。
无需过度关注 Agent 工程细节。依托通用 Agent 智能，Skill Agent 能在运行时适配 Skill 设计中缺失的代码与功能逻辑，甚至跨越临时 bug（尽管会影响性能）。做 demo、MVP 乃至小型 Agent 应用来验证产品价值变得很容易。
而且你做出来的垂直 Agent 具备通用 AI 智能，拥有灵活的边界处理与个性化能力，智能上限非常高。

那么，如何开始使用或制作第一个 Skill？

1️⃣ 教程：如何使用 Skills？（Claude Code 版本）

如果你已经会了，可以跳过本节。

也可以把这份可能是全网最详细的 Skills 使用教程分享给刚入门的朋友。

使用 Skills 的方式很多。我先推荐一个我最常用的本地方式：Claude Code（简称 CC）。

注意：这只是使用工具，并不要求必须用 Claude 模型。

BTW：Codex、Cursor 等工具在逐步支持 skills 使用。有兴趣可以自行探索。

一个玩笑：

Claude Code 是 Anthropic 发布的编程工具 ❌
Claude Code 是一个通用 Agent 框架，可能连 Anthropic 自己都没预料到 ✅

CC 的能力远超 AI Coding：它可以代你操作电脑，包括上网搜索、操作浏览器、访问文件、使用底层计算机命令、运行 Python 脚本等。

这意味着 CC + Skills 就等于运行在你电脑上的垂直 Agent。通过安装或创建不同的 Skills，你可以完成：

搜索网页信息，汇总你感兴趣的新闻日报
自动审查项目文件夹，产出项目复盘文档
以及其他各类 Agent 任务

使用方式并不复杂，只是需要一点耐心：

Step 2: 安装与使用 Skills

在正式使用 Claude Code 之前，建议先在任意目录创建一个空文件夹，比如「test」，然后在终端切换到该目录。

接着在终端输入 claude，即可启动 CC。看到下图说明启动成功。

此举可以把 Claude Code 随后的 AI 行为限定在该目录内，减少对本地电脑其他文件的影响。

❶ 安装 Skill 前，你需要先获取所需的 Skill 文件包。

例如官方 Skills 仓库：https://github.com/anthropics/skills/tree/main, 里面已有很多开箱即用的 Skills。

你可以让 CC 自动帮你安装 Skills，比如在 CC 里发送：install skill，skill 项目地址是：

❷ 也可以手动下载 Skills，解压文件包后放到 Skills 安装目录：

你可以把要安装的 Skill 文件包放到当前项目文件夹的 /.claude/skills/ 目录下：（如下图所示为正确的项目 skills 路径配置）

也可以选择全局目录 ~/.claude/skills/（放在全局目录的 Skills 可被所有项目共享）

❸ 安装完成后记得重启 CC 👉 退出终端再打开，或双击 ctrl+c 终止 CC 进程即可）

使用 Skill 时，

只需在已安装的 CC 中发送「start using 」，或者当用户消息与 skill metadata 描述匹配时，例如：我想创建一个能自动检索每日新闻并把日报发到我邮箱的 skill。它会自动调用 Skills 并执行任务。

👉 如何找到好用的 Skills？

你大概会发现，面向 to-C 用户（即你自己的日常使用）时，上述方法有两个问题：

使用步骤确实比日常 App 更复杂
很难找到自己想要的 Skills

常规方法是去找第三方较大的 Skills 市场：https://skillsmp.com/zh

但不难发现，多数现有公共 Skills 市场缺少完整的评测与策展机制。所有 Skills 都缺乏合理的分类与排序体系，导致很难找到所需 Skills。

仅靠按 star 排序，很难找到真正合适、被策展过的 Skills

2️⃣ 如何制作一个 Skill？

回到正题。

如果你已经按上文学会了安装与使用 Skill，那么做出你的第一个 Skill 将会非常容易。

我们使用一个 Anthropic 官方 skill：skill-creator

顾名思义，它是一个用于自动开发 Skills 的 Skill（我的 AI-Partner 与 Article-Copilot Skills 也使用了它，极大提升了开发效率）。

❶ 先安装 skill-creator。项目地址：https://github.com/anthropics/skills/tree/main/skills/skill-creator. 安装流程与上面的教程一致，让 CC 帮忙自动安装。

❷ 安装完成后，你就可以调用 skill-creator 自动创建所需 skills。

例如，向 CC 发送创建请求：Create a new skill that can automatically convert user-pinned pdf to word documents.

CC 会自动调用 skill-creator，编写 SKILL.md 和 pdf2word 脚本

最后提示创建成功。

你也可以尝试：

“Create skill that can write articles in my writing style”
“Create skill that can automatically organize recent XX field news dailies”……

👉 如何安装你做好的 skills？

这种方式做出来的技能默认是 xx.skill 格式，与 zip 或文件夹格式略有不同。它是 skill-creator 创建的技能压缩格式。

把 .skill 文件的地址告诉 CC，让 CC 直接安装该 skill 即可。

如果是文件夹或 zip，则按前面的介绍，手动解压并放入相应的 skills 目录。

👉 【进阶】如果你需要微调一个 skill，或想完全手写一个 skill？

更详细的 Skill 规范与设计说明，请参考：https://agentskills.io/specification#skill-md-format

第三部分：什么时候该使用 Skills？

概念、价值、教程都讲完了。但更重要的问题是：

哪些场景值得「用 Skills 来解决」或「开发一个 Skill」？

这个问题对优化 AI 工作流的普通用户，和寻找 Skills Agent 创业机会的开发者同样重要。

基于 Anthropic 官方博客的建议与我的实践理解，我总结出 3 个明显的时机信号：

1️⃣ 发现自己在反复向 AI 解释同一件事

最典型的信号是：为了完成某个任务，你需要在多轮对话里不断向 AI 解释「这件事要怎么做」。

例如：

“帮我写一份技术文档” “不是这样的，我们公司的技术文档格式是这样的……” “而且代码示例要遵循这个模板……” “我不是跟你说过了吗，章节标题要用三级标题……”

“帮我分析这份数据” “先过滤掉异常值 > XX” “不对，你应该用中位数而不是平均数” “图表需要遵循我们公司文档的配色方案……”

这时你就该想：与其每次都解释，不如把这些规则打包成一个 Skill，一次创建，长期复用。

2️⃣ 有些任务需要特定知识、模板或材料才能做好

有时 AI 的通用能力足够，但缺乏「特定场景的知识材料」。

典型场景：

技术文档写作：需要参考代码规范、术语表，使用文档模板
品牌设计：需要参考品牌手册、色彩规范，使用 logo 资源
数据分析：需要参考指标定义、计算公式，使用报告模板……

这些都是典型的「通用 Agent + 垂直知识」场景：人类提供材料，Agent 才拥有场景 Context。

把对应的知识材料放进 Skill 包里，比如把模板、规范、案例放进 Skill 的 assets/、reference/ 目录，或直接写在 SKILL.md 中，

Agent 就能一把过输出满足任务要求的精确结果。

3️⃣ 发现一个任务需要多个工作流才能完成

有些任务更复杂，往往需要「组合多个工作流」才能完成。

竞品分析报告：抓取竞品数据 + 数据分析 + 创建 PPT
内容生产：收集参考材料 + 学习风格 + 大纲协作 + 正文写作

我相信你的工作环境里有很多类似任务。

把这类任务每一步的 instruction 文档、可执行脚本、参考材料与可用资源，打包进一个或多个 Skills，同样是很好的 AI 解法路径。

让 Agent 基于任务描述智能调用不同的 Skill 模块，通过交替的「计划-执行-观察」动作，一次性完成原本需要多个工作流协作的复杂任务。

🎐 收尾

写到这里，回到开头那个判断：Claude Skills 的价值仍然被严重低估。

Skills 是 Agent 的灵魂，就像 Steam 游戏 + Workshop。

借助这种高度可扩展的设计架构，Agent 开发者可以完全借力通用 Agent 核心，

只需专注于 Skills 设计本身，就能以低成本打造具备通用 AI 智能上限的垂直 Agent 应用。

对 Agent 创业者，甚至非技术领域专家而言，Skills 无疑意味着许多新机会：

如果用传统方式开发一个垂直 Agent 工具，至少需要数周。

而用 Skill 的思路，数小时甚至数分钟就能开始测试，智能与能力上限还有机会接近通用 Agent。

这并不意味着 Agent Skills 一定会完全取代传统开发。

两种方式各有适用场景，但 Skills 的确让更多人、更多场景更可行地获取 Agent 能力：

内部小工具不必开发完整产品，打包一个 Skill 就能解决。
不必说服 IT 团队理解你的需求，你可以自己造工具。
不必等待产品迭代，你可以随时调整 Skill 行为。

从这个角度看，Skills 降低了验证想法的成本。

另外换个角度：把 Skill Agent 的服务封装为 AI API，难道不是能很快为既有产品增添有用 AI 能力的方式吗？

我们仍处在 Skill 生态的早期。Agent Skills 开放标准发布还不到 1 个月。工具在打磨，社区在成长。

而有意思的是，这个方向终于让更多人、组织与行业能够参与到 AI 应用的创造中来。

参考

Claude Doc - Agent Skills 文档：https://platform.claude.com/docs/en/agents-and-tools/agent-skills/overview
Agent Skills Open Standard：https://agentskills.io/home
Equipping agents for the real world with Agent Skills：https://www.anthropic.com/engineering/equipping-agents-for-the-real-world-with-agent-skills

声明：本站原创文章文字版权归本站所有，转载务必注明作者和出处；本站转载文章仅仅代表原作者观点，不代表本站立场，图文版权归原作者所有。如有侵权，请联系我们删除。

未经允许不得转载：Agent Skills 终极指南：从入门到精通的完整路线图

请登录后发表评论