PUBLIC NOTEcourse16 min read

Agent skills开发

这篇《Agent Skills 开发丨操作手册》系统讲的是：用 Claude Code 的 Skills 体系，把各种重复工作“流程化”，让 AI 像有 SOP 的熟练员工一样干活，覆盖从内容生产、产品开发到视频剪辑的完整案例和方法论。一、整体结构与核心理念手册来源于三场

AI 编程 Agent 工具指南产品思考 AI

这篇《Agent Skills 开发丨操作手册》系统讲的是：用 Claude Code 的 Skills 体系，把各种重复工作“流程化”，让 AI 像有 SOP 的熟练员工一样干活，覆盖从内容生产、产品开发到视频剪辑的完整案例和方法论。

一、整体结构与核心理念

手册来源于三场直播，分三部分、18 个知识点：

钱塘江鲤：用 Skills 控制 AI 干活（内容生产、选题分析、自动发布、定时任务）
智昊：用 Skills 提效 Vibe Coding（从脑暴到 PRD、原型、前端开发的完整开发工作流）
成峰：用 Skills 做剪辑 Agent（视频剪辑 Agent、自进化机制、字幕与词典、Skill 设计方法论）

贯穿全篇的一条主线是：Skill = 对话式工作流 + 专家知识包 + 可复用 SOP，目标是把你工作中所有“可说清流程的重复劳动”都 Skill 化，让 Agent 执行，人只做决策和审核。

二、钱塘江鲤：用 Skills 驱动内容生产与自动化

1. 一句话生成视频

用 Obsidian 管理 Markdown 文稿，在 Claude Code 里进入项目或笔记目录。
只用一句话指令，比如“根据这份分享大纲生成 1 分钟介绍视频，背景用 Claude 官网米黄色”。
Claude 自动：

调用视频生成 Skill
写代码
生成带配音、字幕、BGM、画面的视频

生成后自动打开剪辑界面，可二次编辑（调整顺序、替换素材、改字体和颜色）。
支持声音克隆、批量生成（每天 10 条、20 条），通过定时任务自动跑。
本质上：复杂代码和流程都封装在 Skill 里，使用者只用自然语言下需求。

2. Skill 的本质与传统工作流对比

传统工作流（扣子 Coze、N8N、Dify）：

拖拽节点，逻辑复杂，报错难排查。
没有推理能力，超出预设就中断。
接口变动容易导致流程全挂。

Skill：

是对话式工作流，是一个“可复用专家知识包”：

skill.md：SOP 流程文档（怎么做）
script：脚本工具（用什么工具）
reference：参考资料（模板、风格等）

只要有标准 SOP，就能变成 Skill，不要求会写代码。

行业信号：扣子首页已变 Skill 商店，传统拖拽工作流被下沉，说明“Skill 化”正在成为主流模式。

3. 对话式工作流与 Skill 创建

核心：在 Claude Code 里用自然语言驱动工作流，而不是拖拽节点。
把标准 SOP 写进 skill.md，Claude 就能按 SOP 自主执行，并在出错时尝试自动修复。
支持 Skill 热加载：修改 skill.md 或脚本后立即生效，不用重启。
用法模式：

先对话完成一个任务。
对效果满意后，对 Claude 说“把我们刚才的流程做成一个 Skill 方便复用”。
Claude 自动生成 skill.md、script、reference。
你可以在另一个终端对这个 Skill 调试、迭代。

不限于 Claude，Kimi 2.5、智谱、Minimax 等国内模型都可跑这些 Skills。可用 CC Switch 工具切换模型或中转 API。

4. Twitter 选题分析工作流

全流程示例：“帮我从 Twitter 找最近一个月关于所有 AI 工具最新最热的讨论，并做选题分析”。
Skill 嵌套调用：

Twitter Fetcher：抓取大量推文（几百到上千条），筛选高赞数据。
Twitter 数据分析 / Topic Analyzer：做深度选题分析。

输出内容包括：

热门话题分类（AI 反思、就业焦虑、内容质量、创造力等）。
高赞推文拆解（为什么火、内容结构、写作技巧、可复用模板）。
选题建议和标题模板。
数据洞察（情绪分布、高赞特征、最佳发布策略）。

展示了“Skill 套 Skill”的调用方式：不同 Skill 组成一条完整的数据→分析→选题链路。

5. 多风格创作与自动发布

以上一步选题分析为输入，Skill 自动生成多平台、多风格内容：

一次生成：公众号文章、抖音脚本、小红书笔记等。
多种写作调性：温柔、故事、犀利风格等。

通过 Obsidian 插件或发布 Skill，一键发到公众号/小红书等平台。
关键点：只要 Skill 的 YAML 描述写清楚用途和触发条件，Claude 可以通过语义理解自动决定用哪个发布 Skill，无需人工指定。
整个内容生产链路可以做成定时任务，变成全自动内容工厂。

6. 定时任务与舆情监控

在 Obsidian 里配置定时任务，比如每天 9 点自动执行某个内容/监控工作流。
舆情监控流程：

配关键词（如“AI Agent”）和平台（小红书、公众号、Twitter、抖音等）。
定时抓取当天高赞内容。
Skill 做选题或舆情分析。
通过飞书/钉钉 Skill 自动发布分析报告到群里，当日报用。

选题分析和舆情分析的数据源相同，只是分析角度和提示词不同。
总结：数据抓取、清洗、分析、报告、桌面自动化、社媒管理等只要流程可描述，就可以 Skill 化，Skill 的上限基本就是“你说得出流程的上限”。

三、智昊：Skills + Vibe Coding 的完整开发流程

7. Skills 安装与使用注意事项

推荐用 skills.sh 的安装命令：‎⁠npx @anthropic-ai/skills add xxx⁠，在具体项目目录里执行。
避免全局安装，建议每个项目单独安装所需 Skills。
同一项目不要超过 10 个 Skills，避免“串 Skill”（职责混淆、调用乱）。
不建议在 Skill 内部写“调用其他 Skill”的逻辑，容易形成循环；正确做法是在 AGENT.md / CLAUDE.md 顶层写清楚“什么时候用哪个 Skill”。
如果自动激活失败，用斜杠命令（Slash Commands）手动调用：

输入 ‎⁠/⁠，选 Skill 名，强制注入其上下文。
自动激活依赖的是 YAML 的 name 和 description，当任务语义匹配时才会被自动加载。

8. 从 Brainstorming 到 PRD 的需求澄清工作流

阶段目标：把“一个模糊想法”变成“结构化的业务需求文档 BRD/Requirements.md”。
使用两个核心 Skills：

brainstorming：通过反向发问，一轮轮引导你澄清需求、场景、用户、输出形式等。
doc-coauthoring：把前面的对话整理成正式的 Markdown 文档。

推荐在脑暴阶段使用上下文更长的模型（如 Gemini），确保长时间对话不丢信息。
实践方式：

新建需求目录，安装 brainstorming 和 doc-coauthoring。
用 brainstorming 深挖需求，可以聊 10 分钟到数小时。
完成后用 doc-coauthoring 产出 BRD（Requirements.md）。

相比直接在网页端聊天，使用 Skill 的结构化输出和逻辑性会好得多。

9. Stitch 原型设计与复刻

需求明确后，进入“从 BRD 到原型 + PRD”的阶段。
流程：

用 doc-coauthoring 逐页讨论 UI 结构（Homepage、列表页、详情页等）。
得到包含 ASCII 2x2 格局说明、布局、内容、网格和技术要点的“文本原型”。
把原型文本复制到 Stitch（AI 原型工具）里，自动生成可视化页面。
在 Stitch 中编辑微调，支持明/暗主题切换。
导出 HTML（或截图）作为后续开发和 PRD 的依据。
再用 doc-coauthoring 基于 BRD + 原型，写完整 PRD：业务流程、UI/UX 要求、数据库结构、图片与 SEO 要求等。

输出：原型设计（HTML/截图）+ 完整 PRD 文档。

10. 前端开发 Skills 三件套与质量审查

前端开发阶段的核心 Skills：

web-design-guidelines：强制形成统一的“NavBar + 内容区域 + Footer”布局规范，避免每页重新写导航和页脚。
frontend-design：在 Stitch 原型基础上做二次视觉和交互设计调整。
shadcn-ui：指导 AI 严格按照 ShadCN/UI 组件规范开发，防止乱写自定义组件。

开发完成后的审查 Skills：

react-best-practices：检查糟糕的组件结构、重复代码、不良配置等，给出修改建议。
seo-audit：做 SEO 检查，指出问题并指导修复。

通过这几类 Skills，让 AI 既能“按规范搭建前端”，又有“代码质量和 SEO 的自动 QA”。

11. Vibe Coding 工作流总览

三个阶段 + 文件夹拆分：

需求澄清（Requirements 文件夹）

Skills：brainstorming + doc-coauthoring
输出：Requirements.md

原型设计（Design 文件夹）

Skills：web-design-guidelines + doc-coauthoring + Stitch
输出：页面原型（HTML/图）+ PRD.md

开发实现（Develop 文件夹）

技术：脚手架如 Next.js
Skills：web-design-guidelines + frontend-design + shadcn-ui + react-best-practices + seo-audit
输出：可上线的完整网站代码

每个阶段只在对应目录安装当前需要的 Skills，互不干扰；每一步的产出就是下一步的输入，形成一条清晰的“想法 → BRD → 原型 → PRD → 代码 → 审查 → 上线”的流水线。

12. 多 Skill 集成与 Agent Browser

多个 Skills 协同工作时，不要在 Skill 内嵌调用链，而是在 CLAUDE.md/AGENT.md 里写“Skill Using Guide”，用自然语言描述执行顺序：

如：先 brainstorming → 再 doc-coauthoring → 再 web-design-guidelines → 再 frontend-design → 再 react-best-practices → 再 seo-audit。

这样可以让 AI 在全局上下文中理解什么时候调用哪个 Skill。
Agent Browser：

是一种更省 Token 的网页浏览/操作工具，比 Chrome MCP 更轻量。
适合浏览网页、点击按钮、截图、写操作记录；不适合需要 DevTools 的调试（那要用 Chrome MCP）。
复刻一个 SaaS 产品时，建议“人先全点一遍，Agent Browser 再点一遍并生成完整操作记录”，两者对比后再用操作记录写 PRD。

四、成峰：剪辑 Agent 的设计、训练与自进化

13. 剪辑 Agent 的设计理念与自进化

剪辑 Agent 的定位：Agent 主导、人类审核，而不是“人主导、工具辅助”的剪映模式。
核心设计：

自进化机制：当 Agent 表现不好时，让 AI 自己定位问题文件并修改 Skill；越用越懂你的习惯。
每次执行都参考用户习惯文档（大量小文件），逐步贴合个人剪辑风格。

与剪映的对比：

剪映使用脚本+规则，很多语义重复、口误抓不到。
剪辑 Agent 逐句语义分析，能识别内容重复或表达冗余。
代价是更慢，但换来更高准确率和自动化程度。

14. 火山引擎模型配置与剪辑 Skills 安装

语音识别用的是字节火山引擎（剪映同源）的云端模型：

新用户有 20 小时免费，之后约 5 元/小时。

安装路径：

把安装指令交给 Claude Code，它自动下载剪辑 Skills。
前往火山控制台开通“音视频字幕生成”，在“模型管理”创建应用并拿到 API Key。
在 Claude 中执行剪辑安装 Skill（如 ‎⁠/v videocut:安装⁠），输入 API Key，AI 自动安装本地依赖。
重启 Claude Code，输入 ‎⁠/v⁠，可以看到所有以 v 开头的剪辑 Skills。

所有 Skill 通过 skill.md 的 name 字段识别，可以自定义名称，但成峰统一以 v 开头以便管理。

15. 智能审核稿交互界面

Agent 分析完视频后，会生成一个本地审核页面链接，比纯文字交互更直观：

红色标记：口误、重复片段。
灰色标记：静音片段。
单击标记可跳转播放对应片段。

核心功能：

跳过已选删除片段的“净片段”播放。
倍速播放，提升审核效率。
复制删除列表，作为反馈给 AI 学习。
一键执行剪辑，应用删除方案。

不满意时，可以：

让 Agent “再仔细识别一遍”。
手动标记漏掉的片段，把删除列表回传给 Agent，让它分析改进规则。

16. 用户习惯训练与自更新反馈

自更新机制流程：

用户反馈（描述问题、改阈值、提供删除列表）。
Agent 用自更新 Skill 分析：问题属于哪个 Skill 文件/规则。
Agent 自动修改相应 Skill 或配置。
下次执行立刻生效。

反馈类型示例：

静音阈值调整（例如改成 1 秒）。
保留一定“嗯”等口头禅作为自然过渡。
专有词纠错。
用“遗漏删除列表”让 Agent 学会新的识别模式。

用户习惯以“一条信息一文件”的方式独立存储，避免互相覆盖或混乱。
经验值：使用约 10 次，Agent 能掌握你 80% 的习惯；50 次后能高度符合个人偏好。

17. 字幕字典与自动纠错

自定义词典是提升字幕准确率的关键：

词典文件在特定剪辑 Skill 的目录下，每行一个专有名词。
Agent 会用词典对 ASR 原始识别结果做纠错：

人名、品牌名不被误写。
大小写规范自动统一（如 agent→Agent）。

生成字幕流程：

Whisper/火山模型识别音频。
对照词典自动纠错。
生成字幕文件并提供预览界面，可手动修订。
确认后烧录到视频。

与剪映的差异点：剪映不支持自定义词典，而剪辑 Agent 可以针对领域术语、品牌、口头禅进行长期积累。

18. Skills 设计五步法与方法论

核心理念：80% 时间花在研究方法论和需求表达，20% 留给执行；执行尽量让 Agent 来做。
为什么要 Skill 化而不是写长 Prompt：

Prompt 太长、上下文有限，容易被截断。
每次修改复杂，要手动重发或复制粘贴。
Skill 有文件结构、关键词自动识别和按需加载，更节省 Token，也更稳定。

Skills 设计五步法：

原理研究：先理解业务/工具的底层逻辑，再设计 Skill（如剪辑流程的本质）。
热加载：利用 Skill 热加载能力，频繁、小步快调；改文档就立即生效。
反馈机制：设计从使用到反馈的路径，每次使用都能把问题回流给 Agent。
数据驱动优化：不仅靠主观反馈，还把客观数据（如内容表现、观看数据）反馈给 Agent 调整 Skill。
自更新闭环：让“使用→结果→反馈→分析→更新→再使用”变成自动循环。

总目标：让所有重复性的“执行层操作”固化为 Skills，Agent 持续学习、自我调整，人长期停留在策略设计和方法论层面。

五、附录：资源、安装与常见问题

资源清单：

Skills 聚合平台：
另一聚合平台：
官方 Skills 仓库：
成峰剪辑 Skills：

安装注意三原则：

不要装太多（同一项目 ≤ 10 个）。
不要 Skill 套 Skill（调用链写在 AGENT.md，而不是 Skill 内部）。
在 AGENT.md 清晰声明“什么场景用什么 Skill”。

‎⁠.claude/skills/skill-name/⁠ 下包含 skill.md、script、reference。
根目录有 CLAUDE.md（全局配置）和 AGENT.md（Agent 配置与调用逻辑）。

常见问题：

安装失败：检查网络、Node.js ≥ 20、必要时用代理。
Skill 未激活：检查目录、重启、用 ‎⁠/⁠ 命令看是否在列表里、用 Slash Commands 明文调用。
Skill vs Plugin（MCP）的区别：

Skill：提示词+SOP，指导 AI“怎么做”。
Plugin/MCP：外部服务接口，让 AI“能调用什么”。

剪辑 Agent 报错：检查火山 API Key、视频路径、确认已正常执行过 ‎⁠/v videocut:安装⁠。
国内模型：Kimi、智谱、Minimax 等均可运行 Skills，可配合 CC Switch 做模型/中转切换。

整体来看，这个页面把 Skills 当成“AI 时代的新型应用形态”，从内容生产到产品开发再到视频剪辑，给出了一整套：概念对比、安装规范、典型工作流案例、Skill 设计与自进化的实践方法。