PUBLIC NOTEcourse16 min read

Agent skills开发

这篇《Agent Skills 开发丨操作手册》系统讲的是:用 Claude Code 的 Skills 体系,把各种重复工作“流程化”,让 AI 像有 SOP 的熟练员工一样干活,覆盖从内容生产、产品开发到视频剪辑的完整案例和方法论。 一、整体结构与核心理念 手册来源于三场

这篇《Agent Skills 开发丨操作手册》系统讲的是:用 Claude Code 的 Skills 体系,把各种重复工作“流程化”,让 AI 像有 SOP 的熟练员工一样干活,覆盖从内容生产、产品开发到视频剪辑的完整案例和方法论。

一、整体结构与核心理念

手册来源于三场直播,分三部分、18 个知识点:

  • 钱塘江鲤:用 Skills 控制 AI 干活(内容生产、选题分析、自动发布、定时任务)
  • 智昊:用 Skills 提效 Vibe Coding(从脑暴到 PRD、原型、前端开发的完整开发工作流)
  • 成峰:用 Skills 做剪辑 Agent(视频剪辑 Agent、自进化机制、字幕与词典、Skill 设计方法论)

贯穿全篇的一条主线是:Skill = 对话式工作流 + 专家知识包 + 可复用 SOP,目标是把你工作中所有“可说清流程的重复劳动”都 Skill 化,让 Agent 执行,人只做决策和审核。

二、钱塘江鲤:用 Skills 驱动内容生产与自动化

1. 一句话生成视频

  • 用 Obsidian 管理 Markdown 文稿,在 Claude Code 里进入项目或笔记目录。
  • 只用一句话指令,比如“根据这份分享大纲生成 1 分钟介绍视频,背景用 Claude 官网米黄色”。
  • Claude 自动:
  • 调用视频生成 Skill
  • 写代码
  • 生成带配音、字幕、BGM、画面的视频
  • 生成后自动打开剪辑界面,可二次编辑(调整顺序、替换素材、改字体和颜色)。
  • 支持声音克隆、批量生成(每天 10 条、20 条),通过定时任务自动跑。
  • 本质上:复杂代码和流程都封装在 Skill 里,使用者只用自然语言下需求。

2. Skill 的本质与传统工作流对比

  • 传统工作流(扣子 Coze、N8N、Dify):
  • 拖拽节点,逻辑复杂,报错难排查。
  • 没有推理能力,超出预设就中断。
  • 接口变动容易导致流程全挂。
  • Skill:
  • 是对话式工作流,是一个“可复用专家知识包”:
  • skill.md:SOP 流程文档(怎么做)
  • script:脚本工具(用什么工具)
  • reference:参考资料(模板、风格等)
  • 只要有标准 SOP,就能变成 Skill,不要求会写代码。
  • 行业信号:扣子首页已变 Skill 商店,传统拖拽工作流被下沉,说明“Skill 化”正在成为主流模式。

3. 对话式工作流与 Skill 创建

  • 核心:在 Claude Code 里用自然语言驱动工作流,而不是拖拽节点。
  • 把标准 SOP 写进 skill.md,Claude 就能按 SOP 自主执行,并在出错时尝试自动修复。
  • 支持 Skill 热加载:修改 skill.md 或脚本后立即生效,不用重启。
  • 用法模式:
  • 先对话完成一个任务。
  • 对效果满意后,对 Claude 说“把我们刚才的流程做成一个 Skill 方便复用”。
  • Claude 自动生成 skill.md、script、reference。
  • 你可以在另一个终端对这个 Skill 调试、迭代。
  • 不限于 Claude,Kimi 2.5、智谱、Minimax 等国内模型都可跑这些 Skills。可用 CC Switch 工具切换模型或中转 API。

4. Twitter 选题分析工作流

  • 全流程示例:“帮我从 Twitter 找最近一个月关于所有 AI 工具最新最热的讨论,并做选题分析”。
  • Skill 嵌套调用:
  • Twitter Fetcher:抓取大量推文(几百到上千条),筛选高赞数据。
  • Twitter 数据分析 / Topic Analyzer:做深度选题分析。
  • 输出内容包括:
  • 热门话题分类(AI 反思、就业焦虑、内容质量、创造力等)。
  • 高赞推文拆解(为什么火、内容结构、写作技巧、可复用模板)。
  • 选题建议和标题模板。
  • 数据洞察(情绪分布、高赞特征、最佳发布策略)。
  • 展示了“Skill 套 Skill”的调用方式:不同 Skill 组成一条完整的数据→分析→选题链路。

5. 多风格创作与自动发布

  • 以上一步选题分析为输入,Skill 自动生成多平台、多风格内容:
  • 一次生成:公众号文章、抖音脚本、小红书笔记等。
  • 多种写作调性:温柔、故事、犀利风格等。
  • 通过 Obsidian 插件或发布 Skill,一键发到公众号/小红书等平台。
  • 关键点:只要 Skill 的 YAML 描述写清楚用途和触发条件,Claude 可以通过语义理解自动决定用哪个发布 Skill,无需人工指定。
  • 整个内容生产链路可以做成定时任务,变成全自动内容工厂。

6. 定时任务与舆情监控

  • 在 Obsidian 里配置定时任务,比如每天 9 点自动执行某个内容/监控工作流。
  • 舆情监控流程:
  • 配关键词(如“AI Agent”)和平台(小红书、公众号、Twitter、抖音等)。
  • 定时抓取当天高赞内容。
  • Skill 做选题或舆情分析。
  • 通过飞书/钉钉 Skill 自动发布分析报告到群里,当日报用。
  • 选题分析和舆情分析的数据源相同,只是分析角度和提示词不同。
  • 总结:数据抓取、清洗、分析、报告、桌面自动化、社媒管理等只要流程可描述,就可以 Skill 化,Skill 的上限基本就是“你说得出流程的上限”。

三、智昊:Skills + Vibe Coding 的完整开发流程

7. Skills 安装与使用注意事项

  • 推荐用 skills.sh 的安装命令:‎⁠npx @anthropic-ai/skills add xxx⁠,在具体项目目录里执行。
  • 避免全局安装,建议每个项目单独安装所需 Skills。
  • 同一项目不要超过 10 个 Skills,避免“串 Skill”(职责混淆、调用乱)。
  • 不建议在 Skill 内部写“调用其他 Skill”的逻辑,容易形成循环;正确做法是在 AGENT.md / CLAUDE.md 顶层写清楚“什么时候用哪个 Skill”。
  • 如果自动激活失败,用斜杠命令(Slash Commands)手动调用:
  • 输入 ‎⁠/⁠,选 Skill 名,强制注入其上下文。
  • 自动激活依赖的是 YAML 的 name 和 description,当任务语义匹配时才会被自动加载。

8. Brainstorming PRD 的需求澄清工作流

  • 阶段目标:把“一个模糊想法”变成“结构化的业务需求文档 BRD/Requirements.md”。
  • 使用两个核心 Skills:
  • brainstorming:通过反向发问,一轮轮引导你澄清需求、场景、用户、输出形式等。
  • doc-coauthoring:把前面的对话整理成正式的 Markdown 文档。
  • 推荐在脑暴阶段使用上下文更长的模型(如 Gemini),确保长时间对话不丢信息。
  • 实践方式:
  • 新建需求目录,安装 brainstorming 和 doc-coauthoring。
  • 用 brainstorming 深挖需求,可以聊 10 分钟到数小时。
  • 完成后用 doc-coauthoring 产出 BRD(Requirements.md)。
  • 相比直接在网页端聊天,使用 Skill 的结构化输出和逻辑性会好得多。

9. Stitch 原型设计与复刻

  • 需求明确后,进入“从 BRD 到原型 + PRD”的阶段。
  • 流程:
  • 用 doc-coauthoring 逐页讨论 UI 结构(Homepage、列表页、详情页等)。
  • 得到包含 ASCII 2x2 格局说明、布局、内容、网格和技术要点的“文本原型”。
  • 把原型文本复制到 Stitch(AI 原型工具)里,自动生成可视化页面。
  • 在 Stitch 中编辑微调,支持明/暗主题切换。
  • 导出 HTML(或截图)作为后续开发和 PRD 的依据。
  • 再用 doc-coauthoring 基于 BRD + 原型,写完整 PRD:业务流程、UI/UX 要求、数据库结构、图片与 SEO 要求等。
  • 输出:原型设计(HTML/截图)+ 完整 PRD 文档。

10. 前端开发 Skills 三件套与质量审查

  • 前端开发阶段的核心 Skills:
  • web-design-guidelines:强制形成统一的“NavBar + 内容区域 + Footer”布局规范,避免每页重新写导航和页脚。
  • frontend-design:在 Stitch 原型基础上做二次视觉和交互设计调整。
  • shadcn-ui:指导 AI 严格按照 ShadCN/UI 组件规范开发,防止乱写自定义组件。
  • 开发完成后的审查 Skills:
  • react-best-practices:检查糟糕的组件结构、重复代码、不良配置等,给出修改建议。
  • seo-audit:做 SEO 检查,指出问题并指导修复。
  • 通过这几类 Skills,让 AI 既能“按规范搭建前端”,又有“代码质量和 SEO 的自动 QA”。

11. Vibe Coding 工作流总览

三个阶段 + 文件夹拆分:

  • 需求澄清(Requirements 文件夹)
  • Skills:brainstorming + doc-coauthoring
  • 输出:Requirements.md
  • 原型设计(Design 文件夹)
  • Skills:web-design-guidelines + doc-coauthoring + Stitch
  • 输出:页面原型(HTML/图)+ PRD.md
  • 开发实现(Develop 文件夹)
  • 技术:脚手架如 Next.js
  • Skills:web-design-guidelines + frontend-design + shadcn-ui + react-best-practices + seo-audit
  • 输出:可上线的完整网站代码

每个阶段只在对应目录安装当前需要的 Skills,互不干扰;每一步的产出就是下一步的输入,形成一条清晰的“想法 → BRD → 原型 → PRD → 代码 → 审查 → 上线”的流水线。

12. Skill 集成与 Agent Browser

  • 多个 Skills 协同工作时,不要在 Skill 内嵌调用链,而是在 CLAUDE.md/AGENT.md 里写“Skill Using Guide”,用自然语言描述执行顺序:
  • 如:先 brainstorming → 再 doc-coauthoring → 再 web-design-guidelines → 再 frontend-design → 再 react-best-practices → 再 seo-audit。
  • 这样可以让 AI 在全局上下文中理解什么时候调用哪个 Skill。
  • Agent Browser:
  • 是一种更省 Token 的网页浏览/操作工具,比 Chrome MCP 更轻量。
  • 适合浏览网页、点击按钮、截图、写操作记录;不适合需要 DevTools 的调试(那要用 Chrome MCP)。
  • 复刻一个 SaaS 产品时,建议“人先全点一遍,Agent Browser 再点一遍并生成完整操作记录”,两者对比后再用操作记录写 PRD。

四、成峰:剪辑 Agent 的设计、训练与自进化

13. 剪辑 Agent 的设计理念与自进化

  • 剪辑 Agent 的定位:Agent 主导、人类审核,而不是“人主导、工具辅助”的剪映模式。
  • 核心设计:
  • 自进化机制:当 Agent 表现不好时,让 AI 自己定位问题文件并修改 Skill;越用越懂你的习惯。
  • 每次执行都参考用户习惯文档(大量小文件),逐步贴合个人剪辑风格。
  • 与剪映的对比:
  • 剪映使用脚本+规则,很多语义重复、口误抓不到。
  • 剪辑 Agent 逐句语义分析,能识别内容重复或表达冗余。
  • 代价是更慢,但换来更高准确率和自动化程度。

14. 火山引擎模型配置与剪辑 Skills 安装

  • 语音识别用的是字节火山引擎(剪映同源)的云端模型:
  • 新用户有 20 小时免费,之后约 5 元/小时。
  • 安装路径:
  • 把安装指令交给 Claude Code,它自动下载剪辑 Skills。
  • 前往火山控制台开通“音视频字幕生成”,在“模型管理”创建应用并拿到 API Key。
  • 在 Claude 中执行剪辑安装 Skill(如 ‎⁠/v videocut:安装⁠),输入 API Key,AI 自动安装本地依赖。
  • 重启 Claude Code,输入 ‎⁠/v⁠,可以看到所有以 v 开头的剪辑 Skills。
  • 所有 Skill 通过 skill.md 的 name 字段识别,可以自定义名称,但成峰统一以 v 开头以便管理。

15. 智能审核稿交互界面

  • Agent 分析完视频后,会生成一个本地审核页面链接,比纯文字交互更直观:
  • 红色标记:口误、重复片段。
  • 灰色标记:静音片段。
  • 单击标记可跳转播放对应片段。
  • 核心功能:
  • 跳过已选删除片段的“净片段”播放。
  • 倍速播放,提升审核效率。
  • 复制删除列表,作为反馈给 AI 学习。
  • 一键执行剪辑,应用删除方案。
  • 不满意时,可以:
  • 让 Agent “再仔细识别一遍”。
  • 手动标记漏掉的片段,把删除列表回传给 Agent,让它分析改进规则。

16. 用户习惯训练与自更新反馈

  • 自更新机制流程:
  • 用户反馈(描述问题、改阈值、提供删除列表)。
  • Agent 用自更新 Skill 分析:问题属于哪个 Skill 文件/规则。
  • Agent 自动修改相应 Skill 或配置。
  • 下次执行立刻生效。
  • 反馈类型示例:
  • 静音阈值调整(例如改成 1 秒)。
  • 保留一定“嗯”等口头禅作为自然过渡。
  • 专有词纠错。
  • 用“遗漏删除列表”让 Agent 学会新的识别模式。
  • 用户习惯以“一条信息一文件”的方式独立存储,避免互相覆盖或混乱。
  • 经验值:使用约 10 次,Agent 能掌握你 80% 的习惯;50 次后能高度符合个人偏好。

17. 字幕字典与自动纠错

  • 自定义词典是提升字幕准确率的关键:
  • 词典文件在特定剪辑 Skill 的目录下,每行一个专有名词。
  • Agent 会用词典对 ASR 原始识别结果做纠错:
  • 人名、品牌名不被误写。
  • 大小写规范自动统一(如 agent→Agent)。
  • 生成字幕流程:
  • Whisper/火山模型识别音频。
  • 对照词典自动纠错。
  • 生成字幕文件并提供预览界面,可手动修订。
  • 确认后烧录到视频。
  • 与剪映的差异点:剪映不支持自定义词典,而剪辑 Agent 可以针对领域术语、品牌、口头禅进行长期积累。

18. Skills 设计五步法与方法论

  • 核心理念:80% 时间花在研究方法论和需求表达,20% 留给执行;执行尽量让 Agent 来做
  • 为什么要 Skill 化而不是写长 Prompt:
  • Prompt 太长、上下文有限,容易被截断。
  • 每次修改复杂,要手动重发或复制粘贴。
  • Skill 有文件结构、关键词自动识别和按需加载,更节省 Token,也更稳定。
  • Skills 设计五步法:
  • 原理研究:先理解业务/工具的底层逻辑,再设计 Skill(如剪辑流程的本质)。
  • 热加载:利用 Skill 热加载能力,频繁、小步快调;改文档就立即生效。
  • 反馈机制:设计从使用到反馈的路径,每次使用都能把问题回流给 Agent。
  • 数据驱动优化:不仅靠主观反馈,还把客观数据(如内容表现、观看数据)反馈给 Agent 调整 Skill。
  • 自更新闭环:让“使用→结果→反馈→分析→更新→再使用”变成自动循环。
  • 总目标:让所有重复性的“执行层操作”固化为 Skills,Agent 持续学习、自我调整,人长期停留在策略设计和方法论层面。

五、附录:资源、安装与常见问题

  • 资源清单:
  • Skills 聚合平台:
  • 另一聚合平台:
  • 官方 Skills 仓库:
  • 成峰剪辑 Skills:
  • 安装注意三原则:
  • 不要装太多(同一项目 ≤ 10 个)。
  • 不要 Skill 套 Skill(调用链写在 AGENT.md,而不是 Skill 内部)。
  • 在 AGENT.md 清晰声明“什么场景用什么 Skill”。
  • Skills 目录结构(项目级):
  • ‎⁠.claude/skills/skill-name/⁠ 下包含 skill.md、script、reference。
  • 根目录有 CLAUDE.md(全局配置)和 AGENT.md(Agent 配置与调用逻辑)。
  • 常见问题:
  • 安装失败:检查网络、Node.js ≥ 20、必要时用代理。
  • Skill 未激活:检查目录、重启、用 ‎⁠/⁠ 命令看是否在列表里、用 Slash Commands 明文调用。
  • Skill vs Plugin(MCP)的区别:
  • Skill:提示词+SOP,指导 AI“怎么做”。
  • Plugin/MCP:外部服务接口,让 AI“能调用什么”。
  • 剪辑 Agent 报错:检查火山 API Key、视频路径、确认已正常执行过 ‎⁠/v videocut:安装⁠。
  • 国内模型:Kimi、智谱、Minimax 等均可运行 Skills,可配合 CC Switch 做模型/中转切换。

整体来看,这个页面把 Skills 当成“AI 时代的新型应用形态”,从内容生产到产品开发再到视频剪辑,给出了一整套:概念对比、安装规范、典型工作流案例、Skill 设计与自进化的实践方法。