Skip to content

Skill 工程速查

快速查阅 Skill 设计决策。按章节顺序阅读。


🔧 Skill vs Tool:什么时候用哪个?

维度Tool(工具)Skill(技能)
类比烤箱食谱
本质单一原子操作可复用的过程知识
输入简单参数(城市名、ID)上下文 + 约束 + 多个步骤
输出确定性结果可能有分支的流程
复杂度中-高
复用性跨任务复用跨 Agent 复用
何时用操作明确、步骤固定需要判断和决策的过程
例子get_weather(city)review_code(file, criteria)

💡 判断标准:如果 Agent 需要"思考"才能完成的任务,用 Skill。如果只是"执行",用 Tool。


📚 三层渐进式披露机制

机制全景

各层详细对照

层级内容何时加载Token 消耗类比
Level 1Skill 名称 + 一行描述 + 可用标签每次对话开始~100 tokens菜单目录
Level 2SKILL.md 完整说明(参数、用法、约束)Agent 选择该 Skill 时~500-2000 tokens菜单详情页
Level 3辅助脚本、配置文件、模板Agent 需要执行时按需加载厨房里的食材
Level 4+外部 API 调用、数据库查询实际执行时按需加载外卖订单

为什么分层加载?

💡 核心洞察:一次性加载所有 Skill 说明 = 把整本百科全书塞进上下文。Agent 会被信息淹没,关键指令反而被稀释。渐进式披露让 Agent 只看到当前需要的信息,其余保持在"附近但不在眼前"的状态。


🛡️ 安全三原则

原则做法为什么重要
可信来源只使用官方/已验证的 Skill 包恶意 Skill 可能注入后门
最小权限Skill 只能访问完成任务必需的资源减小攻击面
审计记录记录每次 Skill 的调用和结果出问题可追溯

✅ Skill 开发四原则

原则说明实践要点
从评估开始先定义"怎么算用对了"写评估标准 > 写 Skill 本身
为规模设计考虑多个 Agent 同时使用冲突检测、版本管理
从 Agent 视角出发以 Agent 能理解的方式组织用 Seeing Like an Agent 原则
人机共创人类和 Agent 协作设计人类定标准,Agent 实现细节

🧩 Skill 设计检查清单

  • [ ] SKILL.md 存在且结构清晰?
  • [ ] 包含 Instructions + Scripts + Resources 三要素?
  • [ ] Level 1 元数据简洁(名称 + 一行描述 + 可用标签)?
  • [ ] Level 2 说明详细但不冗长(参数、用法、约束、输出格式)?
  • [ ] 有评估标准(怎么算用对了、怎么算失败)?
  • [ ] 渐进式披露已实现(不一次性加载全部资源)?
  • [ ] 安全考虑(操作不可逆?需要沙箱?需要审批?)?
  • [ ] 有 Few-shot 示例(3-5 个好的输入/输出对)?
  • [ ] 有错误处理指引(什么错误可以重试、什么错误应该停止)?

🔮 Skill 的未来形态

趋势说明影响
与 MCP 结合Skill 通过 MCP 协议标准化分发跨平台 Skill 市场
共享发现Agent 之间互相学习 SkillSkill 生态形成
自主创建Agent 根据任务自动创建 SkillSkill 不再是人类写的
Skill 编排多个 Skill 组合执行复杂任务类似 API Gateway

基于 CC BY-SA 4.0 协议发布