Superpowers:把 Coding Agent 拉回工程流程的技能框架

整理 obra/superpowers 项目的定位、安装入口、基础工作流、技能库和使用边界。它把 brainstorming、planning、TDD、code review、worktree 和 subagent 流程组合成一套 coding agent 方法论。

obra/superpowers 是一个给 coding agent 使用的技能框架,也是一套软件开发方法论。它的目标不是再写一个“让 AI 更听话”的万能 prompt,而是把 agent 的工作流程固定下来:先澄清目标,再产出设计,再拆计划,再按测试驱动开发推进,最后做 review 和收尾。

项目地址:https://github.com/obra/superpowers

截至写作时,GitHub API 显示这个仓库已有超过 19 万 star,许可证为 MIT,最近仍在更新。README 对它的描述很直接:An agentic skills framework & software development methodology that works.

它想解决什么问题

现在很多 AI 编程工具的问题,不是“不够会写代码”,而是太容易直接写代码。

用户刚说一个模糊需求,agent 就开始改文件;改完以后看似完成,其实边界没对齐、测试没补、架构没想清楚。短任务可能没事,复杂项目里就会变成返工、回滚和技术债。

Superpowers 的思路是:让 agent 在动手前先进入流程。

README 里描述的核心路径大致是:

  1. 发现用户要做东西时,不立刻写代码,而是先追问目标。
  2. 从对话中整理出规格说明,并分段给用户确认。
  3. 设计通过后,生成足够清楚的实施计划。
  4. 用户说 “go” 之后,再进入实现流程。
  5. 实现时强调 TDD、YAGNI、DRY,并通过 review 检查结果。

这套流程听起来不新,但放到 coding agent 里很关键。AI 的执行速度越快,前置澄清和中途验证越重要。

支持哪些工具

Superpowers 不是只面向一个 agent。README 里列出的安装入口包括:

  • Claude Code
  • Codex CLI
  • Codex App
  • Factory Droid
  • Gemini CLI
  • OpenCode
  • Cursor
  • GitHub Copilot CLI

其中 Codex CLI 和 Codex App 都可以通过官方 Codex plugin marketplace 安装。Claude Code 也可以通过官方插件市场或 Superpowers 自己的 marketplace 安装。

这说明它的定位更像“跨 harness 的工作流层”,而不是绑定某一家模型或某一个命令行工具。

基础工作流

Superpowers 的基础工作流分成几个阶段。

第一步是 brainstorming。它会在写代码前触发,通过问题把粗糙想法整理成可执行设计。它不是让 agent 自嗨式补全需求,而是把设计分段拿给用户确认。

第二步是 using-git-worktrees。设计确认后,它会创建隔离的工作区和新分支,先确认项目能正常安装、测试基线是干净的。这一步能减少多个任务互相污染工作区的问题。

第三步是 writing-plans。它会把设计拆成短小任务,每个任务要求有明确文件路径、代码范围和验证步骤。README 里甚至把计划写给“没有上下文、品味可疑、不爱测试的热情初级工程师”也能执行,当作清晰度标准。

第四步是实现。它可以用 subagent-driven-development 派发子任务,也可以用 executing-plans 分批执行。重点不是并发本身,而是每个任务都要能检查、能 review、能继续推进。

第五步是 test-driven-development。Superpowers 强调真正的 RED-GREEN-REFACTOR:先写失败测试,确认失败,再写最小实现,确认通过,然后重构。它甚至要求删除测试前写出来的实现代码,避免“先实现后补测试”的假 TDD。

第六步是 requesting-code-review。任务之间做 review,按严重程度报告问题。Critical 问题会阻塞继续推进。

最后是 finishing-a-development-branch。任务结束后,验证测试,给出合并、发 PR、保留或丢弃 worktree 的选择。

Skills Library 里有什么

Superpowers 的技能库可以分成几类。

测试类主要是 test-driven-development,围绕红绿重构循环,并包含测试反模式参考。

调试类包括 systematic-debuggingverification-before-completion。前者要求按复现、最小化、假设、验证、修复的过程找根因;后者强调不要在没有验证前宣布完成。

协作类更丰富,包括:

  • brainstorming
  • writing-plans
  • executing-plans
  • dispatching-parallel-agents
  • requesting-code-review
  • receiving-code-review
  • using-git-worktrees
  • finishing-a-development-branch
  • subagent-driven-development

元技能包括 writing-skillsusing-superpowers。前者用于创建新技能,后者用于理解技能系统本身。

这些技能组合起来,像是给 agent 装了一套工程习惯:什么时候该问,什么时候该计划,什么时候该测试,什么时候该停下来 review。

和普通 prompt 最大的区别

普通 prompt 往往把规则堆在一段 system prompt 里:不要乱改、先思考、要测试、要解释、要简洁。问题是规则越堆越多,模型越容易在复杂任务里选择性遗忘。

Superpowers 更像把规则拆成可触发的流程模块。不同任务阶段使用不同技能,每个技能只负责一段工作。这样做有几个好处:

  • 规则更短,目标更集中。
  • agent 更容易知道当前阶段该做什么。
  • 复杂流程可以被拆成可检查的步骤。
  • 技能可以跨工具复用。
  • 团队可以把自己的工程习惯沉淀成技能。

这也是它最值得参考的地方:不要只追求“更聪明的模型”,还要给模型一套可重复的工作方式。

适合谁用

Superpowers 更适合已经在认真使用 coding agent 的开发者,尤其是这些场景:

  • 任务不只是单文件改动。
  • 希望 agent 先设计再实现。
  • 项目需要 TDD 或至少需要验证步骤。
  • 经常并行做多个功能分支。
  • 希望用 subagent 分摊实现、检查和 review。
  • 想把团队流程写成可复用技能。

如果只是让 AI 改一行配置、生成一个脚本,它可能显得偏重。但一旦任务涉及多文件、多阶段、多轮确认,它的流程约束就会变得有价值。

使用时要注意什么

第一,不要把它理解成自动驾驶。Superpowers 能让 agent 更有流程感,但设计取舍、需求边界和最终验收仍然需要人负责。

第二,TDD 和 review 会增加前期成本。小任务可能会变慢,但复杂任务通常能减少返工。

第三,子代理并发不是越多越好。并发适合边界清楚、写入范围不重叠的任务;如果需求还没想清楚,先并发只会把混乱放大。

第四,团队要维护自己的技能质量。技能不是写完就万事大吉,过时的流程、模糊的指令和互相冲突的规则,也会拖累 agent。

小结

Superpowers 的价值,不在于某个单独技能多神奇,而在于它把 coding agent 从“接到需求就写代码”拉回了软件工程流程。

它提醒我们:AI 编程真正缺的往往不是生成速度,而是澄清、计划、验证、review 和收尾。模型越强,这些流程越不能省。否则 AI 只是更快地制造未验证的代码。

如果你已经在用 Codex、Claude Code、Cursor 或 Gemini CLI 做真实项目,Superpowers 值得看一眼。即使不直接安装,它的技能拆分方式也很适合拿来改造自己的 agent 工作流。

记录并分享
使用 Hugo 构建
主题 StackJimmy 设计