obra/superpowers 是一个给 coding agent 使用的技能框架,也是一套软件开发方法论。它的目标不是再写一个“让 AI 更听话”的万能 prompt,而是把 agent 的工作流程固定下来:先澄清目标,再产出设计,再拆计划,再按测试驱动开发推进,最后做 review 和收尾。
项目地址:https://github.com/obra/superpowers
截至写作时,GitHub API 显示这个仓库已有超过 19 万 star,许可证为 MIT,最近仍在更新。README 对它的描述很直接:An agentic skills framework & software development methodology that works.
它想解决什么问题
现在很多 AI 编程工具的问题,不是“不够会写代码”,而是太容易直接写代码。
用户刚说一个模糊需求,agent 就开始改文件;改完以后看似完成,其实边界没对齐、测试没补、架构没想清楚。短任务可能没事,复杂项目里就会变成返工、回滚和技术债。
Superpowers 的思路是:让 agent 在动手前先进入流程。
README 里描述的核心路径大致是:
- 发现用户要做东西时,不立刻写代码,而是先追问目标。
- 从对话中整理出规格说明,并分段给用户确认。
- 设计通过后,生成足够清楚的实施计划。
- 用户说 “go” 之后,再进入实现流程。
- 实现时强调 TDD、YAGNI、DRY,并通过 review 检查结果。
这套流程听起来不新,但放到 coding agent 里很关键。AI 的执行速度越快,前置澄清和中途验证越重要。
支持哪些工具
Superpowers 不是只面向一个 agent。README 里列出的安装入口包括:
- Claude Code
- Codex CLI
- Codex App
- Factory Droid
- Gemini CLI
- OpenCode
- Cursor
- GitHub Copilot CLI
其中 Codex CLI 和 Codex App 都可以通过官方 Codex plugin marketplace 安装。Claude Code 也可以通过官方插件市场或 Superpowers 自己的 marketplace 安装。
这说明它的定位更像“跨 harness 的工作流层”,而不是绑定某一家模型或某一个命令行工具。
基础工作流
Superpowers 的基础工作流分成几个阶段。
第一步是 brainstorming。它会在写代码前触发,通过问题把粗糙想法整理成可执行设计。它不是让 agent 自嗨式补全需求,而是把设计分段拿给用户确认。
第二步是 using-git-worktrees。设计确认后,它会创建隔离的工作区和新分支,先确认项目能正常安装、测试基线是干净的。这一步能减少多个任务互相污染工作区的问题。
第三步是 writing-plans。它会把设计拆成短小任务,每个任务要求有明确文件路径、代码范围和验证步骤。README 里甚至把计划写给“没有上下文、品味可疑、不爱测试的热情初级工程师”也能执行,当作清晰度标准。
第四步是实现。它可以用 subagent-driven-development 派发子任务,也可以用 executing-plans 分批执行。重点不是并发本身,而是每个任务都要能检查、能 review、能继续推进。
第五步是 test-driven-development。Superpowers 强调真正的 RED-GREEN-REFACTOR:先写失败测试,确认失败,再写最小实现,确认通过,然后重构。它甚至要求删除测试前写出来的实现代码,避免“先实现后补测试”的假 TDD。
第六步是 requesting-code-review。任务之间做 review,按严重程度报告问题。Critical 问题会阻塞继续推进。
最后是 finishing-a-development-branch。任务结束后,验证测试,给出合并、发 PR、保留或丢弃 worktree 的选择。
Skills Library 里有什么
Superpowers 的技能库可以分成几类。
测试类主要是 test-driven-development,围绕红绿重构循环,并包含测试反模式参考。
调试类包括 systematic-debugging 和 verification-before-completion。前者要求按复现、最小化、假设、验证、修复的过程找根因;后者强调不要在没有验证前宣布完成。
协作类更丰富,包括:
brainstormingwriting-plansexecuting-plansdispatching-parallel-agentsrequesting-code-reviewreceiving-code-reviewusing-git-worktreesfinishing-a-development-branchsubagent-driven-development
元技能包括 writing-skills 和 using-superpowers。前者用于创建新技能,后者用于理解技能系统本身。
这些技能组合起来,像是给 agent 装了一套工程习惯:什么时候该问,什么时候该计划,什么时候该测试,什么时候该停下来 review。
和普通 prompt 最大的区别
普通 prompt 往往把规则堆在一段 system prompt 里:不要乱改、先思考、要测试、要解释、要简洁。问题是规则越堆越多,模型越容易在复杂任务里选择性遗忘。
Superpowers 更像把规则拆成可触发的流程模块。不同任务阶段使用不同技能,每个技能只负责一段工作。这样做有几个好处:
- 规则更短,目标更集中。
- agent 更容易知道当前阶段该做什么。
- 复杂流程可以被拆成可检查的步骤。
- 技能可以跨工具复用。
- 团队可以把自己的工程习惯沉淀成技能。
这也是它最值得参考的地方:不要只追求“更聪明的模型”,还要给模型一套可重复的工作方式。
适合谁用
Superpowers 更适合已经在认真使用 coding agent 的开发者,尤其是这些场景:
- 任务不只是单文件改动。
- 希望 agent 先设计再实现。
- 项目需要 TDD 或至少需要验证步骤。
- 经常并行做多个功能分支。
- 希望用 subagent 分摊实现、检查和 review。
- 想把团队流程写成可复用技能。
如果只是让 AI 改一行配置、生成一个脚本,它可能显得偏重。但一旦任务涉及多文件、多阶段、多轮确认,它的流程约束就会变得有价值。
使用时要注意什么
第一,不要把它理解成自动驾驶。Superpowers 能让 agent 更有流程感,但设计取舍、需求边界和最终验收仍然需要人负责。
第二,TDD 和 review 会增加前期成本。小任务可能会变慢,但复杂任务通常能减少返工。
第三,子代理并发不是越多越好。并发适合边界清楚、写入范围不重叠的任务;如果需求还没想清楚,先并发只会把混乱放大。
第四,团队要维护自己的技能质量。技能不是写完就万事大吉,过时的流程、模糊的指令和互相冲突的规则,也会拖累 agent。
小结
Superpowers 的价值,不在于某个单独技能多神奇,而在于它把 coding agent 从“接到需求就写代码”拉回了软件工程流程。
它提醒我们:AI 编程真正缺的往往不是生成速度,而是澄清、计划、验证、review 和收尾。模型越强,这些流程越不能省。否则 AI 只是更快地制造未验证的代码。
如果你已经在用 Codex、Claude Code、Cursor 或 Gemini CLI 做真实项目,Superpowers 值得看一眼。即使不直接安装,它的技能拆分方式也很适合拿来改造自己的 agent 工作流。