AI 做 PPT 已经不只是“输入标题,套一个模板”。在 Claude Code、Codex、Cursor 这类 AI 编程环境里,PPT 生成正在变成一组可安装、可复用的 Agent Skill:有的输出网页演示,有的生成真正可编辑的 .pptx,有的直接用图像模型把每页做成视觉稿,还有的通过 MCP 让 AI 操作 PowerPoint 文件。
这次整理了一批主流 PPT 相关 Skill。真正有价值的地方不只是榜单,而是把这类工具按交付形态拆开来看。选工具前,先问一句:最终交付物到底要给谁改、在哪里播放、是否需要继续协作?
几条路线
1. HTML 网页演示
代表项目包括 frontend-slides、guizang-ppt-skill、html-ppt-skill。
这条路线的优势是视觉表现力强。CSS 动画、Canvas、WebGL、响应式布局都能用,浏览器打开即可演示,适合技术分享、产品发布、Demo Day 和个人风格强烈的演讲。
代价也很明确:交付后不太适合让客户逐字改。客户如果拿到的是 HTML,而不是 PowerPoint 文件,后续修改往往还要回到生成流程。
如果只看 HTML 演示,frontend-slides 更像高星通用入口,guizang-ppt-skill 强在审美约束和主题风格,html-ppt-skill 则胜在主题数量、布局数量和演讲者模式。
2. 原生 PPTX
代表项目包括 mckinsey-pptx、ppt-agent-skills、claude-office-skills 和 ppt-master。
这是商业交付最稳的路线。只要客户要求“能在 PowerPoint 里改字、改图、套公司模板”,最终就要落到 .pptx。
其中 ppt-master 很值得单独关注。它的思路是先让 LLM 生成 SVG,再转成 PowerPoint 原生 DrawingML 对象,目标是让文字框、形状、图表都能在 PPTX 里继续编辑。它还支持从 PDF、DOCX、URL、Markdown 生成 PPTX,并能做模板复刻、动画、旁白和本地预览。
这条路线适合咨询交付、公司汇报、白皮书演示、长报告压缩成 PPT 等场景。缺点是视觉上限通常受 PowerPoint 本身限制,复杂效果不如 HTML 或图像路线自由。
3. AI 图像驱动
代表项目包括 NanoBanana-PPT-Skills、gpt_image_2_skill 和 ppt-image-first。
这条路线先把每一页当成视觉图来生成,再把图片放进 PPTX 或其它容器里。优点是完成度高,尤其适合封面、社交媒体图、视觉提案、传播型内容。
问题是可编辑性差。页面本质上是一张图,后面要改一个标题、换一段文案、挪一个图标,可能就要重新生成。它适合“看起来要好”,不适合“客户要反复改”。
4. MCP / 协议层
代表项目包括 Office-PowerPoint-MCP-Server、PPTAgent。
这类工具不一定直接生成完整 PPT,而是给 AI 一个操作 PowerPoint 的接口。接入 MCP 后,模型可以读、改、写 .pptx 文件。
这条路线适合已经有 PPT 文件、需要 AI 辅助修改的工作流。比如批量改格式、根据反馈重排页面、让模型检查每页是否符合目标。PPTAgent 强调反思式生成,也就是每生成一页后再回头检查,这个方向对减少“AI PPT 很粗糙”的问题有启发。
5. 综合设计平台
代表项目包括 open-design 和 docsagent。
这类项目已经超出 PPT 生成本身。open-design 更像本地优先的设计平台,可以生成原型、slides、images、videos,并支持多种导出格式。docsagent 不是 PPT 工具,但能索引和对话本地文档,适合作为 PPT 生成前的资料整理层。
如果你的需求不是单次做 PPT,而是从资料、设计、原型到交付的一整套流程,这类平台更值得看。
Skill 元信息
Star 数来自原文 2026-05-15 的抓取结果,只适合作为热度参考,实际使用前建议再打开仓库确认维护状态、README 和 LICENSE。
| Skill | 作者 | 链接地址 | Star | 语言 | 路线 |
|---|---|---|---|---|---|
| frontend-slides | @zarazhangrui | https://github.com/zarazhangrui/frontend-slides | 17,530 | Shell | HTML 网页演示 |
| guizang-ppt-skill | @op7418(歸藏) | 站内文章 GitHub |
8,832 | HTML | HTML 网页演示 |
| html-ppt-skill | @lewislulu | https://github.com/lewislulu/html-ppt-skill | 3,834 | HTML/CSS/JS | HTML 网页演示 |
| mckinsey-pptx | @seulee26 | https://github.com/seulee26/mckinsey-pptx | 426 | Python | 原生 PPTX |
| ppt-agent-skills | @sunbigfly | https://github.com/sunbigfly/ppt-agent-skills | 714 | Python | 原生 PPTX |
| claude-office-skills | @tfriedel | https://github.com/tfriedel/claude-office-skills | 631 | Python | 原生 PPTX |
| ppt-master | @hugohe3 | https://github.com/hugohe3/ppt-master | 16,626 | Python | 原生 PPTX |
| NanoBanana-PPT-Skills | @op7418(歸藏) | https://github.com/op7418/NanoBanana-PPT-Skills | 2,668 | Python | AI 图像驱动 |
| gpt_image_2_skill | @wuyoscar | https://github.com/wuyoscar/gpt_image_2_skill | 2,102 | Python | AI 图像驱动 |
| ppt-image-first | @NyxTides | https://github.com/NyxTides/ppt-image-first | 799 | Python | AI 图像驱动 |
| Office-PowerPoint-MCP-Server | @GongRzhe | https://github.com/GongRzhe/Office-PowerPoint-MCP-Server | 1,708 | Python | MCP / 协议层 |
| PPTAgent | @icip-cas | https://github.com/icip-cas/PPTAgent | 4,354 | Python | MCP / 协议层 |
| open-design | @nexu-io | 站内文章 GitHub |
40,822 | TypeScript | 综合设计平台 |
| docsagent | @docsagent | https://github.com/docsagent/docsagent | 687 | TypeScript | 综合设计平台 |
选型可以这样判断
如果客户要继续编辑,优先看原生 PPTX 路线,尤其是 ppt-master、mckinsey-pptx、ppt-agent-skills。
如果是自己演讲,且视觉表现比后续编辑更重要,优先看 HTML 路线,尤其是 frontend-slides、guizang-ppt-skill、html-ppt-skill。
如果目标是海报感、封面感、传播图,优先看图像路线,比如 ppt-image-first、gpt_image_2_skill、NanoBanana-PPT-Skills。
如果已经有 PPT 文件,只想让 AI 帮你读、改、重排,可以看 MCP 路线。
如果是学术、营销、翻译、长报告压缩这类明确场景,也可以继续找垂直 Skill,而不是拿通用 PPT 生成器硬做。
最后要注意的事
开源项目不能只看 Star。真正使用前还要确认三件事:
- LICENSE 是否允许你的使用方式。
- 生成物是否满足交付要求,尤其是可编辑性。
- 成本是否可接受,包括模型调用、图像生成、大上下文模型和可能的云服务费用。
这类工具变化很快,Star 数会变,项目维护状态也会变。但选型逻辑相对稳定:先确定交付形态,再看具体工具。PPT 是给人讲、给人改、还是给人看,这三个答案往往会把选择范围直接缩小一大半。