市面上主流 AI PPT 工具大盘点:自动生成、网页演示、PPTX 和图像路线怎么选

基于主流 PPT 生成 Skill 的盘点,按 HTML 演示、原生 PPTX、AI 图像、MCP 协议和综合设计平台几条路线整理选型思路。

AI 做 PPT 已经不只是“输入标题,套一个模板”。在 Claude Code、Codex、Cursor 这类 AI 编程环境里,PPT 生成正在变成一组可安装、可复用的 Agent Skill:有的输出网页演示,有的生成真正可编辑的 .pptx,有的直接用图像模型把每页做成视觉稿,还有的通过 MCP 让 AI 操作 PowerPoint 文件。

这次整理了一批主流 PPT 相关 Skill。真正有价值的地方不只是榜单,而是把这类工具按交付形态拆开来看。选工具前,先问一句:最终交付物到底要给谁改、在哪里播放、是否需要继续协作?

几条路线

1. HTML 网页演示

代表项目包括 frontend-slidesguizang-ppt-skillhtml-ppt-skill

这条路线的优势是视觉表现力强。CSS 动画、Canvas、WebGL、响应式布局都能用,浏览器打开即可演示,适合技术分享、产品发布、Demo Day 和个人风格强烈的演讲。

代价也很明确:交付后不太适合让客户逐字改。客户如果拿到的是 HTML,而不是 PowerPoint 文件,后续修改往往还要回到生成流程。

如果只看 HTML 演示,frontend-slides 更像高星通用入口,guizang-ppt-skill 强在审美约束和主题风格,html-ppt-skill 则胜在主题数量、布局数量和演讲者模式。

2. 原生 PPTX

代表项目包括 mckinsey-pptxppt-agent-skillsclaude-office-skillsppt-master

这是商业交付最稳的路线。只要客户要求“能在 PowerPoint 里改字、改图、套公司模板”,最终就要落到 .pptx

其中 ppt-master 很值得单独关注。它的思路是先让 LLM 生成 SVG,再转成 PowerPoint 原生 DrawingML 对象,目标是让文字框、形状、图表都能在 PPTX 里继续编辑。它还支持从 PDF、DOCX、URL、Markdown 生成 PPTX,并能做模板复刻、动画、旁白和本地预览。

这条路线适合咨询交付、公司汇报、白皮书演示、长报告压缩成 PPT 等场景。缺点是视觉上限通常受 PowerPoint 本身限制,复杂效果不如 HTML 或图像路线自由。

3. AI 图像驱动

代表项目包括 NanoBanana-PPT-Skillsgpt_image_2_skillppt-image-first

这条路线先把每一页当成视觉图来生成,再把图片放进 PPTX 或其它容器里。优点是完成度高,尤其适合封面、社交媒体图、视觉提案、传播型内容。

问题是可编辑性差。页面本质上是一张图,后面要改一个标题、换一段文案、挪一个图标,可能就要重新生成。它适合“看起来要好”,不适合“客户要反复改”。

4. MCP / 协议层

代表项目包括 Office-PowerPoint-MCP-ServerPPTAgent

这类工具不一定直接生成完整 PPT,而是给 AI 一个操作 PowerPoint 的接口。接入 MCP 后,模型可以读、改、写 .pptx 文件。

这条路线适合已经有 PPT 文件、需要 AI 辅助修改的工作流。比如批量改格式、根据反馈重排页面、让模型检查每页是否符合目标。PPTAgent 强调反思式生成,也就是每生成一页后再回头检查,这个方向对减少“AI PPT 很粗糙”的问题有启发。

5. 综合设计平台

代表项目包括 open-designdocsagent

这类项目已经超出 PPT 生成本身。open-design 更像本地优先的设计平台,可以生成原型、slides、images、videos,并支持多种导出格式。docsagent 不是 PPT 工具,但能索引和对话本地文档,适合作为 PPT 生成前的资料整理层。

如果你的需求不是单次做 PPT,而是从资料、设计、原型到交付的一整套流程,这类平台更值得看。

Skill 元信息

Star 数来自原文 2026-05-15 的抓取结果,只适合作为热度参考,实际使用前建议再打开仓库确认维护状态、README 和 LICENSE。

Skill 作者 链接地址 Star 语言 路线
frontend-slides @zarazhangrui https://github.com/zarazhangrui/frontend-slides 17,530 Shell HTML 网页演示
guizang-ppt-skill @op7418(歸藏) 站内文章
GitHub
8,832 HTML HTML 网页演示
html-ppt-skill @lewislulu https://github.com/lewislulu/html-ppt-skill 3,834 HTML/CSS/JS HTML 网页演示
mckinsey-pptx @seulee26 https://github.com/seulee26/mckinsey-pptx 426 Python 原生 PPTX
ppt-agent-skills @sunbigfly https://github.com/sunbigfly/ppt-agent-skills 714 Python 原生 PPTX
claude-office-skills @tfriedel https://github.com/tfriedel/claude-office-skills 631 Python 原生 PPTX
ppt-master @hugohe3 https://github.com/hugohe3/ppt-master 16,626 Python 原生 PPTX
NanoBanana-PPT-Skills @op7418(歸藏) https://github.com/op7418/NanoBanana-PPT-Skills 2,668 Python AI 图像驱动
gpt_image_2_skill @wuyoscar https://github.com/wuyoscar/gpt_image_2_skill 2,102 Python AI 图像驱动
ppt-image-first @NyxTides https://github.com/NyxTides/ppt-image-first 799 Python AI 图像驱动
Office-PowerPoint-MCP-Server @GongRzhe https://github.com/GongRzhe/Office-PowerPoint-MCP-Server 1,708 Python MCP / 协议层
PPTAgent @icip-cas https://github.com/icip-cas/PPTAgent 4,354 Python MCP / 协议层
open-design @nexu-io 站内文章
GitHub
40,822 TypeScript 综合设计平台
docsagent @docsagent https://github.com/docsagent/docsagent 687 TypeScript 综合设计平台

选型可以这样判断

如果客户要继续编辑,优先看原生 PPTX 路线,尤其是 ppt-mastermckinsey-pptxppt-agent-skills

如果是自己演讲,且视觉表现比后续编辑更重要,优先看 HTML 路线,尤其是 frontend-slidesguizang-ppt-skillhtml-ppt-skill

如果目标是海报感、封面感、传播图,优先看图像路线,比如 ppt-image-firstgpt_image_2_skillNanoBanana-PPT-Skills

如果已经有 PPT 文件,只想让 AI 帮你读、改、重排,可以看 MCP 路线。

如果是学术、营销、翻译、长报告压缩这类明确场景,也可以继续找垂直 Skill,而不是拿通用 PPT 生成器硬做。

最后要注意的事

开源项目不能只看 Star。真正使用前还要确认三件事:

  • LICENSE 是否允许你的使用方式。
  • 生成物是否满足交付要求,尤其是可编辑性。
  • 成本是否可接受,包括模型调用、图像生成、大上下文模型和可能的云服务费用。

这类工具变化很快,Star 数会变,项目维护状态也会变。但选型逻辑相对稳定:先确定交付形态,再看具体工具。PPT 是给人讲、给人改、还是给人看,这三个答案往往会把选择范围直接缩小一大半。

记录并分享
使用 Hugo 构建
主题 StackJimmy 设计