市面上主流 AI PPT 工具大盤點:自動生成、網頁簡報、PPTX 和圖像路線怎麼選

基於主流 PPT 生成 Skill 的盤點,按 HTML 簡報、原生 PPTX、AI 圖像、MCP 協議和綜合設計平台幾條路線整理選型思路。

AI 做 PPT 已經不只是「輸入標題,套一個模板」。在 Claude Code、Codex、Cursor 這類 AI 編程環境裡,PPT 生成正在變成一組可安裝、可複用的 Agent Skill:有的輸出網頁簡報,有的生成真正可編輯的 .pptx,有的直接用圖像模型把每頁做成視覺稿,還有的透過 MCP 讓 AI 操作 PowerPoint 文件。

這次整理了一批主流 PPT 相關 Skill。真正有價值的地方不只是榜單,而是把這類工具按交付形態拆開來看。選工具前,先問一句:最終交付物到底要給誰改、在哪裡播放、是否需要繼續協作?

幾條路線

1. HTML 網頁簡報

代表項目包括 frontend-slidesguizang-ppt-skillhtml-ppt-skill

這條路線的優勢是視覺表現力強。CSS 動畫、Canvas、WebGL、響應式佈局都能用,瀏覽器打開即可展示,適合技術分享、產品發布、Demo Day 和個人風格強烈的演講。

代價也很明確:交付後不太適合讓客戶逐字改。客戶如果拿到的是 HTML,而不是 PowerPoint 文件,後續修改往往還要回到生成流程。

如果只看 HTML 簡報,frontend-slides 更像高星通用入口,guizang-ppt-skill 強在審美約束和主題風格,html-ppt-skill 則勝在主題數量、佈局數量和演講者模式。

2. 原生 PPTX

代表項目包括 mckinsey-pptxppt-agent-skillsclaude-office-skillsppt-master

這是商業交付最穩的路線。只要客戶要求「能在 PowerPoint 裡改字、改圖、套公司模板」,最終就要落到 .pptx

其中 ppt-master 很值得單獨關注。它的思路是先讓 LLM 生成 SVG,再轉成 PowerPoint 原生 DrawingML 物件,目標是讓文字框、形狀、圖表都能在 PPTX 裡繼續編輯。它還支援從 PDF、DOCX、URL、Markdown 生成 PPTX,並能做模板復刻、動畫、旁白和本地預覽。

這條路線適合諮詢交付、公司匯報、白皮書簡報、長報告壓縮成 PPT 等場景。缺點是視覺上限通常受 PowerPoint 本身限制,複雜效果不如 HTML 或圖像路線自由。

3. AI 圖像驅動

代表項目包括 NanoBanana-PPT-Skillsgpt_image_2_skillppt-image-first

這條路線先把每一頁當成視覺圖來生成,再把圖片放進 PPTX 或其它容器裡。優點是完成度高,尤其適合封面、社群媒體圖、視覺提案、傳播型內容。

問題是可編輯性差。頁面本質上是一張圖,後面要改一個標題、換一段文案、挪一個圖標,可能就要重新生成。它適合「看起來要好」,不適合「客戶要反覆改」。

4. MCP / 協議層

代表項目包括 Office-PowerPoint-MCP-ServerPPTAgent

這類工具不一定直接生成完整 PPT,而是給 AI 一個操作 PowerPoint 的介面。接入 MCP 後,模型可以讀、改、寫 .pptx 文件。

這條路線適合已經有 PPT 文件、需要 AI 輔助修改的工作流。比如批量改格式、根據回饋重排頁面、讓模型檢查每頁是否符合目標。PPTAgent 強調反思式生成,也就是每生成一頁後再回頭檢查,這個方向對減少「AI PPT 很粗糙」的問題有啟發。

5. 綜合設計平台

代表項目包括 open-designdocsagent

這類項目已經超出 PPT 生成本身。open-design 更像本地優先的設計平台,可以生成原型、slides、images、videos,並支援多種匯出格式。docsagent 不是 PPT 工具,但能索引和對話本地文件,適合作為 PPT 生成前的資料整理層。

如果你的需求不是單次做 PPT,而是從資料、設計、原型到交付的一整套流程,這類平台更值得看。

Skill 元資訊

Star 數來自原文 2026-05-15 的抓取結果,只適合作為熱度參考,實際使用前建議再打開倉庫確認維護狀態、README 和 LICENSE。

Skill 作者 連結地址 Star 語言 路線
frontend-slides @zarazhangrui https://github.com/zarazhangrui/frontend-slides 17,530 Shell HTML 網頁簡報
guizang-ppt-skill @op7418(歸藏) 站內文章
GitHub
8,832 HTML HTML 網頁簡報
html-ppt-skill @lewislulu https://github.com/lewislulu/html-ppt-skill 3,834 HTML/CSS/JS HTML 網頁簡報
mckinsey-pptx @seulee26 https://github.com/seulee26/mckinsey-pptx 426 Python 原生 PPTX
ppt-agent-skills @sunbigfly https://github.com/sunbigfly/ppt-agent-skills 714 Python 原生 PPTX
claude-office-skills @tfriedel https://github.com/tfriedel/claude-office-skills 631 Python 原生 PPTX
ppt-master @hugohe3 https://github.com/hugohe3/ppt-master 16,626 Python 原生 PPTX
NanoBanana-PPT-Skills @op7418(歸藏) https://github.com/op7418/NanoBanana-PPT-Skills 2,668 Python AI 圖像驅動
gpt_image_2_skill @wuyoscar https://github.com/wuyoscar/gpt_image_2_skill 2,102 Python AI 圖像驅動
ppt-image-first @NyxTides https://github.com/NyxTides/ppt-image-first 799 Python AI 圖像驅動
Office-PowerPoint-MCP-Server @GongRzhe https://github.com/GongRzhe/Office-PowerPoint-MCP-Server 1,708 Python MCP / 協議層
PPTAgent @icip-cas https://github.com/icip-cas/PPTAgent 4,354 Python MCP / 協議層
open-design @nexu-io 站內文章
GitHub
40,822 TypeScript 綜合設計平台
docsagent @docsagent https://github.com/docsagent/docsagent 687 TypeScript 綜合設計平台

選型可以這樣判斷

如果客戶要繼續編輯,優先看原生 PPTX 路線,尤其是 ppt-mastermckinsey-pptxppt-agent-skills

如果是自己演講,且視覺表現比後續編輯更重要,優先看 HTML 路線,尤其是 frontend-slidesguizang-ppt-skillhtml-ppt-skill

如果目標是海報感、封面感、傳播圖,優先看圖像路線,比如 ppt-image-firstgpt_image_2_skillNanoBanana-PPT-Skills

如果已經有 PPT 文件,只想讓 AI 幫你讀、改、重排,可以看 MCP 路線。

如果是學術、行銷、翻譯、長報告壓縮這類明確場景,也可以繼續找垂直 Skill,而不是拿通用 PPT 生成器硬做。

最後要注意的事

開源項目不能只看 Star。真正使用前還要確認三件事:

  • LICENSE 是否允許你的使用方式。
  • 生成物是否滿足交付要求,尤其是可編輯性。
  • 成本是否可接受,包括模型調用、圖像生成、大上下文模型和可能的雲服務費用。

這類工具變化很快,Star 數會變,項目維護狀態也會變。但選型邏輯相對穩定:先確定交付形態,再看具體工具。PPT 是給人講、給人改、還是給人看,這三個答案往往會把選擇範圍直接縮小一大半。

记录并分享
使用 Hugo 建立
主題 StackJimmy 設計