Panorama de herramientas AI PPT populares: cómo elegir entre generación automática, presentaciones web, PPTX e imágenes

Un repaso de Skills populares para generar PPT, organizadas por presentaciones HTML, PPTX nativo, flujos con imágenes de IA, protocolos MCP y plataformas de diseño integradas.

Hacer PPT con IA ya no consiste solo en “escribir un título y aplicar una plantilla”. En entornos de programación con IA como Claude Code, Codex y Cursor, la generación de PPT se está convirtiendo en un conjunto de Agent Skills instalables y reutilizables: algunas generan presentaciones web, otras crean archivos .pptx realmente editables, otras usan modelos de imagen para convertir cada diapositiva en un borrador visual, y otras permiten que la IA opere archivos de PowerPoint mediante MCP.

Aquí organizamos un grupo de Skills populares relacionadas con PPT. Lo valioso no es solo la lista, sino separar estas herramientas por forma de entrega. Antes de elegir una herramienta, conviene hacer una pregunta: quién va a editar el entregable final, dónde se va a presentar y si necesita colaboración posterior.

Varias rutas

1. Presentaciones web HTML

Algunos proyectos representativos son frontend-slides, guizang-ppt-skill y html-ppt-skill.

La ventaja de esta ruta es su capacidad visual. Se pueden usar animaciones CSS, Canvas, WebGL y diseño responsive. Basta abrir el resultado en un navegador para presentarlo, así que encaja con charlas técnicas, lanzamientos de producto, Demo Day y presentaciones con un estilo personal fuerte.

El coste también es claro: después de la entrega no es ideal para clientes que necesitan editar texto punto por punto. Si el cliente recibe HTML en lugar de un archivo de PowerPoint, los cambios posteriores suelen tener que volver al flujo de generación.

Si solo miramos presentaciones HTML, frontend-slides se parece más a una entrada general con muchas estrellas, guizang-ppt-skill destaca por sus restricciones estéticas y estilo temático, y html-ppt-skill sobresale por cantidad de temas, layouts y modo de presentador.

2. PPTX nativo

Algunos proyectos representativos son mckinsey-pptx, ppt-agent-skills, claude-office-skills y ppt-master.

Esta es la ruta más estable para entregas de negocio. Si el cliente pide “poder editar texto, cambiar imágenes y aplicar la plantilla de la empresa en PowerPoint”, el resultado final debe llegar a .pptx.

ppt-master merece una mención aparte. Su idea es pedir primero al LLM que genere SVG y luego convertirlo en objetos DrawingML nativos de PowerPoint. El objetivo es que cuadros de texto, formas y gráficos sigan siendo editables dentro del PPTX. También puede generar PPTX desde PDF, DOCX, URL y Markdown, además de replicar plantillas, añadir animaciones, narración y vista previa local.

Esta ruta encaja con entregas de consultoría, reportes corporativos, presentaciones de white papers y conversión de informes largos en PPT. La desventaja es que el techo visual suele estar limitado por PowerPoint, por lo que los efectos complejos no son tan libres como en HTML o en rutas basadas en imágenes.

3. Flujos impulsados por imágenes de IA

Algunos proyectos representativos son NanoBanana-PPT-Skills, gpt_image_2_skill y ppt-image-first.

Esta ruta trata cada diapositiva primero como una imagen visual, y luego coloca esas imágenes en PPTX u otro contenedor. Su ventaja es un alto nivel de acabado visual, especialmente para portadas, gráficos de redes sociales, propuestas visuales y contenido orientado a difusión.

El problema es la baja editabilidad. La página es, en esencia, una imagen. Si luego hay que cambiar un título, reemplazar un párrafo o mover un icono, quizá haya que regenerarla. Sirve para “que se vea bien”, pero no para “el cliente va a revisarlo muchas veces”.

4. MCP / capa de protocolo

Algunos proyectos representativos son Office-PowerPoint-MCP-Server y PPTAgent.

Estas herramientas no necesariamente generan un PPT completo directamente. Más bien le dan a la IA una interfaz para operar PowerPoint. Tras conectarse con MCP, el modelo puede leer, modificar y escribir archivos .pptx.

Esta ruta encaja con flujos donde ya existe un archivo PPT y se necesita ayuda de IA para modificarlo. Por ejemplo, cambiar formato en lote, reordenar páginas según feedback o pedir al modelo que revise si cada diapositiva cumple el objetivo. PPTAgent enfatiza la generación reflexiva: después de generar cada diapositiva vuelve a revisarla. Esa dirección ayuda a reducir el problema de que “los PPT de IA se ven toscos”.

5. Plataformas de diseño integradas

Algunos proyectos representativos son open-design y docsagent.

Estos proyectos ya van más allá de la generación de PPT. open-design se parece más a una plataforma de diseño local-first: puede generar prototipos, slides, images y videos, y admite varios formatos de exportación. docsagent no es una herramienta de PPT, pero puede indexar documentos locales y conversar con ellos, por lo que sirve como capa de organización de materiales antes de generar PPT.

Si tu necesidad no es hacer un PPT puntual, sino un flujo completo desde materiales, diseño y prototipo hasta entrega, este tipo de plataforma merece más atención.

Metadatos de Skills

Los conteos de Star vienen del resultado capturado el 2026-05-15. Solo sirven como referencia de popularidad. Antes de usarlos en serio, conviene abrir de nuevo los repositorios y confirmar estado de mantenimiento, README y LICENSE.

Skill Autor Enlaces Star Lenguaje Ruta
frontend-slides @zarazhangrui https://github.com/zarazhangrui/frontend-slides 17,530 Shell Presentación web HTML
guizang-ppt-skill @op7418 (Guizang) Artículo interno
GitHub
8,832 HTML Presentación web HTML
html-ppt-skill @lewislulu https://github.com/lewislulu/html-ppt-skill 3,834 HTML/CSS/JS Presentación web HTML
mckinsey-pptx @seulee26 https://github.com/seulee26/mckinsey-pptx 426 Python PPTX nativo
ppt-agent-skills @sunbigfly https://github.com/sunbigfly/ppt-agent-skills 714 Python PPTX nativo
claude-office-skills @tfriedel https://github.com/tfriedel/claude-office-skills 631 Python PPTX nativo
ppt-master @hugohe3 https://github.com/hugohe3/ppt-master 16,626 Python PPTX nativo
NanoBanana-PPT-Skills @op7418 (Guizang) https://github.com/op7418/NanoBanana-PPT-Skills 2,668 Python Impulsado por imágenes de IA
gpt_image_2_skill @wuyoscar https://github.com/wuyoscar/gpt_image_2_skill 2,102 Python Impulsado por imágenes de IA
ppt-image-first @NyxTides https://github.com/NyxTides/ppt-image-first 799 Python Impulsado por imágenes de IA
Office-PowerPoint-MCP-Server @GongRzhe https://github.com/GongRzhe/Office-PowerPoint-MCP-Server 1,708 Python MCP / capa de protocolo
PPTAgent @icip-cas https://github.com/icip-cas/PPTAgent 4,354 Python MCP / capa de protocolo
open-design @nexu-io Artículo interno
GitHub
40,822 TypeScript Plataforma de diseño integrada
docsagent @docsagent https://github.com/docsagent/docsagent 687 TypeScript Plataforma de diseño integrada

Cómo elegir

Si el cliente necesita seguir editando, prioriza la ruta de PPTX nativo, especialmente ppt-master, mckinsey-pptx y ppt-agent-skills.

Si vas a presentar tú mismo y la expresión visual pesa más que la edición posterior, prioriza la ruta HTML, especialmente frontend-slides, guizang-ppt-skill y html-ppt-skill.

Si el objetivo es una pieza con sensación de póster, portada o imagen para difusión, prioriza la ruta de imágenes, como ppt-image-first, gpt_image_2_skill y NanoBanana-PPT-Skills.

Si ya tienes un archivo PPT y solo quieres que la IA te ayude a leerlo, editarlo y reorganizarlo, mira la ruta MCP.

Para escenarios claros como academia, marketing, traducción o compresión de informes largos, también puedes buscar Skills verticales en lugar de forzar un generador generalista de PPT.

Notas finales

No conviene juzgar proyectos open source solo por sus Star. Antes de usarlos de verdad, confirma tres cosas:

  • Si la LICENSE permite tu forma de uso.
  • Si el resultado generado cumple los requisitos de entrega, especialmente la editabilidad.
  • Si el coste es aceptable, incluyendo llamadas a modelos, generación de imágenes, modelos de contexto largo y posibles servicios cloud.

Estas herramientas cambian muy rápido. Los Star cambian y el estado de mantenimiento también. Pero la lógica de selección es relativamente estable: primero define la forma de entrega y luego mira las herramientas concretas. Si un PPT es para presentar, para que otros lo editen o para que otros lo miren, esas tres respuestas suelen reducir mucho el rango de opciones.

记录并分享
Creado con Hugo
Tema Stack diseñado por Jimmy