Si has usado Claude Code, GitHub Copilot u otros agentes de programación para automatización de navegador, microsoft/playwright-cli es una herramienta que vale la pena observar. No es el ayudante de navegador tradicional pensado principalmente para humanos escribiendo comandos a mano. Es una CLI de Playwright diseñada para agentes de programación, con énfasis en menor sobrecarga de tokens, una interfaz de comandos más ligera e integración con flujos basados en Skills.
Según el README oficial, la idea central de Playwright CLI es clara: frente a MCP, que puede empujar grandes esquemas de herramientas y estructura de página al contexto del modelo, el enfoque CLI es más compacto y encaja mejor con flujos de agentes que alternan constantemente entre codebases grandes, pruebas y automatización de navegador.
01 Qué es Playwright CLI
playwright-cli es una herramienta open source de línea de comandos para Playwright creada por Microsoft. La descripción oficial es “CLI for common Playwright actions”. Se usa principalmente para tareas como:
- Abrir páginas y controlar el navegador
- Grabar y generar código Playwright
- Capturar snapshots de página para obtener referencias de elementos
- Tomar capturas de pantalla y exportar PDFs
- Trabajar con agentes de programación para automatización de pruebas e interacción web
El README actual de GitHub es muy explícito sobre su posicionamiento: si usas agentes de programación, la CLI suele encajar mejor que Playwright MCP; si necesitas estado persistente, introspección más rica y bucles agentic de larga duración, MCP sigue teniendo su lugar.
En otras palabras, Playwright CLI se siente más como una interfaz de automatización de navegador construida para asistentes AI de programación, no solo como una herramienta para que ingenieros hagan clic manualmente.
02 Dónde destaca
1. Encaja mejor con flujos de agentes
El README oficial enumera Token-efficient como una característica clave. No obliga a meter todos los datos de la página en el contexto del LLM. En su lugar, permite que el agente opere el navegador mediante comandos más cortos y enfocados.
Esto importa mucho para agentes de programación. En proyectos reales, un agente no solo controla el navegador. También tiene que leer código, editar archivos, ejecutar pruebas e inspeccionar logs. Si la interfaz del navegador consume demasiado contexto, todo el flujo se vuelve menos eficiente.
2. Funciona bien con Skills
El README destaca específicamente playwright-cli install --skills. Eso muestra que Microsoft no lo trata solo como otra utilidad de shell, sino como algo que Claude Code, GitHub Copilot y agentes similares pueden consumir directamente mediante un flujo basado en Skills.
Si tu configuración ya depende de Skills, Playwright CLI debería encajar de forma natural.
3. La gestión de sesiones es bastante completa
Playwright CLI soporta sesiones. De forma predeterminada, el perfil del navegador permanece en memoria, así que cookies y storage state se conservan entre varias llamadas CLI dentro de la misma sesión. Si añades --persistent, el perfil puede guardarse en disco y reutilizarse tras reiniciar el navegador.
Esto lo vuelve mucho más práctico que herramientas que abren un navegador para un solo comando y luego descartan todo. También encaja mejor con ciclos largos de depuración y flujos de agentes más extensos.
4. Incluye un panel visual de monitoreo
El README ofrece playwright-cli show, que abre un panel para observar y controlar todas las sesiones de navegador en ejecución. Esto es especialmente útil cuando un agente ejecuta automatización en segundo plano, porque puedes intervenir, inspeccionar el progreso y ayudar a depurar en lugar de trabajar a ciegas.
03 Instalación y requisitos
Según el README actual de GitHub, los requisitos básicos de Playwright CLI son:
- Node.js 18 o más reciente
- Claude Code, GitHub Copilot u otro agente de programación
Los comandos de instalación son:
|
|
Hay un error fácil que conviene destacar:
- El paquete recomendado oficialmente ahora es
@playwright/cli - No lo confundas con el antiguo paquete npm deprecado
playwright-cli
Así que el paquete correcto es el scoped package, no el paquete histórico antiguo.
04 Cómo empezar a usarlo
1. Instalar skills
Si quieres que un agente de programación use Playwright CLI directamente, la recomendación oficial es instalar primero las skills:
|
|
El README dice explícitamente que Claude Code, GitHub Copilot y herramientas similares usarán las skills instaladas localmente.
2. Dejar que el agente llame directamente a la CLI
Si no quieres manejar Skills primero, también puedes pedir al agente que lea la ayuda de la CLI directamente:
|
|
El README llama a esto “Skills-less operation”. La idea es que incluso sin skills preinstaladas, la CLI puede describirse lo bastante bien para que un agente la use.
3. Probar manualmente un flujo mínimo
El README incluye un ejemplo con TodoMVC que funciona muy bien como primera demostración práctica:
|
|
Esta secuencia es útil porque muestra rápidamente cómo trabaja Playwright CLI:
openabre la páginatypeypressgestionan entrada de textocheckusa una referencia de elemento para alternar checkboxesscreenshotguarda el resultado
05 --headed, sesiones y panel de monitoreo
--headed
Playwright CLI es headless por defecto. Si quieres ver directamente la ventana del navegador, debes pasar --headed al usar open:
|
|
Esto es especialmente útil al depurar selectores, flujos de login o cualquier interacción que sea más fácil inspeccionar visualmente.
sesiones
El README oficial da mucha importancia a las sesiones. Puedes usar distintas sesiones para aislar diferentes proyectos o sitios:
|
|
Si dejas que un agente trabaje durante más tiempo, también puedes pasar la sesión mediante una variable de entorno:
|
|
Comandos útiles de gestión de sesiones:
|
|
En la práctica:
listmuestra todas las sesionesclose-allcierra todos los navegadores de forma ordenadakill-alltermina forzosamente todos los procesos de navegador
Panel de monitoreo
Si quieres ver qué está haciendo realmente el agente en el navegador, puedes ejecutar:
|
|
Según el README, este panel tiene dos vistas principales:
- Session grid: muestra sesiones activas por workspace, con vista previa en vivo, URL y título de página
- Session detail: muestra una vista en vivo de una sesión seleccionada y permite tomar control del ratón y teclado
Eso significa que Playwright CLI no solo es usable desde la línea de comandos. También tiene una capa de observabilidad bastante madura.
06 Qué comandos conviene memorizar primero
Si es tu primera vez con Playwright CLI, no necesitas memorizar todos los comandos. Estos son los principales:
Páginas e interacción
|
|
Obtener estructura de página
|
|
snapshot es especialmente importante porque muchas operaciones posteriores dependen de referencias de elementos almacenadas como ref. En la práctica, normalmente capturas un snapshot primero y luego usas los identificadores devueltos para hacer clic, rellenar, marcar o tomar capturas.
Guardar salida
|
|
Pestañas
|
|
07 Quién debería probarlo
Playwright CLI merece probarse especialmente en estos escenarios:
- Usas Claude Code, Copilot u otro agente de programación para pruebas E2E
- Quieres una interfaz de automatización de navegador más ligera sin empujar grandes estructuras de página al contexto del modelo
- Quieres que una sesión de navegador persista entre múltiples comandos
- Quieres monitorear tareas web impulsadas por agentes mediante un panel mientras se ejecutan
Si tu pregunta principal es cómo hacer que la automatización de navegador funcione de forma eficiente con agentes de programación, Playwright CLI probablemente se sentirá más natural que los flujos tradicionales de depuración manual.