Antirez ha publicado un nuevo proyecto open source: ds4. No es un framework LLM de propósito general, sino un motor de inferencia local para DeepSeek V4 Flash, centrado en Apple Silicon y el backend Metal.
URL del proyecto: https://github.com/antirez/ds4
Qué es ds4
ds4 tiene un objetivo muy claro: ejecutar DeepSeek V4 Flash localmente en un Mac.
Actualmente ofrece tres formas de uso:
- CLI interactiva.
- HTTP server.
- Un modo Agent experimental.
Por su posicionamiento, se parece más a un proyecto de inferencia profundamente optimizado para un modelo específico que a un reemplazo de herramientas generales como llama.cpp, Ollama o vLLM.
Por qué merece atención
Hay tres razones principales por las que este tipo de proyecto merece atención.
La primera es que su autor es Antirez, creador de Redis. Lleva mucho tiempo interesado en sistemas de bajo nivel, rendimiento y herramientas simples, y sus proyectos suelen tener un estilo bastante directo.
La segunda es que DeepSeek V4 Flash apunta a una inferencia eficiente. Si la experiencia local es lo bastante buena, puede resultar muy atractivo para usuarios de Mac.
La tercera es que ds4 apunta directamente a Apple Metal. En lugar de intentar soportar todas las plataformas primero y optimizar después, parece buscar profundidad en un escenario muy definido.
Para quién es
ds4 encaja mejor con usuarios que:
- Usan un Apple Silicon Mac.
- Quieren ejecutar DeepSeek V4 Flash en local.
- Se interesan por el rendimiento de inferencia con Metal.
- Están dispuestos a probar un proyecto en fase alpha.
- Quieren estudiar motores de inferencia ligeros y detalles de ejecución de modelos.
Si tu objetivo es un despliegue estable, ejecución multiplataforma o una infraestructura compatible con OpenAI API, probablemente no sea la primera opción en esta etapa. Tiene más sentido como herramienta experimental y como proyecto técnico para observar.
Cómo usarlo
El flujo básico que muestra el README del proyecto es compilar primero y ejecutar después.
|
|
Ejecución interactiva:
|
|
Iniciar el HTTP server:
|
|
Modo Agent:
|
|
Para los parámetros concretos y la preparación de los archivos del modelo, conviene seguir el README del repositorio, porque el proyecto todavía cambia con rapidez.
Riesgos actuales
ds4 todavía está en una etapa temprana, así que conviene ajustar expectativas antes de usarlo:
- Las funciones pueden estar incompletas.
- Los parámetros, formatos de modelo y comportamientos de línea de comandos pueden cambiar.
- La compatibilidad gira principalmente alrededor de Apple Silicon y Metal.
- El modo Agent es más experimental y no es adecuado para usarlo directamente en producción.
- Si surge un problema, quizá tengas que leer el README, los issues o el código fuente por tu cuenta.
En otras palabras, ahora mismo se parece más a un experimento open source que vale la pena probar que a una herramienta de un clic para usuarios generales.
Diferencias frente a herramientas de inferencia generales
Las herramientas de inferencia generales suelen buscar compatibilidad amplia con formatos de modelo, plataformas, backends y APIs. ds4 toma un camino más estrecho: ejecutar DeepSeek V4 Flash en local con Metal.
Esa decisión tiene ventajas y costes.
La ventaja es que la implementación puede mantenerse enfocada, lo que facilita optimizar rendimiento y experiencia alrededor de un único objetivo. El coste es un alcance limitado: no está pensado para ejecutar todo tipo de modelos ni para sustituir una plataforma completa de despliegue.
Si ya usas llama.cpp u Ollama, ds4 puede servir como herramienta complementaria de pruebas, no como sustituto inmediato de tu flujo de trabajo actual.
Resumen
Lo interesante de ds4 no es que sea otra herramienta local para grandes modelos. Lo interesante es que reduce mucho su alcance: DeepSeek V4 Flash, Apple Silicon, Metal e inferencia local.
Si tienes un Mac adecuado y te apetece experimentar con un proyecto temprano, vale la pena seguir su rendimiento, su forma de soportar modelos y la evolución de sus capacidades de server/agent. Para entornos de producción, es mejor observar un poco más y evaluarlo cuando las interfaces y la forma de uso sean más estables.
Referencias
- Proyecto en GitHub: https://github.com/antirez/ds4