Antirez 开源了一个新项目:ds4。它不是通用 LLM 框架,而是一个面向 DeepSeek V4 Flash 的本地推理引擎,重点放在 Apple Silicon 和 Metal 后端上。
项目地址:https://github.com/antirez/ds4
ds4 是什么
ds4 的目标很明确:在 Mac 上本地运行 DeepSeek V4 Flash。
它当前提供三种使用方式:
- 交互式 CLI。
- HTTP server。
- 一个实验性的 Agent 模式。
从定位看,它更像是一个针对特定模型深度优化的推理项目,而不是要替代 llama.cpp、Ollama 或 vLLM 这类通用工具。
为什么值得关注
这类项目值得看,主要有三个原因。
第一,作者是 Redis 作者 Antirez。他长期关注底层系统、性能和简单工具,项目风格通常比较直接。
第二,DeepSeek V4 Flash 属于面向高效推理的模型方向。如果本地运行体验足够好,对 Mac 用户来说会很有吸引力。
第三,ds4 直接面向 Apple Metal。相比“先支持所有平台,再慢慢优化”的路线,它更像是先把一个明确场景做深。
适合谁用
ds4 更适合这几类用户:
- 使用 Apple Silicon Mac。
- 想在本地运行 DeepSeek V4 Flash。
- 关注 Metal 推理性能。
- 愿意尝试 alpha 阶段项目。
- 想研究轻量推理引擎和模型运行细节。
如果你的目标是稳定部署、跨平台运行、OpenAI API 兼容生态,现阶段它未必是首选。它更适合作为实验工具和技术观察对象。
使用方式
项目 README 给出的基本流程是先构建,再运行。
|
|
交互式运行:
|
|
启动 HTTP server:
|
|
Agent 模式:
|
|
具体参数和模型文件准备方式,建议以仓库 README 为准,因为项目仍在快速变化。
目前的风险
ds4 还处在早期阶段,使用前要有预期:
- 功能可能不完整。
- 参数、模型格式和命令行行为可能变化。
- 兼容性主要围绕 Apple Silicon 和 Metal。
- Agent 模式更偏实验,不适合直接用于生产流程。
- 遇到问题时,需要自己阅读 README、issue 或源码排查。
也就是说,它现在更像“值得动手试的开源实验”,还不是面向普通用户的一键工具。
和通用推理工具的区别
通用推理工具通常追求模型格式、平台、后端和 API 的广泛兼容。ds4 的方向更窄:围绕 DeepSeek V4 Flash 和 Metal 做本地运行。
这种选择有利有弊。
好处是实现可以更集中,性能和体验更容易围绕单一目标优化。代价是适用范围有限,不适合拿来运行各种不同模型,也不适合替代完整的部署平台。
如果你已经在用 llama.cpp 或 Ollama,ds4 可以作为补充测试工具,而不是马上替换现有工作流。
小结
ds4 的看点不在“又一个本地大模型工具”,而在于它把范围收得很窄:DeepSeek V4 Flash、Apple Silicon、Metal、本地推理。
如果你手上有合适的 Mac,并且愿意折腾早期项目,可以关注它后续的性能表现、模型支持方式和 server/agent 能力演进。对于生产环境,建议继续观望,等接口和使用方式稳定后再评估。
参考
- GitHub 项目:https://github.com/antirez/ds4