本地运行 DeepSeek 4:Antirez ds4 在 Apple Silicon Mac 上的尝试

ds4 是 Antirez 为 Apple Silicon 编写的 DeepSeek V4 Flash 本地推理引擎,提供 CLI、HTTP server 和基础 agent 能力。

Antirez 开源了一个新项目:ds4。它不是通用 LLM 框架,而是一个面向 DeepSeek V4 Flash 的本地推理引擎,重点放在 Apple Silicon 和 Metal 后端上。

项目地址:https://github.com/antirez/ds4

ds4 是什么

ds4 的目标很明确:在 Mac 上本地运行 DeepSeek V4 Flash。

它当前提供三种使用方式:

  • 交互式 CLI。
  • HTTP server。
  • 一个实验性的 Agent 模式。

从定位看,它更像是一个针对特定模型深度优化的推理项目,而不是要替代 llama.cpp、Ollama 或 vLLM 这类通用工具。

为什么值得关注

这类项目值得看,主要有三个原因。

第一,作者是 Redis 作者 Antirez。他长期关注底层系统、性能和简单工具,项目风格通常比较直接。

第二,DeepSeek V4 Flash 属于面向高效推理的模型方向。如果本地运行体验足够好,对 Mac 用户来说会很有吸引力。

第三,ds4 直接面向 Apple Metal。相比“先支持所有平台,再慢慢优化”的路线,它更像是先把一个明确场景做深。

适合谁用

ds4 更适合这几类用户:

  • 使用 Apple Silicon Mac。
  • 想在本地运行 DeepSeek V4 Flash。
  • 关注 Metal 推理性能。
  • 愿意尝试 alpha 阶段项目。
  • 想研究轻量推理引擎和模型运行细节。

如果你的目标是稳定部署、跨平台运行、OpenAI API 兼容生态,现阶段它未必是首选。它更适合作为实验工具和技术观察对象。

使用方式

项目 README 给出的基本流程是先构建,再运行。

1
2
3
git clone https://github.com/antirez/ds4.git
cd ds4
make

交互式运行:

1
./ds4

启动 HTTP server:

1
./ds4 --server

Agent 模式:

1
./ds4 --agent

具体参数和模型文件准备方式,建议以仓库 README 为准,因为项目仍在快速变化。

目前的风险

ds4 还处在早期阶段,使用前要有预期:

  • 功能可能不完整。
  • 参数、模型格式和命令行行为可能变化。
  • 兼容性主要围绕 Apple Silicon 和 Metal。
  • Agent 模式更偏实验,不适合直接用于生产流程。
  • 遇到问题时,需要自己阅读 README、issue 或源码排查。

也就是说,它现在更像“值得动手试的开源实验”,还不是面向普通用户的一键工具。

和通用推理工具的区别

通用推理工具通常追求模型格式、平台、后端和 API 的广泛兼容。ds4 的方向更窄:围绕 DeepSeek V4 Flash 和 Metal 做本地运行。

这种选择有利有弊。

好处是实现可以更集中,性能和体验更容易围绕单一目标优化。代价是适用范围有限,不适合拿来运行各种不同模型,也不适合替代完整的部署平台。

如果你已经在用 llama.cpp 或 Ollama,ds4 可以作为补充测试工具,而不是马上替换现有工作流。

小结

ds4 的看点不在“又一个本地大模型工具”,而在于它把范围收得很窄:DeepSeek V4 Flash、Apple Silicon、Metal、本地推理。

如果你手上有合适的 Mac,并且愿意折腾早期项目,可以关注它后续的性能表现、模型支持方式和 server/agent 能力演进。对于生产环境,建议继续观望,等接口和使用方式稳定后再评估。

参考

记录并分享
使用 Hugo 构建
主题 StackJimmy 设计