本地執行 DeepSeek 4:Antirez ds4 在 Apple Silicon Mac 上的嘗試

ds4 是 Antirez 為 Apple Silicon 編寫的 DeepSeek V4 Flash 本地推理引擎,提供 CLI、HTTP server 和基礎 agent 能力。

Antirez 開源了一個新專案:ds4。它不是通用 LLM 框架,而是一個面向 DeepSeek V4 Flash 的本地推理引擎,重點放在 Apple Silicon 和 Metal 後端上。

專案地址:https://github.com/antirez/ds4

ds4 是什麼

ds4 的目標很明確:在 Mac 上本地執行 DeepSeek V4 Flash。

它目前提供三種使用方式:

  • 互動式 CLI。
  • HTTP server。
  • 一個實驗性的 Agent 模式。

從定位看,它更像是一個針對特定模型深度最佳化的推理專案,而不是要取代 llama.cpp、Ollama 或 vLLM 這類通用工具。

為什麼值得關注

這類專案值得看,主要有三個原因。

第一,作者是 Redis 作者 Antirez。他長期關注底層系統、效能和簡單工具,專案風格通常比較直接。

第二,DeepSeek V4 Flash 屬於面向高效推理的模型方向。如果本地執行體驗足夠好,對 Mac 使用者來說會很有吸引力。

第三,ds4 直接面向 Apple Metal。相比「先支援所有平台,再慢慢最佳化」的路線,它更像是先把一個明確場景做深。

適合誰用

ds4 更適合這幾類使用者:

  • 使用 Apple Silicon Mac。
  • 想在本地執行 DeepSeek V4 Flash。
  • 關注 Metal 推理效能。
  • 願意嘗試 alpha 階段專案。
  • 想研究輕量推理引擎和模型執行細節。

如果你的目標是穩定部署、跨平台執行、OpenAI API 相容生態,現階段它未必是首選。它更適合作為實驗工具和技術觀察對象。

使用方式

專案 README 給出的基本流程是先建置,再執行。

1
2
3
git clone https://github.com/antirez/ds4.git
cd ds4
make

互動式執行:

1
./ds4

啟動 HTTP server:

1
./ds4 --server

Agent 模式:

1
./ds4 --agent

具體參數和模型檔案準備方式,建議以倉庫 README 為準,因為專案仍在快速變化。

目前的風險

ds4 還處在早期階段,使用前要有預期:

  • 功能可能不完整。
  • 參數、模型格式和命令列行為可能變化。
  • 相容性主要圍繞 Apple Silicon 和 Metal。
  • Agent 模式更偏實驗,不適合直接用於生產流程。
  • 遇到問題時,需要自己閱讀 README、issue 或原始碼排查。

也就是說,它現在更像「值得動手試的開源實驗」,還不是面向普通使用者的一鍵工具。

和通用推理工具的區別

通用推理工具通常追求模型格式、平台、後端和 API 的廣泛相容。ds4 的方向更窄:圍繞 DeepSeek V4 Flash 和 Metal 做本地執行。

這種選擇有利有弊。

好處是實作可以更集中,效能和體驗更容易圍繞單一目標最佳化。代價是適用範圍有限,不適合拿來執行各種不同模型,也不適合取代完整的部署平台。

如果你已經在用 llama.cpp 或 Ollama,ds4 可以作為補充測試工具,而不是馬上替換現有工作流。

小結

ds4 的看點不在「又一個本地大模型工具」,而在於它把範圍收得很窄:DeepSeek V4 Flash、Apple Silicon、Metal、本地推理。

如果你手上有合適的 Mac,並且願意折騰早期專案,可以關注它後續的效能表現、模型支援方式和 server/agent 能力演進。對於生產環境,建議繼續觀望,等介面和使用方式穩定後再評估。

參考

记录并分享
使用 Hugo 建立
主題 StackJimmy 設計