從 Hugging Face 下載 GGUF 模型並匯入 Ollama

如果某個模型在 Ollama 官方庫裡沒有現成版本，或你想使用 Hugging Face 上的特定 GGUF 檔案，就可以先手動下載，再匯入到 Ollama。

第 1 步：從 Hugging Face 下載 GGUF 檔案

先到 Hugging Face 找到目標模型對應的 GGUF 檔案。通常你會看到多個量化版本，例如：

要選哪個版本，取決於你的 VRAM、RAM，以及你對速度與品質的取捨。下載後請把 .gguf 檔案放在固定目錄，後續才能在 Modelfile 中直接引用。

在模型檔案所在目錄建立一個 Modelfile。最基本的寫法如下：

1

FROM ./model.gguf

如果檔名不同，請改成實際檔名，例如：

1

FROM ./gemma-3-12b-it-q4_k_m.gguf

如果你只是先讓模型跑起來，通常這一行 FROM 就夠了。

接著執行：

1

ollama create myModelName -f Modelfile

建立成功後，這個 GGUF 檔案就會成為可直接呼叫的本地模型。

建立完成後直接執行：

1

ollama run myModelName

之後它的使用方式就和用 ollama pull 拉下來的模型差不多。

如果你不確定 Modelfile 要怎麼寫，可以直接查看現有模型的設定：

1

ollama show --modelfile llama3.2

這個命令會輸出 llama3.2 的 Modelfile，很適合作為參考：

以下情境很適合用 Hugging Face 手動匯入流程：

如果 Ollama 官方庫已經有現成版本，直接 pull 通常更省事；但當你需要特定量化或自訂封裝時，GGUF + Modelfile 會更有彈性。

從 Hugging Face 下載 GGUF 檔案再匯入 Ollama 並不複雜。準備好模型檔案、寫一個最小可用的 Modelfile，再執行 ollama create，就能把第三方 GGUF 模型接入 Ollama 工作流。