Tags
第 10 頁
GGUF
Qwen3.6-35B-A3B 越獄版本地部署:無審查 GGUF、llama.cpp 與安全邊界
RTX 3070 8GB 本地運行 Qwen3.6-35B:llama.cpp 部署要點與最佳化參數
llama.cpp b9196 更新:Windows 預編譯版支援 CUDA 13.1、Vulkan、HIP 和 SYCL
適合 RTX 3060 顯卡運行的本地 LLM 模型推薦
本地部署 Qwen3.6:27B 與 35B-A3B 各量化版本需要多少顯存
本地部署 Gemma 4:E2B、E4B、26B、31B 各量化版本需要多少顯存
llama-quantize 怎麼用:GGUF 模型量化入門
llama.cpp 如何從 Hugging Face 取得 GGUF 模型
Hugging Face 選擇 Llama 的 GGUF 模型時,量化怎麼選:從 Q8 到 Q2 的實用建議
從 Hugging Face 下載 GGUF 模型並匯入 Ollama