KnightLi的博客

AI工具

DeepSeek V4 Pro 對比 GPT-5.5：前端、寫作、程式實測後，差距比想像更大

把 DeepSeek V4 Pro 和 GPT-5.5 放進前端開發、寫作、程式三類高頻任務裡實測後，會發現真正拉開差距的不是首輪輸出，而是穩定性、返工率和持續協作體驗。

AI工具

ChatGPT、Claude、Gemini 怎麼分工：日常對話、程式開發與特殊能力該怎麼選

圍繞 ChatGPT、Claude、Gemini 的常見分工問題，整理日常對話、命令列程式開發與特殊能力三類情境下更適合優先選誰，以及它們各自容易踩到的使用誤區。

AI工具

大模型 API 為什麼按 Token 收費：一文講清輸入、輸出和上下文成本

整理大模型 API 為什麼按 token 計費、輸入輸出為何分開定價、上下文和工具調用為什麼會放大成本，以及開發者該如何估算帳單。

AI工具

DeepSeek-V4 Preview 發布：1M 上下文、雙模型與 API 切換提醒

基於 DeepSeek 2026 年 4 月 24 日官方新聞頁，整理 DeepSeek-V4 Preview 的核心資訊，包括 V4-Pro、V4-Flash、1M 上下文、Agent 優化，以及 API 模型切換與舊模型退役提醒。

AI工具

解決 Ollama 使用 CPU 而不使用 GPU 運算的問題

整理一套排查 Ollama 只跑 CPU、不走 GPU 的思路，重點涵蓋顯卡識別、ROCm 或 CUDA 環境、服務重啟、顯存不足，以及 AMD 平台常見的相容性問題。

AI工具

NVIDIA nvbandwidth 是什麼：GPU 頻寬測試工具怎麼用

基於 NVIDIA/nvbandwidth 官方倉庫與 Release 頁面，整理這個 GPU 頻寬測試工具的定位、依賴、常用命令、多節點能力，以及最新 v0.9 更新重點。

AI工具

K-近鄰演算法入門：用鄰居投票理解機器學習分類

面向初學者講解 K-近鄰演算法的基本想法：什麼是 K、為什麼要找最近鄰、如何用投票完成分類，以及它的優點、限制和常見使用場景。

AI工具

OpenAI 發布 GPT-5.5：更強的智慧體編碼、知識工作與科研能力

基於 OpenAI 2026 年 4 月 23 日發布的 GPT-5.5 頁面，整理這次更新在智慧體編碼、知識工作、科研、安全、API 可用性與價格上的關鍵資訊。

硬體相關

Intel ATX 3.0 設計指南裡，PCIe 顯卡輔助供電介面怎麼分

根據 Intel ATX 3.0 Multi Rail Desktop Platform Power Supply Design Guide，整理 PCIe 顯卡常見輔助供電介面 2x3、2x4 和 12V-2x6 的定位、功率範圍與側帶訊號。

AI工具

常見向量模型怎麼選：OpenAI、BGE、E5、GTE、Jina 對比

整理 OpenAI、BGE、E5、GTE、Jina 等常見向量模型的定位與差異，重點看中文場景下該怎麼選。

AI工具

什麼是圖像向量化：從像素圖到可搜尋可分析的向量表示

整理圖像向量化的核心概念：為什麼圖片要從像素表示轉成向量表示，這個過程通常怎麼做，它在檢索、推薦、識別和企業數位化場景裡到底解決了什麼問題。

效率工具

auto-editor 是什麼：自動剪掉靜音空白，再匯出到 Premiere 和 Resolve

整理 auto-editor 這個命令列自動剪輯工具的核心能力：依照靜音或運動畫面自動完成第一遍粗剪，支援匯出到 Premiere、DaVinci Resolve、Final Cut Pro 等編輯器，也可以直接輸出成片。

AI工具

AI 名詞解釋：用白話講清楚 Agent、MCP、RAG 和 Token

整理 10 個常見 AI 名詞的白話解釋，包括 Agent、Skills、MCP、API、RAG、AIGC 和 Token，幫助新手先建立一套能聽懂日常討論的基礎框架。

AI工具

8G 顯存跑 llama.cpp 怎麼調：32K 更穩，64K 要開 KV Cache 量化

整理 8G 顯存場景下使用 llama.cpp 的幾個關鍵調優結論：什麼是 32K、64K 和 KV Cache，為什麼 32K 往往更穩，64K 為什麼更依賴快取量化，以及為什麼一味拉高 CPU 執行緒反而可能更慢。

硬體相關

如何檢查 Tesla V100 是否存在 ECC 錯誤

用 nvidia-smi 快速查看 Tesla V100 的 ECC 狀態，並判斷哪些錯誤計數應為 0 或 N/A。

硬體相關

特斯拉 V100 現在還值得買嗎：ECC 檢查、散熱改造與 DIY 避坑

整理特斯拉 V100 的選購重點：年份與外觀怎麼看、ECC 數值怎麼判斷、哪些跡象代表卡可能被動過手腳，以及為什麼 DIY 散熱與供電最容易翻車。

AI工具

Claude Code 環境配置四件套：CLAUDE.md、Rules、Memory、Hooks 一次講清

為什麼 Claude Code 用久之後，環境配置會比提示詞更重要？這篇文章把 CLAUDE.md、Rules、Memory、Hooks 四個層面一次講清，也給出一套實用的上手順序。

AI??

llama.cpp ???????CUDA?ROCm?Vulkan ?????pp512 / tg128 / FA ????

?? 2026-04-23 ? GitHub Discussions ????? scoreboard ????? llama.cpp ? CUDA?ROCm?Vulkan ???? GPU ??????? pp512?tg128?Q4_0?FA ??????????

AI工具

顯卡推理速度測試的常用指標具體含義：FA、pp512、tg128、Q4_0 都是什麼意思

看顯卡推理速度測試時，經常會遇到 FA、pp512、tg128、Q4_0、t/s 這些指標。它們都和效能有關，但分別在測什麼、該怎麼理解，並不是每個人都清楚。這篇文章專門把這些常見指標拆開講明白。

開發工具

2026 年嵌入式開發環境怎麼選：Keil、STM32CubeIDE、VS Code 與 AI 協作

在 AI 寫程式已經變得很普遍的 2026 年，嵌入式開發環境怎麼選？相比單押某個 IDE，更現實的答案往往是 Keil 負責編譯與調試，VS Code 負責編輯與 AI 協作。

AI工具

大模型常見張量類型入門：FP32、FP16、BF16、TF32 與 FP8

用一篇文章整理大模型裡最常見的張量類型：FP32、FP16、BF16、TF32 與 FP8，包括它們的位寬結構、優缺點，以及它們為什麼會影響訓練與部署體驗。

開發工具

8 種常見設定檔格式怎麼選：INI、XML、JSON、YAML、TOML 到 Markdown

整理 8 種常見設定檔格式的特點與取捨，包括 INI、XML、JSON、YAML、TOML、Apache 設定、Protocol Buffers，以及 AI Agent 時代重新受到關注的 Markdown。

AI工具

16G 顯卡也能跑 35B 模型：LM Studio 下 MoE 模型的顯存壓縮思路

整理一套 16G 顯卡運行 35B 級 MoE 模型的實測思路：只要選對架構並調好 LM Studio 參數，16G 顯卡不一定只能停留在 12B 到 14B 模型。

AI工具

Claude Code 多 Agent 協作：Subagents 和 Agent Teams 怎麼選

整理 Claude Code 裡 Subagents 和 Agent Teams 的差異、適用場景與取捨方式，幫助你在多 Agent 協作時更快選對方案。

AI工具

GPT Image 2 正式發布：從能生成到能商用的跨越

整理 GPT Image 2 發布後最值得關注的能力變化，包括文字渲染、照片級真實感、世界知識、UI 截圖生成與局部編輯，並附上 ChatGPT 與 API 的使用方式，以及幾個高頻生圖場景的提示詞參考。

AI工具

nuwa-skill：把「蒸餾一個人」從靈感變成可執行流程

alchaincyf/nuwa-skill 不是單純模仿名人的語氣，而是把研究、提煉、驗證一個人思維方式的過程做成可重複使用的 Claude Code Skill。

AI工具

OpenAI 發布 ChatGPT Images 2.0：圖像生成開始走向可直接交付

基於 OpenAI 2026 年 4 月 21 日發布的 ChatGPT Images 2.0 頁面，整理這次更新最值得關注的方向：更強的文字與版式控制、多語言能力、更廣的風格覆蓋，以及圖像生成從「出圖」走向「可直接交付」。

硬體相關

12V-2x6 與 12VHPWR：顯卡 16Pin 供電接口差異筆記

整理 12V-2x6 與 12VHPWR 這兩代顯卡 16Pin 供電接口的主要差異：線材相容性、針腳長度、SENSE 邏輯、H++ 標識和 600W 輸出能力。

AI工具

Karpathy 的 65 行 CLAUDE.md：讓 AI 編程少犯三類錯誤

整理 Karpathy 對 AI 編程的觀察，以及 Forrest Cheung 將這些問題沉澱成 CLAUDE.md 行為準則的思路：先想再寫、簡單優先、精準修改和目標驅動。

硬體相關

Core Ultra 9 285T ES 折騰筆記：Q4A7、B860 工程板與 35W 功耗牆

整理 Core Ultra 9 285T ES 樣品 Q4A7 的平台、主機板、供電、記憶體、效能、遊戲表現和購買建議：規格很香，但 35W 功耗牆、DDR5 高延遲、ES 主機板稀缺和 BIOS 簡陋，讓它更適合低功耗折騰，而不是遊戲主機。

AI工具

Claude Code 額度省著用：模型選擇、上下文、快取與 /compact

整理 Claude Code 和 Claude Pro/Max 額度容易耗盡的原因：模型選擇、5 小時用量視窗、長對話、檔案和圖片、快取失效、CLAUDE.md、MCP 與 skills，並給出 /compact、/clear、/context、/status 等實用習慣。

AI工具

rembg 專案整理：本地圖片背景移除工具

整理 danielgatis/rembg 的定位、安裝方式、CLI 用法、Python 呼叫、HTTP 服務、Docker 執行、模型選擇和適用場景，方便判斷它是否適合本地圖片背景移除流程。

AI工具

Ollama 多顯卡使用筆記：顯存疊加、GPU 選擇和常見誤區

整理 Ollama 多顯卡使用中的關鍵資訊：什麼時候會跨 GPU 載入模型、如何用 CUDA_VISIBLE_DEVICES / ROCR_VISIBLE_DEVICES 限制顯卡、顯存是否能疊加、不同 GPU 能不能混用，以及 Docker、PCIe 頻寬和效能方面的常見誤區。

硬體相關

聯想 HR630x / HR650x 折騰筆記：LGA3647、8259CL、Optane 與避坑

參考 HR630x 裝機日誌和 HR650x 踩坑記錄，整理聯想 HR630x / HR650x 這類 LGA3647 伺服器準系統的選購思路、CPU 與 Optane 搭配、VRM 解鎖、風扇調速、riser、背板和 BMC/UEFI 注意事項。

硬體相關

MCP2221A-I/ST 選型筆記：USB 轉 I2C/UART 的小工具晶片

整理 Microchip MCP2221A-I/ST 的關鍵參數和使用注意點：USB 2.0 轉 I2C/UART、GPIO 複用、供電範圍、封裝、速率限制，以及適合放進硬體除錯工具箱的原因。

硬體相關

LGA3647 高 TDC OEM CPU 點亮思路：修改 VRM 的 ICC_MAX

整理 ServeTheHome 論壇中關於 LGA3647 平台高 TDC OEM Xeon 處理器的 VRM ICC_MAX 修改思路：為什麼會不亮機、需要準備什麼、具體主機板接線、刷寫命令、BIOS 修改和風險注意事項。

AI工具

Google App 桌面版體驗：把 AI 搜尋放進 Windows

介紹 Google App 桌面版的核心功能、安裝條件、快捷鍵呼叫方式，以及如何使用 AI Mode、Google Lens、螢幕分享、檔案上傳和本機檔案搜尋來提升日常搜尋效率。

運維

理解 nftables 框架：表、鏈、規則和集合

從概念層面梳理 nftables 框架：table、family、chain、rule、set、map 和 verdict map 分別解決什麼問題，以及它們如何組合成可維護的防火牆規則。

運維

nftables 快速入門：表、鏈、規則和常用操作

整理 nftables 的入門思路：理解 table、chain、rule 的關係，並透過 IP、MAC、連接埠匹配、流量統計、限速和規則刪除等常用命令快速上手。

AI工具

Gemma 4 E4B 越獄版和官方普通版有什麼差別

對比非官方 Gemma-4-E4B-Uncensored-HauhauCS-Aggressive 與 Google 官方 Gemma 4 E4B-it，重點說明行為、拒答、安全、授權與部署層面的差異。

AI工具

Windows 用 WSL + Ollama 本地部署 Hermes Agent，並接入 Telegram

整理一套適合 Windows 使用者的 Hermes Agent 本地部署流程：先安裝 WSL 和 Ubuntu，再裝 Ollama、Gemma 4，並完成 Hermes Agent 與 Telegram 的基礎接入。

AI工具

llama-cli -hf 下載 Hugging Face 模型預設儲存在哪裡

整理 llama-cli -hf 從 Hugging Face 下載 GGUF 模型後的預設快取位置，以及如何用 LLAMA_CACHE 或 Hugging Face 快取變數修改快取目錄。

AI工具

Windows 下 llama-cli 直連 Hugging Face 出現 SSL 憑證驗證失敗怎麼辦

整理 llama-cli 在 Windows 下透過 -hf 下載 Hugging Face 模型時遇到 SSL 憑證驗證失敗的常見原因與處理方式。

硬體相關

CRPS 通用冗餘伺服器電源標準、腳位功能與常見型號

整理 CRPS / M-CRPS 通用冗餘伺服器電源標準、2x25 金手指腳位定義、PSON/12VSB/PMBus 等訊號功能，以及常見 CRPS 電源型號。

硬體相關

CSPS 伺服器通用槽位電源介面與腳位定義

整理 CSPS / Common Slot 伺服器電源的介面特點、64 pin 金手指腳位定義、12V 輸出啟用方法、PMBus/SMBus 訊號和轉接板設計注意事項。

AI工具

codex-quota 實戰指南：保留命令列的本機、Web 與 Docker 用法

`codex-quota` 是一個輕量工具，可查詢 ChatGPT Codex 配額使用情況，整理本機 CLI、Web 服務與 Docker/Compose 用法。

AI工具

在 VS Code 裡接入 Claude：從 API 設定到網頁生成

整理一套在 VS Code 裡接入 Claude 類模型做 AI 編程的入門流程，包括外掛安裝、API 設定、實際生成頁面時的互動方式，以及使用這類工具時更值得關注的邊界。

開發工具

Windows 上在 VS Code 建置 Docker 映像：從環境準備到一鍵建置

整理在 Windows 上使用 VS Code 建置 Docker 映像的核心流程，包含前置條件、Dockerfile 產生方式、建置方法與常見排查重點。

AI工具

Claude 身分驗證說明：為什麼要驗證、需要什麼材料、資料如何處理

整理 Anthropic 官方 Claude 身分驗證文件，說明驗證觸發場景、所需證件、Persona 的角色、資料保護方式，以及驗證失敗或帳號被停用時的處理方法。

AI工具