<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>顯卡改造 on KnightLi的博客</title>
        <link>https://www.knightli.com/zh-tw/tags/%E9%A1%AF%E5%8D%A1%E6%94%B9%E9%80%A0/</link>
        <description>Recent content in 顯卡改造 on KnightLi的博客</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>zh-tw</language>
        <lastBuildDate>Thu, 23 Apr 2026 11:15:10 +0800</lastBuildDate><atom:link href="https://www.knightli.com/zh-tw/tags/%E9%A1%AF%E5%8D%A1%E6%94%B9%E9%80%A0/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>特斯拉 V100 現在還值得買嗎：ECC 檢查、散熱改造與 DIY 避坑</title>
        <link>https://www.knightli.com/zh-tw/2026/04/23/tesla-v100-buying-ecc-cooling-diy-guide/</link>
        <pubDate>Thu, 23 Apr 2026 11:15:10 +0800</pubDate>
        
        <guid>https://www.knightli.com/zh-tw/2026/04/23/tesla-v100-buying-ecc-cooling-diy-guide/</guid>
        <description>&lt;p&gt;如果你最近在看二手 &lt;code&gt;Tesla V100&lt;/code&gt;，很容易碰到兩種說法：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;一種覺得它現在依然很能打，性價比很高&lt;/li&gt;
&lt;li&gt;另一種覺得這類卡水很深，DIY 玩家一不小心就會翻車&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;這兩種說法其實都對。&lt;/p&gt;
&lt;p&gt;&lt;code&gt;V100&lt;/code&gt; 不是不能買，而是不能用普通消費級顯卡的思路去買。你真正要看的，不只是能不能點亮，也不只是賣家口中的「全新」或「原廠拆機」，而是這張卡有沒有被動過手腳、&lt;code&gt;ECC&lt;/code&gt; 狀態怎麼樣，以及散熱與供電方案到底靠不靠譜。&lt;/p&gt;
&lt;p&gt;這篇文章整理出幾條對實際買卡和上機最有幫助的判斷標準。&lt;/p&gt;
&lt;h2 id=&#34;先看結論&#34;&gt;先看結論
&lt;/h2&gt;&lt;p&gt;如果你只想看最短版，先記住下面幾點：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;V100&lt;/code&gt; 大致從 &lt;code&gt;2017&lt;/code&gt; 年生產到 &lt;code&gt;2021&lt;/code&gt; 年停產，&lt;code&gt;16G&lt;/code&gt; 版本裡 &lt;code&gt;2021&lt;/code&gt; 年的卡並不常見&lt;/li&gt;
&lt;li&gt;光看「全零 ECC」或「原廠拆機」都不夠，很多關鍵數據與外觀狀態都有可能被處理過&lt;/li&gt;
&lt;li&gt;真正危險的，往往不是買到一張老卡，而是買到一張被拆過、刷過、散熱方案有硬傷的卡&lt;/li&gt;
&lt;li&gt;對 &lt;code&gt;DIY&lt;/code&gt; 玩家來說，&lt;code&gt;V100&lt;/code&gt; 最大的坑通常不是核心本身，而是轉接板、供電、熱點溫度與底板散熱&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;一先看年份與批次對不上就要警惕&#34;&gt;一、先看年份與批次，對不上就要警惕
&lt;/h2&gt;&lt;p&gt;一個很實用的判斷方法是：先看晶片年份，再看周邊器件年份是否對得上。&lt;/p&gt;
&lt;p&gt;&lt;img src=&#34;https://www.knightli.com/2026/04/23/tesla-v100-buying-ecc-cooling-diy-guide/1.png&#34;
	width=&#34;1139&#34;
	height=&#34;670&#34;
	srcset=&#34;https://www.knightli.com/2026/04/23/tesla-v100-buying-ecc-cooling-diy-guide/1_hu_a8325dae98af3ae7.png 480w, https://www.knightli.com/2026/04/23/tesla-v100-buying-ecc-cooling-diy-guide/1_hu_40537b27bd676168.png 1024w&#34;
	loading=&#34;lazy&#34;
	
		alt=&#34;Tesla V100&#34;
	
	
		class=&#34;gallery-image&#34; 
		data-flex-grow=&#34;170&#34;
		data-flex-basis=&#34;408px&#34;
	
&gt;&lt;/p&gt;
&lt;p&gt;例如晶片表面出現 &lt;code&gt;1828&lt;/code&gt;，通常可以理解為：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;18&lt;/code&gt; 代表 &lt;code&gt;2018&lt;/code&gt; 年&lt;/li&gt;
&lt;li&gt;&lt;code&gt;28&lt;/code&gt; 代表第 &lt;code&gt;28&lt;/code&gt; 週&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;也就是說，這是一顆 &lt;code&gt;2018&lt;/code&gt; 年第 &lt;code&gt;28&lt;/code&gt; 週生產的晶片。&lt;/p&gt;
&lt;p&gt;除了晶片本體，周邊電感上通常也能看到對應年份標記。如果晶片年份和電感年份差距非常大，例如：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;晶片是 &lt;code&gt;2017&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;電感卻是 &lt;code&gt;2020&lt;/code&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;那就需要提高警覺。這不一定百分之百代表有問題，但至少說明它已經不是那種原始狀態非常完整的卡。&lt;/p&gt;
&lt;p&gt;反過來說，如果年份大致能對上，例如：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;2018&lt;/code&gt; 晶片搭配 &lt;code&gt;2018&lt;/code&gt; 年周邊料件&lt;/li&gt;
&lt;li&gt;&lt;code&gt;2019&lt;/code&gt; 年末晶片搭配 &lt;code&gt;2020&lt;/code&gt; 年周邊&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;這種就更正常一些。&lt;/p&gt;
&lt;h2 id=&#34;二外觀檢查不要只看晶片也要看電感彈簧與框架&#34;&gt;二、外觀檢查不要只看晶片，也要看電感、彈簧與框架
&lt;/h2&gt;&lt;p&gt;外觀檢查可以拆成幾步來看。&lt;/p&gt;
&lt;h3 id=&#34;1-先摸電感&#34;&gt;1. 先摸電感
&lt;/h3&gt;&lt;p&gt;用手輕輕摸一圈電感，正常情況下不應該有任何一顆是鬆動的。&lt;/p&gt;
&lt;p&gt;如果有電感已經晃動，通常代表：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;焊接狀態不正常&lt;/li&gt;
&lt;li&gt;後續使用中問題可能持續放大&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;這種卡即使現在能亮，也不建議輕易碰。&lt;/p&gt;
&lt;h3 id=&#34;2-再看固定彈簧有沒有被拆過&#34;&gt;2. 再看固定彈簧有沒有被拆過
&lt;/h3&gt;&lt;p&gt;這裡有一個很實用的判斷邏輯：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;如果賣家強調這是「原廠拆機」&lt;/li&gt;
&lt;li&gt;那固定彈簧理論上就不應該被輕易拆過&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;因為正常伺服器原廠環境，通常不會特地去拆這個彈簧。&lt;/p&gt;
&lt;p&gt;如果你輕輕一撬，彈簧就很容易下來，那大概率表示這張卡之前已經被拆過。要是賣家同時還說它是「原廠拆機、未動過」，可信度就得打個問號。&lt;/p&gt;
&lt;h3 id=&#34;3-框架太好拆也不正常&#34;&gt;3. 框架太好拆，也不正常
&lt;/h3&gt;&lt;p&gt;中間框架拆掉之後，如果整個結構輕輕一拿就分離，通常也代表這張卡曾經被反覆拆裝過。&lt;/p&gt;
&lt;p&gt;對二手 &lt;code&gt;V100&lt;/code&gt; 來說，這很關鍵，因為後續的刷寫、改造與維修，往往都會留下這些拆裝痕跡。&lt;/p&gt;
&lt;h2 id=&#34;三底板如果太容易分離就要懷疑刷過-vbios-或動過手腳&#34;&gt;三、底板如果太容易分離，就要懷疑刷過 VBIOS 或動過手腳
&lt;/h2&gt;&lt;p&gt;這裡有一個很重要的點：&lt;code&gt;PCB&lt;/code&gt; 下層有一塊金屬背板，它不只是防護件，也負責輔助散熱。&lt;/p&gt;
&lt;p&gt;在正常原裝狀態下，這塊底板通常不太容易拆。原因包括：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;膠固定&lt;/li&gt;
&lt;li&gt;結構結合很緊&lt;/li&gt;
&lt;li&gt;本來就不是設計給人反覆拆裝的&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;如果稍微一用力，底板就和 &lt;code&gt;PCB&lt;/code&gt; 很容易分開，那基本就要懷疑：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;之前被拆過&lt;/li&gt;
&lt;li&gt;裡面可能刷過 &lt;code&gt;VBIOS&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;可能做過二次處理&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;這不代表它一定不能用，但如果你買的是「原裝無拆」這種口徑，那這種現象顯然不對。&lt;/p&gt;
&lt;h2 id=&#34;四ecc-怎麼看最重要的不是是不是零而是會不會增長&#34;&gt;四、&lt;code&gt;ECC&lt;/code&gt; 怎麼看：最重要的不是是不是零，而是會不會增長
&lt;/h2&gt;&lt;p&gt;很多人買 &lt;code&gt;V100&lt;/code&gt; 時最關心 &lt;code&gt;ECC&lt;/code&gt;，這部分也需要單獨拆開看。&lt;/p&gt;
&lt;p&gt;常見做法是用 &lt;code&gt;nvidia-smi&lt;/code&gt; 的詳細查詢，把 &lt;code&gt;ECC Errors&lt;/code&gt; 相關資訊拉出來看。&lt;/p&gt;
&lt;h3 id=&#34;1-即時錯誤最危險&#34;&gt;1. 即時錯誤最危險
&lt;/h3&gt;&lt;p&gt;上面那部分可以理解成「即時錯誤」。&lt;/p&gt;
&lt;p&gt;如果在運行過程中，這部分數字持續增加，那通常就不是小問題了，往往代表這張卡已經處在明顯不穩定的狀態。&lt;/p&gt;
&lt;p&gt;簡單說：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;跑起來不報新錯，比靜態全零更重要&lt;/li&gt;
&lt;li&gt;一壓測就開始增長錯誤，比歷史累積數字更可怕&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id=&#34;2-全生命週期累積錯誤不一定可怕&#34;&gt;2. 全生命週期累積錯誤不一定可怕
&lt;/h3&gt;&lt;p&gt;另一部分是全生命週期累積錯誤，也就是這張卡從出廠到現在一共出現過多少次糾錯或異常。&lt;/p&gt;
&lt;p&gt;如果這類數字只是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;個位數&lt;/li&gt;
&lt;li&gt;十幾次&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;未必就是大問題。&lt;/p&gt;
&lt;p&gt;只要實際運行時，上面的即時錯誤沒有繼續增加，很多時候卡仍然可以正常使用。&lt;/p&gt;
&lt;h3 id=&#34;3-屏蔽頁更值得重點看&#34;&gt;3. 屏蔽頁更值得重點看
&lt;/h3&gt;&lt;p&gt;更值得重點關注的是下面那部分「屏蔽頁」資訊，也就是某些顯存塊因為不可糾正錯誤而被屏蔽掉。&lt;/p&gt;
&lt;p&gt;大致可以這樣理解：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;單精度和雙精度可能各自有被屏蔽的塊&lt;/li&gt;
&lt;li&gt;兩邊加起來如果超過 &lt;code&gt;10&lt;/code&gt;，這張卡就進入需要更謹慎的區間&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;這不一定代表完全不能用，但意味著它的實際可用顯存和長期穩定性已經受到影響。&lt;/p&gt;
&lt;h2 id=&#34;五不要迷信全零-ecc因為數據本身也可能被刷過&#34;&gt;五、不要迷信「全零 ECC」，因為數據本身也可能被刷過
&lt;/h2&gt;&lt;p&gt;這裡有一個很現實的提醒：&lt;/p&gt;
&lt;p&gt;&lt;code&gt;ECC&lt;/code&gt; 數據並不是天生就絕對可信。&lt;/p&gt;
&lt;p&gt;如果一張卡：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;數據看起來非常漂亮&lt;/li&gt;
&lt;li&gt;但外觀拆裝痕跡又很重&lt;/li&gt;
&lt;li&gt;結構狀態也明顯被動過&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;那就不能只憑「ECC 全零」這一點來判斷。&lt;/p&gt;
&lt;p&gt;可以用一個很形象的比喻來理解：就像一台老車，到了很多年後突然顯示里程 &lt;code&gt;0&lt;/code&gt;、輪胎幾乎沒有磨損，你很難不懷疑里程表被人動過。&lt;/p&gt;
&lt;p&gt;放到 &lt;code&gt;V100&lt;/code&gt; 上也是一樣：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;數據太完美，不一定是好事&lt;/li&gt;
&lt;li&gt;更重要的是數據、外觀、壓力測試結果能不能互相對得上&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;六壓力測試不能省但只測核心也不夠&#34;&gt;六、壓力測試不能省，但只測核心也不夠
&lt;/h2&gt;&lt;p&gt;可以用 &lt;code&gt;gpu-burn&lt;/code&gt; 之類的工具做壓力測試，先壓個幾分鐘到十幾分鐘，觀察：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;是否穩定&lt;/li&gt;
&lt;li&gt;是否掉卡&lt;/li&gt;
&lt;li&gt;是否出現新的 &lt;code&gt;ECC&lt;/code&gt; 錯誤&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;但還有一點也要特別注意：&lt;/p&gt;
&lt;p&gt;只測核心，不代表整張卡就真的沒問題。&lt;/p&gt;
&lt;p&gt;因為 &lt;code&gt;V100&lt;/code&gt; 的很多翻車，不是核心先死，而是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;供電部分溫度過高&lt;/li&gt;
&lt;li&gt;底板區域散熱不足&lt;/li&gt;
&lt;li&gt;熱點溫度過高&lt;/li&gt;
&lt;li&gt;轉接板與散熱系統長期處在危險邊緣&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;所以壓力測試只能說明「這張卡現在能跑」，不能單獨證明「這套 DIY 方案能長期穩定使用」。&lt;/p&gt;
&lt;h2 id=&#34;七diy-玩家最容易翻車的不是買卡而是散熱與供電&#34;&gt;七、DIY 玩家最容易翻車的，不是買卡，而是散熱與供電
&lt;/h2&gt;&lt;p&gt;這大概也是整篇裡最值得記住的部分。&lt;/p&gt;
&lt;p&gt;核心觀點很明確：&lt;/p&gt;
&lt;p&gt;對 &lt;code&gt;DIY&lt;/code&gt; 玩家來說，隨便拼一個底板，再壓一個普通水冷頭上去，並不是穩妥方案。&lt;/p&gt;
&lt;p&gt;問題在於 &lt;code&gt;V100&lt;/code&gt; 不是普通消費卡，它是一張：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;功耗高&lt;/li&gt;
&lt;li&gt;發熱大&lt;/li&gt;
&lt;li&gt;熱分布複雜&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;的伺服器加速卡。&lt;/p&gt;
&lt;p&gt;除了核心本體發熱，底板、供電區域、連接器區域同樣會發熱，而且溫度並不低。&lt;/p&gt;
&lt;h3 id=&#34;1-不要只盯著-gpu-平均溫度&#34;&gt;1. 不要只盯著 GPU 平均溫度
&lt;/h3&gt;&lt;p&gt;很多監控軟體顯示的是整卡平均溫度，但真正更危險的，往往是 &lt;code&gt;hot spot&lt;/code&gt;。&lt;/p&gt;
&lt;p&gt;也就是說：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;你看到表面溫度只有六十幾度&lt;/li&gt;
&lt;li&gt;但局部熱點可能早就超過一百度&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;這也是為什麼很多看起來「溫度還行」的 &lt;code&gt;DIY V100&lt;/code&gt;，最後還是會突然報廢。&lt;/p&gt;
&lt;h3 id=&#34;2-底板散熱一定要考慮&#34;&gt;2. 底板散熱一定要考慮
&lt;/h3&gt;&lt;p&gt;底板和供電區域散熱不能忽略。&lt;/p&gt;
&lt;p&gt;如果只是給核心上了個散熱器，但：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;MOS&lt;/code&gt; 沒顧到&lt;/li&gt;
&lt;li&gt;底板沒有做好導熱&lt;/li&gt;
&lt;li&gt;背面沒有足夠的散熱設計&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;那整套方案依然是不完整的。&lt;/p&gt;
&lt;h3 id=&#34;3-低價拼裝水冷方案風險很高&#34;&gt;3. 低價拼裝水冷方案風險很高
&lt;/h3&gt;&lt;p&gt;對那種「隨便找個轉接底板，再上個便宜一體水冷」的方案，顯然要抱持保留態度。&lt;/p&gt;
&lt;p&gt;問題不在於它一定會立刻壞，而在於它經常存在：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;水道覆蓋不均&lt;/li&gt;
&lt;li&gt;供電區散熱不完整&lt;/li&gt;
&lt;li&gt;熱點區域沒有真正壓住&lt;/li&gt;
&lt;li&gt;長期運行後壽命不可控&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;八如果一定要-diy至少注意這幾件事&#34;&gt;八、如果一定要 DIY，至少注意這幾件事
&lt;/h2&gt;&lt;p&gt;比較核心的建議包括：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;優先選成熟一點、口碑更穩定的底板方案&lt;/li&gt;
&lt;li&gt;不要只看核心散熱，背面供電區和底板導熱也要做&lt;/li&gt;
&lt;li&gt;水冷頭要看覆蓋和均熱能力，不是隨便能壓上去就行&lt;/li&gt;
&lt;li&gt;壓力測試之後還要繼續觀察溫度、熱點與長期穩定性&lt;/li&gt;
&lt;li&gt;電源品質也會影響嘯叫與整體穩定&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;換句話說，&lt;code&gt;DIY V100&lt;/code&gt; 真正難的不是「裝上去能亮」，而是「裝上去之後還能長期穩定地活」。&lt;/p&gt;
&lt;h2 id=&#34;九嘯叫與轉接板個體差異也都是現實問題&#34;&gt;九、嘯叫與轉接板個體差異，也都是現實問題
&lt;/h2&gt;&lt;p&gt;最後還有兩個經常被忽略的點：&lt;/p&gt;
&lt;h3 id=&#34;1-嘯叫不一定能徹底消除&#34;&gt;1. 嘯叫不一定能徹底消除
&lt;/h3&gt;&lt;p&gt;它和卡本身體質、電感、電容、供電狀態都有關，不是換一根線或加一個小配件就一定能百分之百解決。&lt;/p&gt;
&lt;h3 id=&#34;2-轉接板個體差異很大&#34;&gt;2. 轉接板個體差異很大
&lt;/h3&gt;&lt;p&gt;這也是為什麼有些賣家即使願意賣裸卡，也會強調：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;先上機測試&lt;/li&gt;
&lt;li&gt;記錄序號&lt;/li&gt;
&lt;li&gt;做壓力測試&lt;/li&gt;
&lt;li&gt;全程錄影&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;因為很多糾紛未必出在晶片本體，而是出在後續搭配的轉接板與散熱方案上。&lt;/p&gt;
&lt;h2 id=&#34;結語&#34;&gt;結語
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;Tesla V100&lt;/code&gt; 現在還值不值得買？答案是：值得，但前提是你知道自己買的是什麼，也知道後面要怎麼用。&lt;/p&gt;
&lt;p&gt;如果你只看：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;能不能點亮&lt;/li&gt;
&lt;li&gt;&lt;code&gt;ECC&lt;/code&gt; 是否全零&lt;/li&gt;
&lt;li&gt;賣家有沒有說「原廠拆機」&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;那遠遠不夠。&lt;/p&gt;
&lt;p&gt;真正更值得看的，是這幾件事：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;年份與批次是否對得上&lt;/li&gt;
&lt;li&gt;外觀拆裝痕跡是否異常&lt;/li&gt;
&lt;li&gt;底板和結構是否被明顯動過&lt;/li&gt;
&lt;li&gt;壓力測試時錯誤是否增長&lt;/li&gt;
&lt;li&gt;你的散熱與供電方案是否真的可靠&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;尤其對 &lt;code&gt;DIY&lt;/code&gt; 玩家來說，&lt;code&gt;V100&lt;/code&gt; 最危險的地方，往往不是「買到老卡」，而是「低估了這類卡對散熱、供電與改造品質的要求」。&lt;/p&gt;
</description>
        </item>
        
    </channel>
</rss>
