Lenovo HR630x / HR650x メモ:LGA3647、8259CL、Optane と注意点

HR630x の構築ログと HR650x のトラブルメモを参考に、Lenovo HR630x / HR650x のような LGA3647 サーバーベアボーンについて、選び方、CPU と Optane の組み合わせ、VRM アンロック、ファン制御、riser、バックプレーン、BMC/UEFI の注意点を整理する。

最近、LGA3647 プラットフォームの中古サーバーがかなり安くなってきました。クラウド事業者から退役した Lenovo HR630x / HR650x も、いわゆるジャンク好きや HomeLab 用途の候補に入ってきています。魅力は分かりやすく、デュアルソケット Xeon Scalable、大量のメモリスロット、OCP NIC、U.2 バックプレーン、IPMI 管理に加えて、一部の第 2 世代 Xeon OEM CPU と Optane PMem の価格メリットがあります。

ただし、この手の機械は普通のデスクトップ PC のアップグレードとは違います。買う前に、マザーボードのバージョン、CPU 世代、VRM の電力制限、メモリ互換性、専用電源、ファン騒音、入手しづらい riser、ディスクバックプレーンとトレイ、BMC パスワード、BIOS が十分新しいか、といった点を先に考えておく必要があります。

この記事では、2 本の構築・トラブル記録をもとに内容を整理します。特定の 1 台の構成をそのまま再現するのではなく、HR630x / HR650x という選択肢のメリットと落とし穴をまとめることが目的です。

プラットフォームの位置づけ

HR630xHR650x は、Lenovo の hyperscale 向け LGA3647 サーバープラットフォームです。簡単に言うと次のようになります。

  • HR630x は 1U 形状で、筐体が薄く、拡張スペースがかなり限られます。
  • HR650x は 2U 形状で、拡張、冷却、取り付けスペースに比較的余裕があります。
  • 両者はマザーボード関連の資料に共通点が多く、実践例も相互に参考になります。
  • この種の機械はクラウド退役品として出回ることが多く、安い一方で構成が完全とは限りません。

静かで省電力な小型サーバーを机の横に置きたいだけなら、最適解ではありません。低コストでデュアル Xeon、多めの PCIe、たくさんのメモリスロット、リモート管理機能が欲しい場合には魅力があります。

ベアボーンの付属品を先に確認する

この種のベアボーンを買うときは、本体価格だけを見てはいけません。本当の総コストは、何が欠けているかで決まります。

特に確認したい項目は次の通りです。

  • CPU ヒートシンクが 2 個付属しているか。
  • ファンがすべて揃っているか。
  • 電源ユニットの数と容量が足りているか。
  • U.2 / 2.5 インチ用バックプレーンが付属しているか。
  • ディスク用ケーブルがあるか。
  • ディスクトレイが付属しているか。
  • PCIe riser が付属しているか。
  • OCP NIC が付属しているか。
  • マザーボードが 24 DIMM 版か 16 DIMM 版か。

一見安く見える機械でも、riser、トレイ、バックプレーン、専用電源が欠けていると、後から部品を探すほうが大変になることがあります。特に HR650x の riser、U.2 バックプレーン、ディスクトレイは中古市場でいつでも安く見つかるとは限りません。

CPU:安い 8259CL に手間がかかる理由

このプラットフォームでよく見かけるコスパ重視の構成は、第 2 世代 Xeon Scalable の OEM CPU、たとえば Platinum 8259CL を使う方法です。価格が安く、コア数とスレッド数が多く、第 2 世代なので第 1 世代 Optane Persistent Memory と組み合わせられる点が魅力です。

ただし、安いものには理由があります。8259CL は OEM モデルで、TDP は約 210W です。多くのプラットフォームが標準で想定する 205W 制限を少し超えています。この差は小さく見えますが、一部のマザーボードでは標準状態で起動できず、VRM コントローラ側の電流または電力関連の制限を変更する必要があります。

一般的な方法は、MCP2221A のような USB-I2C ツールをマザーボード上の VRM I2C 端子に接続し、PXE1610C などの VRM コントローラに新しい制限値を書き込むことです。参考例では、HR630x / HR650x 向けに次のようなコマンドが使われています。

1
ModTool.exe -PXE1610C 74 76

ここで重要なのは、コマンドをそのままコピーしないことです。まず自分のマザーボードの VRM 型番、I2C 端子の位置、SCLSDAGND の並び、I2C アドレスを確認します。配線ミスや別プラットフォーム向けコマンドの流用は、CPU そのものより危険です。

起動確認用 CPU を用意しておく

届いた機械の BIOS が古い場合や、VRM 変更がまだ済んでいない場合、8259CL をいきなり載せても画面が出ないことがあります。このとき、安い第 1 世代 Xeon を起動確認用 CPU として用意しておくとかなり楽です。

起動確認用 CPU の用途は主に次の通りです。

  • BIOS に入り、バージョンを確認する。
  • BIOS と BMC を更新する。
  • マザーボード、メモリ、電源、ファンが正常か確認する。
  • VRM 変更前に基本的なハードウェア故障を切り分ける。

販売者が BIOS を更新済みで、そのまま起動できる個体なら不要かもしれません。しかし初心者にとっては、トラブルシュートの難易度を大きく下げてくれます。

Optane PMem がこのプラットフォームの見どころ

第 2 世代 Xeon Scalable は、第 1 世代 Intel Optane DC Persistent Memory、いわゆる DCPMM / PMem をサポートします。DIMM スロットに挿し、BIOS でメモリモードまたは永続ブロックデバイスとして設定できます。

これも 8259CL のような第 2 世代 CPU が魅力的に見える理由の一つです。大容量 DDR4 RDIMM / LRDIMM が高いとき、中古 Optane PMem は低コストで容量を増やす選択肢になります。

ただし、Optane は通常の DRAM を完全に置き換えるものではありません。注意点は次の通りです。

  • DCPMM 対応の第 2 世代 Xeon が必要です。
  • BIOS が Optane をサポートし、正しく認識する必要があります。
  • 通常は DRAM をキャッシュまたは組み合わせ用として必要とします。
  • スロット位置とチャネルの組み合わせは Lenovo のマニュアルに従うべきです。
  • 性能は DRAM と SSD の中間で、通常のメモリと同じとは考えないほうがよいです。
  • namespace を作成し、/dev/pmem0 のようなブロックデバイスとして使えます。

低コストで大容量メモリ風の環境を試したいなら Optane は面白い存在です。一方、メモリ帯域を最大化したい場合、少チャネルの Optane 構成は向きません。

メモリスロットのバージョンと互換性

HR630x / HR650x には 24 DIMM 版と 16 DIMM 版が存在する場合があります。注文前に、商品タイトルだけで判断せず、販売者にマザーボード写真を見せてもらうのが安全です。

メモリは、できるだけ同じブランド、同じ周波数、同じ容量、同じ Rank のものをまとめて買うほうが安定します。参考記録では、混在構成で認識が不安定になったり、CPU やメモリの位置を変えないと認識されないケースが触れられています。

無難な原則は次の通りです。

  • 公式マニュアルのスロット順序に従って取り付ける。
  • ブランドや仕様をむやみに混在させない。
  • 不確かな場合は最小構成で起動確認する。
  • デュアルソケットでは、各 CPU 側のメモリチャネルを個別に確認する。
  • Optane を使う場合は、DRAM と PMem のチャネル組み合わせを特に確認する。

サーバーメモリは「挿さるだけ挿せば必ず起動する」ものではありません。容量が大きく、モジュールが混在するほど、切り分けのコストは高くなります。

また、メモリは適当に挿してはいけません。Lenovo の公式ドキュメントには、独立モードでの DIMM 取り付け順序が明確に定められています。組み立て前にマニュアルでスロットを確認し、最小起動構成から段階的に増やすのがおすすめです。特にデュアルソケット、容量混在、Rank 混在、Optane PMem 併用では、誤った挿し方により起動しない、一部メモリが認識されない、片方の CPU 側のチャネルしか認識されない、といった問題が起こり得ます。

ファンと騒音を軽く見ない

この種の機械は、寝室や書斎向けに設計されていません。特に 1U の HR630x は、ファン回転数が高く、音も鋭く、起動時の標準制御もかなり保守的です。

構築記録によると、標準状態のファン回転数はかなり高く、騒音を下げるには IPMI / CLI による制御が必要です。調整後はアイドル時の音をかなり抑えられますが、デュアル高消費電力 CPU の高負荷時には十分な風量が必要です。

ファンを調整するときは、次の温度を同時に確認します。

  • CPU 温度。
  • VRM 温度。
  • PCH 温度。
  • メモリ温度。
  • 電源温度。
  • 吸気温度と排気温度。

CPU だけを見てはいけません。サーバーマザーボード上の多くのチップは筐体全体の風道に依存しています。ファンを下げすぎると、CPU は問題なく見えても、PCH、VRM、NIC が先に熱くなることがあります。

ファン回転数を変更する

HR650x / HR630x のファンは、IPMI raw コマンドで制御できます。コミュニティスクリプトで使われているコマンド形式は次の通りです。

1
ipmitool -I lanplus -H <BMC_IP> -U <USER> -P '<PASSWORD>' raw 0x2e 0x30 00 00 <SPEED>

<SPEED> は目標ファン速度のパーセントとして扱えます。例:

1
2
3
4
5
6
7
8
# 10% に設定
ipmitool -I lanplus -H 192.168.1.100 -U ADMIN -P 'password' raw 0x2e 0x30 00 00 10

# 35% に設定
ipmitool -I lanplus -H 192.168.1.100 -U ADMIN -P 'password' raw 0x2e 0x30 00 00 35

# 100% に設定。全速テストや高温時の退避用
ipmitool -I lanplus -H 192.168.1.100 -U ADMIN -P 'password' raw 0x2e 0x30 00 00 100

サーバー本体の OS 上で実行し、IPMI 関連カーネルモジュールが読み込まれている場合は、BMC ネットワークを経由せずに実行できます。

1
ipmitool raw 0x2e 0x30 00 00 20

調整前に、ipmitool がセンサーを読めることを確認します。

1
2
ipmitool -I lanplus -H <BMC_IP> -U <USER> -P '<PASSWORD>' sensor
ipmitool -I lanplus -H <BMC_IP> -U <USER> -P '<PASSWORD>' sdr

ローカル実行で ipmitool がインターフェイスを見つけられない場合、Linux では次のモジュールを読み込みます。

1
2
3
modprobe ipmi_devintf
modprobe ipmi_msghandler
modprobe ipmi_si

安全なのは、非常に低い固定回転数にすることではなく、CPU 温度に応じて段階制御する方法です。たとえば次のような方針です。

1
2
3
4
5
6
CPU 40℃ 未満:10%
CPU 40℃ から 45℃:14%
CPU 45℃ から 50℃:20%
CPU 50℃ から 60℃:50%
CPU 60℃ から 80℃:80%
CPU 80℃ 超:100%

この方針は shell、Python、systemd timer などで実装できます。数秒ごとに CPU 温度を読み取り、対応するファン速度を書き込むだけです。コミュニティの HR650X-IPMI-Auto-Fan スクリプトもこの考え方です。

手動で調整する場合は、まず保守的な値から始めます。アイドル時は 20% から試し、CPU、PCH、VRM、メモリ、NIC、電源温度が安定していることを確認してから、14%10% へ下げます。高負荷テストでは最初から低回転にせず、50% 以上で冷却余裕を確認してから、騒音と温度のバランスを探します。

IPMI raw コマンドはベンダー OEM コマンドであり、BMC ファームウェアのバージョンによって挙動が違う可能性があります。実行前にセンサーが正常に読めることを確認し、すぐ高回転へ戻せるコマンド端末を残しておくべきです。温度表示が異常、センサーが na、ファン回転数が期待通り変化しない場合は、それ以上回転数を下げないほうが安全です。

電源、riser、バックプレーン、ディスクトレイ

HR650x の大きな落とし穴の一つは、電源インターフェイスと多くの拡張部品が汎用品ではないことです。電源は Lenovo 専用形状で、壊れた場合や不足している場合の追加コストは低くありません。

riser も事前確認が必要です。riser の種類によって、フルハイト・フルレングス、フルハイト・ハーフレングス、ロープロファイルなど、使えるカード構成が変わります。GPU、HBA、25G/40G NIC、NVMe 変換カードを後から挿す予定があるなら、購入時点で riser の種類を確認しておくべきです。

ディスクバックプレーンにも複数の構成があります。2U.2、4U.2、8U.2、2.5 インチベイ用バックプレーンなどを見かけます。バックプレーン、ケーブル、トレイ、RAID カード、HBA はすべて追加費用になり得ます。

現実的には、計算用途で起動さえすればよいなら、すべてのトレイやバックプレーンを急いで揃える必要はありません。オールフラッシュストレージや高拡張性が目的なら、ベアボーン購入時点でこれらの部品も総予算に入れるべきです。

BMC、BIOS、管理

クラウド退役機では、BMC パスワードが不明なことがよくあります。BIOS に入れるなら、BIOS 上で管理ユーザーを作成またはリセットできる場合があります。OS まで起動できるなら、ipmitool で BMC ユーザーを操作することもできます。

BIOS と BMC は、できるだけ新しめの安定版へ更新するのがおすすめです。理由は次の 3 つです。

  • より多くの第 2 世代 Xeon 型番に対応する。
  • Optane PMem の認識と管理が改善される。
  • BMC、ファン制御、ハードウェア互換性の問題が修正される。

参考資料では、HR630x / HR650x8259CL と Optane を使う場合、BIOS 更新が必要になる可能性があるとされています。個体差があり、販売者が更新済みの場合もあれば、自分で作業が必要な場合もあります。

HR650x の BIOS と BMC は、Lenovo サポートページからダウンロードできます。対応する参考リンクは次の通りです。

1
https://datacentersupport.lenovo.com/cn/zc/products/servers/thinksystem-hyperscale/hr650x/7x57/7x57cto1ww/j300cvx2/downloads/driver-list/

また、HR650x は Above 4G Decoding に対応していますが、Resizable BAR の対応はあまり期待できません。大容量 VRAM の GPU や GPU 計算を考えている場合は、BIOS オプションと電源ケーブル計画を先に確認する必要があります。

向いている人

この種の機械が比較的向いている人は次の通りです。

  • 安価に大量の x86 スレッドが欲しい。
  • アイドル時の消費電力と騒音を許容できる。
  • ラックマウントサーバーを置くスペースがある。
  • マニュアル、基板シルク、マルチメーターで配線を確認できる。
  • 中古プラットフォームの部品不確実性を受け入れられる。
  • IPMI、BIOS、VRM、DCPMM の切り分けにある程度の忍耐がある。

あまり向いていない人は次の通りです。

  • 静かな NAS が欲しいだけ。
  • 低消費電力の 24 時間稼働ミニサーバーが欲しい。
  • BMC、ファン、riser、バックプレーン、専用電源を扱いたくない。
  • 予備 CPU、予備メモリ、基本的なデバッグツールがない。
  • 購入後に BIOS 更新、VRM 変更、ファン調整をすることを受け入れられない。

まとめ

HR630x / HR650x の価値は、低価格で LGA3647 デュアルソケットサーバープラットフォームを入手し、8259CL のような安価な第 2 世代 Xeon と Optane PMem を組み合わせて、スレッド数、メモリ容量、リモート管理機能に優れた HomeLab 計算ノードを作れる点にあります。

一方で落とし穴も明確です。高消費電力 OEM CPU は標準で動かない場合があり、MCP2221A による VRM 変更が必要になることがあります。メモリスロットのバージョンと互換性確認も必要です。ファン騒音とアイドル消費電力は家庭用 PC 感覚では扱えません。riser、バックプレーン、ディスクトレイ、電源も追加コストになり得ます。

予算がかなり限られていて、かつ手を動かすこと自体を楽しめるなら、面白い選択肢です。安定、省心、静音を重視するなら、総消費電力、騒音、付属品の完全度、今後の保守コストを先に計算してから乗るかどうか決めるのがよいです。

参考リンク

记录并分享
Hugo で構築されています。
テーマ StackJimmy によって設計されています。