仮想化

分離したクラスターネットワークのトラフィックを確認する

2024年12月30日(月) - 16:20
Proxmox の Web 管理画面のノードのサマリーに表示されるネットワーク転送量グラフは、最初から存在するネットデバイスのグラフになる。分離したクラスターネットワークの転送量は少ないハズだが、じゃあ実際のところどうなんだということで調べてみた。

PVE のクラスターネットワークを分離してみる

2024年12月28日(土) - 16:18
今に始まったことじゃないけど、バックアップを実行するタイミングでノードのシステムログに次のメッセージが残る。

Dec 28 07:38:29 x300 corosync[1085]: [KNET ] link: host: 3 link: 0 is down
Dec 28 07:38:29 x300 corosync[1085]: [KNET ] host: host: 3 (passive) best link: 0 (pri: 1)

OSD が落ちる原因を調べてみた

2024年12月10日(火) - 15:20
◇結論

随分遠回りしてしまったけど、2.5inch SSD では限界らしく、各ノードの OSD を NVMe な M.2 SSD に変更したら安定運用できている。

OSD が度々落ちる

2024年11月25日(月) - 15:18
最近、特定のノードの OSD が数日毎に down する事象が発生していた。
2.5 inch SATA の SSD を OSD として使用していて、syslog を見る限りでは物理的な要因で落ちているらしい。

Proxmox 8.3

2024年11月23日(土) - 15:16
11月21日に Proxmox 8.3 がリリースされていた。
いつもどおり管理画面のアップデートから内容をサラッと読んでアップグレードを実行。

Proxmox VE の swap を調整する

2024年06月09日(日) - 15:14
十分な物理メモリーがノードにあれば swap を完全に無効化しても良いだろう。
ただし、メモリーのオーバーコミットを前提としているようなシステムだとノードが不安定になるかもしれない。

Proxmox 8.2

2024年04月27日(土) - 15:13
4月24日にリリースされていた。注目は VMWare ESXi からのインポートウィザード、Linux カーネルが 6.8 になったこと等。

管理画面からいつもどおりアップデートを実行、ノードを再起動することで新しいカーネルが適用される。
自鯖環境では特に問題なくアップデートが完了した。

Proxmox をインストールしている SSD の寿命

2024年04月20日(土) - 15:11
クラスタで Ceph を運用していると気になるのが SSD の寿命。5ちゃんねるでも少し話題になっていた。自鯖環境は各ノードとも、2022年11月に TSUKUMO で購入した WD Blue SN570 NVMe SSD 1TB(TBW600)で統一している。

Ceph 18.2.2 にアップデート

2024年04月06日(土) - 15:09
先日 Proxmox のアップデートを実行したら Ceph が 18.2.2 になっていたけど、画像のとおり OSD を再起動していなかったから 18.2.1 のままで動作中だった。