仮想化

◇結論

随分遠回りしてしまったけど、2.5inch SSD では限界らしく、各ノードの OSD を NVMe な M.2 SSD に変更したら安定運用できている。

 

最近、特定のノードの OSD が数日毎に down する事象が発生していた。
2.5 inch SATA の SSD を OSD として使用していて、syslog を見る限りでは物理的な要因で落ちているらしい。

ログはこんな感じ。

11月21日に Proxmox 8.3 がリリースされていた。
いつもどおり管理画面のアップデートから内容をサラッと読んでアップグレードを実行。

概要は、

十分な物理メモリーがノードにあれば swap を完全に無効化しても良いだろう。
ただし、メモリーのオーバーコミットを前提としているようなシステムだとノードが不安定になるかもしれない。

4月24日にリリースされていた。注目は VMWare ESXi からのインポートウィザード、Linux カーネルが 6.8 になったこと等。

管理画面からいつもどおりアップデートを実行、ノードを再起動することで新しいカーネルが適用される。
自鯖環境では特に問題なくアップデートが完了した。

クラスタで Ceph を運用していると気になるのが SSD の寿命。5ちゃんねるでも少し話題になっていた。