クラスタからノードを削除する

気が付いたらノードが落ちていた。
再起動を試みると成功したり失敗したりする。ログによると /dev/sda でエラーが出てた。
古い PLEXTOR PX-128M5P の調子が悪くなったみたい。今までありがとう。

復旧には使用中の 1ストレージ(SSD)だけで済ますこともできる。
が、せっかく?だし NFS からのリストア確認もできるから、売れ筋 NVMe SSD の中でも発熱の少ない(と思われる)Western Digital の WD Blue™ SN550 NVMe™ SSD (500G)を購入してシステムルート用に使うことにした。
あわせて、心配性だから安価な銅製ヒートシンクも購入。

目次

不要なノードを削除する

準備ができたらまずは、次のサイトを参考に生きているノード PVE-1 に ssh でログインして、クラスタから落ちたノード PVE-2 を切り離す。

ハマったのは WebGUI の表示。コマンド # pvecm nodes で確認する限りでは切り離されているものの、WebGUI 画面にはノード PVE-2 が x 印で残っている。 完全に消し去るには /etc/pve/nodes 以下の不要なノードを削除しないといけないらしい。が、root 権限でも何かしらのサービスが動作しているため消すことができなかった。サービス pve-cluster を stop すると /etc/pve/nodes の中は空っぽになるが、pve-cluster を start すると復活する。

あれこれ試行錯誤や再起動しているうちに、無事ノード pve-2 が消えた。おそらく、先人たちの手順をそのまま踏襲すれば問題なかった可能性が高いから、暇なときに仮想マシンでクラスタを構成して試してみよう。

新規インストール

落ちたノード(PVE-2)のパーツを取り替えて普通に PVE をインストールする・・・が、途中でパッケージの解凍に失敗してインストールが終わらなかった。UEFI は特にいじってない。
3回ほど繰り返してもダメだったから、最初の画面で debug モードを選択してインストールしてみた。Ctrl+D で次々進むと、難なくインストールが終了した。なので原因は不明。

インストールが終了したら、NFS の設定を終えておく。

クラスタに追加

こっちの記事のとおり。特に問題なくスムーズに追加できた。

最後に管理画面のストレージから NFS を追加して、保存されているバックアップから仮想マシンをリストアしてみたところ、無事に復旧できることを確認できた。

これで、いつ本体が落ちても大丈夫。

・・・今更だけど、新しい PC をすぐに調達できるなら、PC 1台と NFS の使える NAS で問題なさそう。

コメント

コメントする

目次
閉じる