跳至主要內容

pve 主機壞了,土炮還原

Last Updated on 2025-10-08 by william

前幾天一台很重要的 pve 主機壞了,天真我以為 NAS 沒壞,還原簡單,殊不知付出慘痛代價,在此紀錄一下。

是這樣的,中秋節當天,我原本想依據傳統,帶吐司麵包到朋友那邊蹭吃蹭喝,結束前走人不用收拾,中午我臨時到市場加買兩串蕉的時候,同事突然打來說無法遠端連線,我只好回家察看公司伺服器是否正常。

一查不得了,主機沒有運作,必須到公司看狀況。我火急火燎到了公司發現主機當機,我這才想起上週五該主機突然秀逗(主機平常很穩啊),當時經過重開機,系統恢復正常,我就不在意,開心等著放三天連假。

過兩天,中秋節當天收到當機回報,我過去重開機,又正常了,但因為發生第二次,心中第六感覺得不安,我等了兩小時才走,期間用 obsidian 紀錄該主機上面 vm 的訊息。

我設計的筆記長這樣,總共有兩個:

一個是紀錄主機基本訊息。
尤其是網路卡的作用,我的網路卡基本上有三個,一個對內(br0)、一個對NAS(br1)、一個對外(br2),這是小公司基本配置。

一個是紀錄 vm 訊息,而且我特別截圖把相關配置記下來,也包含網卡。

把主機與vm記錄下來後,我就放心回家去了,因來不及到朋友家吃吃喝喝,晚上8點想說無聊再查看主機,沒想到又當機了,我又跑到公司重開主機,這次主機不依了,直接GG。

糟了,這主機很重要阿,我決定要重新安裝新的 pve 系統,然後將 vm 資料還原。

安裝新的 pve 9 一直出現當機,無法很順利進行開機步驟,我覺得是顯卡壞了,於是花了很多時間換顯卡,還是不行,後來又換成 pve 8,也不OK,最後改成 pve 7 就可以安裝了,事後我爬文,應該是主機 CPU 是 AMD Ryzen 9 5900X 造成的,解法如下:

出處在此。開機時安裝選擇手動增加參數,加上以下設定即可解決 5900x 的問題

nomodeset vga=normal video=vesa:off"

重新安裝完 pve 7 之後,重頭戲就是還原 vm 設定,我的作法:

  1. 新增一個新vm
  2. 進入 pve 主機,找到該新 vm 設定檔案,用傳說中的 vi ,修改該設定,將網卡等等資料改成 obsidian 紀錄的資料

因為我稍早在 obsidian 有記錄下來 vm 的設定,所以重新配置起來很順利,也不需要挖出原本已經壞掉的開機碟,讀取原本 vm 的配置;但還是不得不說,是我忽略 vm 配置資料都在開機碟,且從沒想過沒備份設定檔案,這很掉漆,應該要定期備份開機碟的 vm 相關設定。


我土炮還原也是不得已的,一來我沒做 vm 快照,二來備份是一個月前,這期間資料增加很多完全不適合還原。幸運的是,我 NAS 用 NFS,vm 最新的 image 檔案很容易取得(我手動再備份一次),所以這次手動安裝 pve,vm ,過程很順利。

重點是:我這次寫在 obsidian 策略是對的,obsidian 可以離線的特性,當系統壞了,我要土炮做事,就可以依靠 obsidian 資料進行設定上的還原

而且最後還能用 obsidian 的 dataview 功能,列出出所有 vm 的索引檔案,對於有些重要設定資料,優勢就出來了,我真是 old school 啊。

分類:技術

搶先發佈留言

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

由 Compete Themes 設計的 Author 佈景主題