by Joseph Wu
28. September 2011 16:27
我們客戶有 2 組 Modular Server ,最近因為要做 consolidation ,所以 2 組 Modular Server 都升級至最新的 firmware 。 2 組 Modular Server 是在不同時期採購,假設舊的是 A、 新的是 B。
我遇到了一個狀況,A 上面的刀片嵌入至 B 後,沒過多久就打 X 了 (出現 unfit 的錯誤,即 Management Module 無法針對刀片進行操作, ex: remote KVM),如下圖:
在我和硬體廠商討論後,有了下列的一些做法:
1、重開整座刀鋒,讓所有的模組重開 (當然也包括發生錯誤的刀片模組)
2、強制讓刀片重刷 firmware (這比較麻煩些,操作說明如下):
(1) 從下面的圖可以看到,如果要重刷 BIOS 的話,必須將 Jump 接到 2、3 的位置,其它就大同小異
(2)整個刀片的平面圖 (在左下角)
(3)刀片的左下角部份圖
(4) Jump 所在位置圖
3、置換 Management Module
4、整座伺服器重新刷一次 Firmware
5、更換整座刀鋒伺服器
但是每種做法的時間長短不一,有些方法是不適合用在正式上線的機器的,根據上述 4 種方法分別的時間如下:
1、關伺服器 + 關閉/開啟 Modular Server + 開伺服器 = 30分
2、關伺服器 + 置換 Jump + 開伺服器 = 30 分
3、關伺服器 + 置換 Management Module + 開伺服器 = 30 分
4、關伺服器 + 重刷 firmware + 開伺服器 = 2小時
5、關伺服器 + 重新安裝組件(ex: 從舊機箱上拔出所有刀片、並嵌入新的機箱) + 重新設定 (如果只換機殼 chassis,這個部份的時間可以省略) + 開伺服器 = 1 ~ 1.5 小時
好在,我們在第 3 個步驟時就成功了,如果要做到重刷韌體的話,可能就要等過年了。