服務器硬件故障處理幾例
硬件故障是指服務器硬件出現(xiàn)異常而導致的各類錯誤。由于服務器構成比較復雜,因此在檢查的時候必須認真、仔細。下面以一臺萬全4500為例說明。(例子,在實際問題中如果遇到相似現(xiàn)象,也需要具體問題具體分析,不要盲目套用)
有一臺萬全4500,配有256M內(nèi)存,使用一個PIII XEON 500帶2M高速緩存的處理器。開機后沒有任何顯示,但系統(tǒng)日志上提示了一條CPU電壓為0伏的信息,系統(tǒng)指示燈三燈不停在閃爍(指示燈三燈閃爍是服務器的另一種報警方式,我會在文后說明)。這種錯誤一般是處理器電壓調(diào)節(jié)模塊(VRM)出錯或CPU出錯或CPU與CPU板塊接觸不良,但也可能是CPU板塊出錯,這時情況就比較復雜了,必須經(jīng)過認真慎重的思考。因為CPU板塊在整個服務器中,占有舉足輕重的地位,如果它出錯服務器是會報致命錯誤的,并且在系統(tǒng)日志中會提示致命錯誤,但報CPU電壓錯的情況也有5%左右。我們立刻把CPU調(diào)換在另一CPU插槽中,開機后依然是剛才的那種故障。所以在初步判斷中,可以排除是CPU板塊壞。
這時,取出CPU仔細擦拭金手指,以及CPU板塊中與CPU接觸的地方后,開機依然無顯示。
相對處理器壞的情況來說處理器電壓模塊(VRM)出現(xiàn)故障的情況比較大。于是立即在另一臺萬全4500中取下一個處理器電壓模塊,安裝在此服務器中。開機后,服務器依然沒有任何顯示,系統(tǒng)日志上依然提示CPU電壓為0伏的信息,系統(tǒng)指示燈三燈依然不停在閃爍。這時的情況就比較明顯了。于是立即從另一臺萬全 4500中取下一個CPU安裝后,開機正常。