服务器故障排查技巧

2023-12-10 15:45   SPDC科技洞察   

服务器故障排查技巧

一、观察法:

观察系统板上的诊断LED指示灯,可以快速确定故障所在部位。

1. POST上诊断LED灯亮,表示系统板有致命错误。这时,应立即关掉电源,联系服务站派工程师检修。

2. 某组LED灯亮,表示该组有错误。此时,应检查该组的各个设备。

3. 所有的诊断LED灯都不亮,表示系统板有致命错误。这时,应立即关掉电源,联系服务站派工程师检修。

4. 有一组以上的诊断LED灯亮,表示该组有错误。这时,可以正常启动机器,进入COMS设置,按F4键即可消除错误。如果不能消除错误,则关掉电源,联系服务站派工程师检修。

二、最小系统法:

最小系统法是指当判断某一硬件设备有故障时,可以跳过该设备,将其他硬件设备逐个插入计算机主机,以判断是否存在故障。如果某个设备插入后能正常工作,则说明该设备不存在故障。反之,如果某个设备插入后系统工作不正常,则说明该设备存在问题。

三、逐步添加/去除法:

逐步添加法是指将硬件一次插入计算机主机,直到找到故障为止。如果某个硬件插入后系统工作不正常,则说明该硬件存在问题。

逐步去除法是指将硬件一次从计算机主机中去除,直到找到故障为止。如果某个硬件去除后系统工作正常,则说明该硬件存在问题。

四、隔离法:

隔离法是指将可能产生冲突的硬件设备从系统中去除或在工作时单独使用它们的方法。例如,有些型号的显卡在工作时可能与其它硬件产生冲突。解决这类问题的方法是将产生冲突的设备从系统中去除或在工作时单独使用它们。

五、替换法:

替换法是指用好的硬件替换可能有故障的硬件的方法。这是一种比较简单且有效的方法。

相关阅读