(1)觀察網(wǎng)絡(luò)設(shè)備的指示燈。這是了解故障信息最簡單、最基本最直觀的方法,計算機網(wǎng)卡、交換設(shè)備、調(diào)制解調(diào)器、路由器、網(wǎng)關(guān)被服都有實時的LED工作指示燈,便于般用戶進行查看工作狀態(tài)。一般情況下,綠燈表示物理連接正常,綠燈亮且一直閃爍表示數(shù)據(jù)通信正常,不亮表示無連接或線路不通,紅燈表示連接故障(但電源指示燈一般程紅色)。
(2)設(shè)備以前工作是否正常。一般情況下,對于一個曾經(jīng)工作正常然后出現(xiàn)故障的設(shè)備與一個從未正常工作的設(shè)備之間存在著巨大的差別。對于此類問題,用戶一般不會主動提出,因此網(wǎng)絡(luò)管理員必須以提問的方式來獲取相關(guān)信息。對于曾經(jīng)工作正常然后出現(xiàn)故障的設(shè)備,可以知道一定是什么外部原因或人為原因破壞了這種正常工作的設(shè)備,對此網(wǎng)絡(luò)管理員應(yīng)該進入故障分析模式,與用戶一起探討進行了哪些操作進而確定故障發(fā)生的具體階段。而對于一個從未工作正常的設(shè)備則可斷定一開始就存在問題,對此應(yīng)該進入安裝模式進行初始化等。
(3)故障發(fā)生的時間。準確了解故障發(fā)生的日期和時間,是間歇性的還是集中在某一固定時間段,這樣故障之后可以查看故障發(fā)生的時刻相關(guān)的事件報告,確定是否該段時間是否有異常外部異常或其他程序正在運行。例如,但故障發(fā)生時是否有其他大型應(yīng)用服務(wù)突然開啟或正在打開其他電氣設(shè)備(如大功率電器等)。
(4)運行環(huán)境是否發(fā)生了改變。例如,機房總體布局是否改動?工作站或服務(wù)器上的軟硬件系統(tǒng)是否升級或安裝新的應(yīng)用程序等?是否對網(wǎng)絡(luò)配置進行了更新?是否安裝了新服務(wù)器?是否提供了新的網(wǎng)絡(luò)服務(wù)功能?網(wǎng)絡(luò)拓撲結(jié)構(gòu)是否發(fā)生變化而導(dǎo)致環(huán)路?網(wǎng)絡(luò)設(shè)備和終端是否安裝了新協(xié)議?是否新增或刪除了路由選項?網(wǎng)絡(luò)的域管理及組管理是否發(fā)生了變化?所有這些軟硬件改動網(wǎng)絡(luò)管理員都要一一排查,找出可疑點。
(5)不要忽視一些明顯的人為錯誤。比如,網(wǎng)站制作用戶忘了打開交換路由設(shè)備的電源,或者忘了將網(wǎng)線插上等日常錯誤。有經(jīng)驗數(shù)據(jù)表明,這種故障的可能性其概率不低于10%。
本文地址:http://knowyourextract.com//article/3620.html