大部分用戶選擇Linux操作系統的原因都是因為Linux操作系統的易用性,但是在linux系統發生一些故障的時候我們就需要利用一些補救措施進行故障的排除,下面我們就去看看Linux服務器的典型故障的排除方法。
一、linux系統故障診斷:
我們將按照系統啟動順序為大家介紹LINUX下的故障排除方法。
1、linux系統啟動故障:這是在Linux操作系統中經常會遇到的問題。系統不能啟動的原因主要有——在安裝Linux操作系統的過程中,LILO配置信息錯誤,導致安裝完畢后,系統不能正常啟動;重新安裝其他的操作系統,也經常會導致原來的Linux不能啟動。因為這些新安裝的操作系統默認在計算機中沒有其他的操作系統,因而改寫了硬盤的主引導記錄(MBR),覆蓋了Linux操作系統中的LILO系統引導程序,致使最后無法啟動LILO。在操作Linux操作系統過程中,由於運行了錯誤的Linux命令,使系統重新啟動時出現異常。
如果在Linux操作系統安裝過程中或安裝過程后,制作了Linux系統的急救啟動盤組,使用這些急救盤啟動系統即可進入系統,然后對相應錯誤進行配置即可解決問題:如果沒有制作急救啟動盤組,Linux系統不能啟動,該怎么辦呢?下面介紹三種解決方法。
(1)進入Linux操作系統單用戶模式,在boot提示符后,輸入linux single,在此模式下啟動Linux,LILO配置和網絡配置信息不加載在啟動過程中。
(2)光盤啟動,用第一張安裝Linux操作系統的光盤(啟動光盤)啟動硬盤的Linux系統,主板BIOS里要設置成光盤啟動,重啟機器后,出現boot:提示符后鍵入:
vmlinuz toot=/dev/linuxrootpartition
其中,root=后面填入Linux root分區的分區號,也就是Linux系統的root文件系統所在的硬盤分區位置,例如:vmlinuz root=/dev/hda3 noinitrd。按回車鍵之后,即可進入Linux系統。如果想恢復被破壞的LILO 系統引導程序,可以在編輯/etc/lilo.config之后,運行/sbin/lilo即可。這種方法也適合其他原因對Linux操作系統造成的破壞。
小提示:上面介紹了通過光盤啟動的方法,當然軟盤啟動操作系統的過程與步驟是一樣的。
(3)在DOS下運行loadlin程序啟動系統。在個人計算機使用Linux系統時,通常都是Linux和Windows 9x或Windows 2000並存的。如果知道Linux系統在硬盤上的確切安裝分區,並且有loadlin程序(在Red Hat Linux光盤的dosutil目錄下就有這個程序),也可以啟動Linux系統。Loadlin是DOS系統下的程序,運行它可以從DOS系統下直接啟動Linux系統,快速進入Linux環境。除loadlin程序之外,還需要一個Linux啟動內核的映象文件vmlinuz,在Red Hat linux光盤的images目錄下有這個文件。例如,如果在Windows 2000系統下面,進入DOS的命令模式,然后運行下述的loadlin命令,即可重新進入Linux系統:
loadlin vmlinuz root=/dev/linuxrootpartition
命令執行后,就開始引導Linux系統。用root身份登錄后,編輯/etc/lilo.config之后,運行/sbin/lilo即可,這樣操作后則重新將LILO系統引導程序裝入MBR。
上面介紹的三種方法比較起來還是第一種LILO配置法比較簡單實用,第二種需要光盤的支持,而第三種操作起來相對繁瑣。
2、linux文件系統故障: 在Linux操作系統中,這也是一種經常會遇到的故障。由於系統不正常關機,或突然掉電等原因引起文件系統被破壞。當文件系統被破壞時,可以使用相應的fsck命令進行文件系統的修復。例如下面的命令:fsck /dev/hda5。
小提示:關於fsck命令具有參數的使用方法,可以參閱linux的參考手冊。如果使用的是ext2fs類型的文件系統,就可從軟盤運行e2fsck命令來修正文件系統中被損壞的數據。
但是有一點要注意:如果文件系統被破壞的原因是超級塊被損壞,超級塊是文件系統的“頭部”,它包含文件系統的狀態、尺寸和空閑磁盤塊等信息。如果損壞樂意個文件系統的超級快(例如不小心直接將數據寫到了文件系統的超級快分區中),那么Linux可能會完全不識別該文件系統,即使采用fsck或e2fsck命令也不能修復它了。這時候,只有到安裝光盤中看看有沒有對應的文件系統,將此文件覆蓋原操作系統被破壞的文件來恢復了。如果不小心刪除了系統中重要的文件,也可采用這種方法來試試。
3、linux函數庫故障: 在Linux操作系統中,如果不慎將系統中的函數庫文件破壞,或者破壞了/lib目錄下符號鏈接,那么將導致依賴這些庫的命令無法執行。這也是比較常見的系統故障。
最簡單的解決辦法是用急救啟動盤組啟動系統,在/mnt目錄上安裝硬盤文件系統,然后修復/mnt/lib目錄下的庫。
4、linux登錄系統故障: 由於管理員忘記密碼,或者由於系統受到hk的入侵導致系統密碼文件被修改。導致管理員可能無法用帳號登錄系統。
具體解決方法如下:
(1)在系統啟動時,進入單用戶模式(Linux Single),然后用passwd命令重新設置密碼,或修改密碼文件借口恢復正常。
(2)用急救啟動盤組啟動系統,然后將硬盤的文件系統安裝到/mnt目錄下,編輯/mnt/etc/passwd文件進行恢復。
(3)將安裝系統的硬盤拆下來,放在另一個Linux系統中,然后掛載此硬盤的系統安裝區,將次硬盤分區中的/etc/passwd、/etc/shadow、/etc/group文件覆蓋或修改,也可以恢復。
5、linux系統的KDE環境故障:如果Linux系統的KDE環境無法正常啟動,例如以普通帳號運行startx命令后,出現:“……can not start X server. Perhaps you do not have console ownership?”類似的提示。出現這種提示的原因是可能別的用戶曾經運行KDE環境,並在系統中留下標示此用戶的緩存文件。
運行如下命令:
rm -rf/tmp/*
然后,重新運行startx命令即可進入KDE環境。
如果以普通帳號運行startx命令后,出現“can not start X server”的錯誤提示,並且不斷地有報錯提示的英文字符傷上翻滾,導致無法進入KDE環境。出現這種情況,可能是由於對Linux系統的不正常關機,導致了不能進入Linux的KDE 環境。
在控制台下以root身份登錄,鍵入setup命令,出現系統設置菜單,選擇其中的“X窗口設置”,然后依照提示正確設置顯示器的類型、刷新頻率、顯存大小和分辨率等。這樣將系統中的X 窗口重新設置一遍。
如果沒有報錯,系統會自動啟動KDE環境,需要注意的一點是:在用setup命令進行設置時,可能還會有大量的英文字符在屏幕上翻滾,這是不要緊,請繼續看清屏幕,使用Tab鍵或方向鍵進行上面的配置,配置無誤后,會立刻恢復KDE環境的。
二、網絡故障診斷
既然是服務器,那么linux系統已經要連接到網絡才能發揮他的效果和能量。所以說在實際工作中linux系統的網絡故障也是急需排除的。
1、無法ping通LINUX服務器: 當在Linux系統中IP地址無法Ping通時,主要原因是由於網絡信息配置的錯誤導致的。
具體解決方法介紹如下:
(1)使用ifconfig命令重新配置網卡地址,命令行如下:
$ifconfig eht0192.168.1.2 netmask 255.255.255.0
$ifdown eth0
$ifup eth0
然后用Ping命令,就可以Ping通IP地址192.168.1.2了。
(2)修改系統中的網絡配置文件也可以到到上面的目的,建議使用這種方法,這樣的操作更加可靠。
進入網絡配置文件所在的目錄:
$cd/etc/sysconfig/network-scripts
$1s
ifcfg-eth0 ifdown-ipv6 ifdown-sit ifup-aliases ifup-plip ifup-ppp ifup-sl
ifcfg-1o ifdown-post ifdown-sl ifup-ipv6 ifup-plusb ifup-routes network-functions
ifdown ifdown-ppp ifup ifup-ipx ifup-post ifup-sit network-functions-ipv6
用vi命令修改ifcfg-eth0文件中下面的一行即可,例如:
IPADDR=192.168.1.2
其中192.168.1.2是所要修改或重新配置的地址,配置完畢后,重新啟動機器就可以使IP地址的改動生效。
2、本機無法訪問外部網絡:如果在Linux操作系統中無法訪問外部,例如Ping公網的IP地址不通,而Ping自己機器的地址可以通,一般原因是網關信息沒有配置正確。
解決方法如下:
采用上面的第二種方法(直接修改網關配置文件)可以快速解決問題,操作步驟如下,進入網關配置文件所在目錄:
$cd/etc/sysconfig
$1s
apmd authconfig clock.OLD gpm i18n keyboard network provider
sendmail apm-scripts cdq console harddisks identd kudzu
用vi命令修改此目錄下network文件中下面的一行即可,例如:
GATEWAY=192.168.1.1
其中192.168.1.1是所要修改或重新配置的網關地址,配置完畢后,重新啟動機器就可以使網關地址的改動生效。
3、DNS域名解析故障:如果在Linux系統中無法進行域名解析,最可能的原因是沒有在本地指定有效的域名服務器,這種情況比較常見。
解決辦法如下:
一般修改和域名服務相關的文件如/etc/hosts或/etc/resolv.conf,在這些文件中添加有效的域名服務器的IP地址就可以解決。如果判斷不是本地域名解析的問題,例如在本地可以解析公司域名,但外面的客戶無法正常解析公司域名,則需要和域名注冊服務提供商聯系,一起解決問題。因為此種情況的發生,可能是公司系統中的IP地址和注冊的域名不對應的原因造成的。
需要服務器可以找我喲!
tel: 137 1307 8760
以上就是最常見Linux服務器的典型故障的排除方法,當然由於篇幅原因,關於Linux系統中常見故障及問題也只能點到為止,在這里介紹的知識涉及了一些大家常會遇到的部分,希望對大家有所幫助。