索引節點(inode)爆滿問題處理


 

關於磁盤空間中索引節點爆滿的問題還是挺多的,借此跟大家分享幾個情況:

情況一

在公司一台配置較低的Linux服務器(內存、硬盤比較小)的/data分區內創建文件時,系統提示磁盤空間不足,用df -h命令查看了一下磁盤使用情況,發現/data分區只使用了66%,還有12G的剩余空間,按理說不會出現這種問題。

后來用df -i查看了一下/data分區的索引節點(inode),發現已經用滿(IUsed=100%),導致系統無法創建新目錄和文件。
[root@bastion-IDC ~]# df -i
Filesystem Inodes IUsed IFree IUse% Mounted on
.......
.......
/dev/mapper/VolGroup-lv_home
53452800 53452800 0 100% /data

inode譯成中文就是索引節點,每個存儲設備(例如硬盤)或存儲設備的分區被格式化為文件系統后,應該有兩部份,一部份是inode,另一部份是Block,Block是用來存儲數據用的。而inode呢,就是用來存儲這些數據的信息,這些信息包括文件大小、屬主、歸屬的用戶組、讀寫權限等。inode為每個文件進行信息索引,所以就有了inode的數值。操作系統根據指令,能通過inode值最快的找到相對應的文件。

這台服務器的Block雖然還有剩余,但inode已經用滿,因此在創建新目錄或文件時,系統提示磁盤空間不足。

排查是由於/data/cache目錄中存在數量非常多的小字節緩存文件,占用的Block不多,但是占用了大量的inode。

解決方案:
1)刪除/data/cache目錄中的部分文件,釋放出/data分區的一部分inode,特別要留意那些spool出來的文件,這種文件一般會占用比較多的節點,因為比較小而且零碎,同時要多留意日志文件信息等

2)用軟連接將空閑分區/opt中的newcache目錄連接到/data/cache,使用/opt分區的inode來緩解/data分區inode不足的問題:
# ln -s /opt/newcache /data/cache

3)更換服務器,用高配置的服務器替換低配置的服務器。

情況二

問題:使用"df -h"命令發現磁盤使用率沒有占滿,但是無法寫入文件,提示"no space left on device"!
原因:磁盤的inode節點使用爆滿了!("df -i"命令查看/var空間的inode爆滿)。

-------------------------------------------------------------------------------
可能原因1:
crontab里面定時執行的句子里沒有加 > /dev/null 2>&1,系統中cron執行的程序有輸出內容,
輸出內容會以郵件形式發給cron的用戶,而sendmail沒有啟動所以就產生了很大零碎的文件:
crontab的job有問題,造成/var/spool/clientmqueue中產生許多的零碎文件。

處理方法:
用"rm -rf *"會不能刪除,並會有相應的提示,大意是參數太多。

正確方法:
在/var/spool/clientmqueue/下執行命令:
# lsattr ./|awk -F"/" '{print $3}'|xargs -i rm -rf {}

表示用lsattr列出./下面的文件名的屬性,用awk取出名字,然后rm -rf

還有一個比較靠譜的方法:
# find /var/spool/clientmqueue/ -type f -exec rm {} \;

或者在/var/spool/clientmqueue/目錄下
# cd /var/spool/clientmqueue/
# find ./ -exec rm {} \;

將crontab中沒有定向輸出的行都在最后加上"> /dev/null 2>&1",在刪除的過程中操作。
或者先停止crontab,加上重定向。
--------------------------------------------------------------------------------
可能原因2
可以看下日志文件是否太多,如果是日志文件占用大量的inodes可以臨時釋放清理下過期的日志。
也可以根據較大目錄的文件占用情況,臨時轉移部分文件到占用磁盤較小的目錄中。

其他總結

===================================================
當發現某個分區下的inode使用率過大時,需要找到該分區下的某些目錄里有哪些文件可以清理。
查找某個目錄下一個月或兩個月之前的文件,然后刪除
# find . -type f -mtime +30 |wc -l
# find . -type f -mtime +60 |wc -l
# find . -type f -mtime +30 -exec rm -f {} \;
# find . -type f -mtime +60 -exec rm -f {} \;

釋放inode緩存
# sync
# echo 3 > /proc/sys/vm/drop_caches

再次檢查下磁盤inode使用情況
# df -i
===================================================

1)刪除無用的臨時文件,釋放inode。比如/tmp下有很多臨時文件
# ls -lt /tmp | wc -l
# find /tmp -type f -exec rm {} \;
  
如果使用rm *,有可能因為文件數量太多而出現Argument list too long錯誤
------------------------------------------------------------------------------------------
是在linux下,試圖傳太多參數給一個系統命令(ls *; cp *; rm *; cat *; etc..)時,就會出現 Argument list too long錯誤。
  
解決方法:使用find -exec 遍歷,然后執行刪除便可。
# find /tmp -type f -exec rm {} \;
------------------------------------------------------------------------------------------
  
2)除了的臨時文件外,0字節的文件也會占用inode,應該也釋放。
# find /home -type f -size 0 -exec rm {} \;
  
3)inode爆滿,也可能是某些目錄下存在大量的小文件導致。
大量小文件分布有兩種可能:
a)一是只有一個或少量目錄下存在大量小文件,這種情況可以使用如下命令來找出這個異常目錄:
# find / -type d -size +10M  
即找出大小大於10M的目錄(目錄大小越大,表示目錄下的文件越多)。
  
b)大量的小文件分布在大量的目錄下,這時候上面的命令可能找不出異常的目錄,需要以下命令:
# cd /
# find */ ! -type l | cut -d / -f 1 | uniq -c
此命令作用是找出目錄下文件總數,可能需要執行多次,直到找出具體的目錄。比如上面的命令找出了/data目錄下存在大量的小文件,
但/data/目錄還有很多目錄,這時候我們還需要繼續執行:
# cd /data
# find */ ! -type l | cut -d / -f 1 | uniq -c
直到找出具體的目錄。
  
如果可以直接刪除節點滿的文件夾:
# find . -type f -exec rm {} \;
  
還可以按照文件的inode節點刪除文件
# find . -inum 342137 -exec rm -i {} \;


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM