現象:我們測試環境上,導出數據文件時,由於作業報錯,重復導出,空間使用到達100%,按理說,導出的文件時在相同的路徑下,文件名也是一致的,會自動替換。
那么之前導出的文件會被刪除,問題就出現在刪除這一步。
在Linux或者Unix系統中,通過rm或者文件管理器刪除文件將會從文件系統的文件夾結構上解除鏈接(unlink).然而假設文件是被
打開的(有一個進程正在使用),那么進程將仍然能夠讀取該文件,磁盤空間也一直被占用。而我刪除的是作業正在運行的導出文件
刪除的時候文件應該正在被使用
解決辦法:
lsof |grep delete
gds 10099 use 15w REG 253,0 6616432640 788101 /home/use/share/srctab50/ft_kr_pms_pms_ca_acct_detail_in_elk_w.dat.0(deleted)
一種方法是kill掉相應的進程,或者停掉使用這個文件的應用,讓os自己主動回收磁盤空間
我這個環境有非常多進程在使用的這個文件,停掉進程有點麻煩,再有就是風險非常大
當linux打開一個文件的時候,Linux內核會為每個進程在/proc/ 『/proc/nnnn/fd/文件夾(nnnn為pid)』建立一個以其pid
為名的文件夾用來保存進程的相關信息,而其子文件夾fd保存的是該進程打開的全部文件的fd(fd:file descriptor)。
kill進程是通過截斷proc文件系統中的文件能夠強制要求系統回收分配給正在使用的的文件。
這是一項高級技術,僅到管理員確定不會對執行中的進程造成影響時使用。應用程序對這樣的方
式支持的並不好,當一個正在使用的文件被截斷可能會引發不可預知的問題
把進程刪除:
kill -9 10099
查看空間使用率就將下來了
學習下lsof命令
lsof全名list opened files,也就是列舉系統中已經被打開的文件。我們都知道,linux環境中,不論什么事物都是文件,
設備是文件,文件夾是文件,甚至sockets也是文件。所以,用好lsof命令,對日常的linux管理非常有幫助。
lsof是linux最常常使用的命令之中的一個,通常的輸出格式為:
引用
COMMAND PID USER FD TYPE DEVICE SIZE NODE NAME
常見包含例如以下幾個字段:許多其他的可見manual。
1、COMMAND
默認以9個字符長度顯示的命令名稱。可使用+c參數指定顯示的寬度,若+c后跟的參數為零,則顯示命令的全名
2、PID:進程的ID號
3、PPID
父進程的IP號,默認不顯示,當使用-R參數可打開。
4、PGID
進程組的ID編號,默認也不會顯示,當使用-g參數時可打開。
5、USER
命令的執行UID或系統中登陸的username稱。默認顯示為username,當使用-l參數時,可顯示UID。
6、FD
是文件的File Descriptor number,或者例如以下的內容:
(這里非常難翻譯相應的意思,保留英文)
引用
cwd current working directory;
Lnn library references (AIX);
jld jail directory (FreeBSD);
ltx shared library text (code and data);
Mxx hex memory-mapped type number xx.
m86 DOS Merge mapped file;
mem memory-mapped file;
mmap memory-mapped device;
pd parent directory;
rtd root directory;
tr kernel trace file (OpenBSD);
txt program text (code and data);
v86 VP/ix mapped file;
文件的File Descriptor number顯示模式有:
引用
r for read access;
w for write access;
u for read and write access;
N for a Solaris NFS lock of unknown type;
r for read lock on part of the file;
R for a read lock on the entire file;
w for a write lock on part of the file;
W for a write lock on the entire file;
u for a read and write lock of any length;
U for a lock of unknown type;
x for an SCO OpenServer Xenix lock on part of the file;
X for an SCO OpenServer Xenix lock on the entire file;
space if there is no lock.
7、TYPE
引用
IPv4 IPv4的包;
IPv6 使用IPv6格式的包,即使地址是IPv4的,也會顯示為IPv6,而映射到IPv6的地址;
DIR 文件夾
LINK 鏈接文件
詳情請看manual中許多其他的凝視。
8、DEVICE
使用character special、block special表示的設備號
9、SIZE
文件的大小,假設不能用大小表示的,會留空。使用-s參數控制。
10、NODE
本地文件的node碼,或者協議,如TCP等
11、NAME
掛載點和文件的全路徑(鏈接會被解析為實際路徑),或者連接兩方的地址和端口、狀態等