問題現象
文件a的內容如下:

查看第3行到第5行的內容:sed -n '3,5p' /tmp/test/a

可見在命令行執行,是沒有問題的。
在python中使用paramiko模塊執行linux命令,主要代碼如下:
def toServer(self, str): sys.setdefaultencoding('utf-8') return str.decode('utf-8').encode('GB18030') def fromServer(self, str): sys.setdefaultencoding('GB18030') return str.decode('GB18030') def executeCmd(self, cmd, isErr=False): cmd = self.toServer(cmd) print 'exec_command:%s' % cmd stdin, stdout, stderr = self.ssh.exec_command(cmd) out = stdout.read() out = self.fromServer(out) out = out[:len(out) - 1] if isErr == True: err = stderr.read() err = self.fromServer(err) err = err[:len(err) - 1] return out, err else: return out
執行:
print sa.executeCmd('''sed -n '3,5p' /tmp/test/a''')
輸出:

可見,輸出第2行時(文件的第3行)是空的!
分析
打斷點

查看out完整的值:

可以看到“Selena Gomez:”這一行其實是已經獲取到了,但是可以看到前面有空格和空行,不禁讓人懷疑這中間是否包含什么特殊的字符。
使用vi查看a文件的內容:發現里面包含了大量的^@字符!

^@是一個特殊字符,通過ctrl+V ctrl+@可以敲出來。
在實際使用中,是檢查日志的時候發現的這個問題。這里只是用歌詞代替日志。
首先備份日志:cat log >> log.bak
然后清空日志:echo "" > log
之后再讓程序寫入日志(log文件),然后再去檢查這個日志文件。
發現程序每次寫入日志時,前面會有大量的^@字符。原因有可能是程序寫入日志的代碼有問題。
解決
在vi末行模式下輸入:冒號%s/^@//g
注意:是通過ctrl+V ctrl+@敲出來。
這是目前為止我所知道的從文件上把字符去掉,但是如果是做成自動化去獲取日志,手動去操作就不現實了。
目前的解決辦法是:傳入一個字符串,並查找這個字符串的位置,然后從這個位置開始截取
def executeCmd(self, cmd, isErr=False, initial='nope'): cmd = self.toServer(cmd) print 'exec_command:%s' % cmd stdin, stdout, stderr = self.ssh.exec_command(cmd) out = stdout.read() out = self.fromServer(out) if initial != 'nope': # 截取正文,過濾特殊字符^@ startPosition = out.find(initial) out = out[startPosition:len(out) - 1] else: out = out[:len(out) - 1] if isErr == True: err = stderr.read() err = self.fromServer(err) err = err[:len(err) - 1] return out, err else: return out
執行:
print sa.executeCmd('''sed -n '3,5p' /tmp/test/a''',initial='Selena')
輸出:

因為實際使用過程中,每次去獲取日志都是最新的日志(經過了備份和清空),所以包含^@符號只有一段,而且是在第一行內容的前面,所以這種方法適用。
如果要獲取的日志包含多段^@符號,就不適用。
如果你有更好的方法,歡迎分享。
