解決python執行linux查看文件命令后，因為^@特殊符號導致部分內容不顯示的問題

本文轉載自查看原文 2017-06-22 11:17 2188 python/ linux

問題現象

文件a的內容如下：

查看第3行到第5行的內容：sed -n '3,5p' /tmp/test/a

可見在命令行執行，是沒有問題的。

在python中使用paramiko模塊執行linux命令，主要代碼如下：

    def toServer(self, str):
        sys.setdefaultencoding('utf-8')
        return str.decode('utf-8').encode('GB18030')

    def fromServer(self, str):
        sys.setdefaultencoding('GB18030')
        return str.decode('GB18030')

    def executeCmd(self, cmd, isErr=False):
        cmd = self.toServer(cmd)
        print 'exec_command:%s' % cmd
        stdin, stdout, stderr = self.ssh.exec_command(cmd)
        out = stdout.read()
        out = self.fromServer(out)
        out = out[:len(out) - 1]
        if isErr == True:
            err = stderr.read()
            err = self.fromServer(err)
            err = err[:len(err) - 1]
            return out, err
        else:
            return out

執行：

print sa.executeCmd('''sed -n '3,5p' /tmp/test/a''')

輸出：

可見，輸出第2行時（文件的第3行）是空的！

分析

打斷點

查看out完整的值：

可以看到“Selena Gomez:”這一行其實是已經獲取到了，但是可以看到前面有空格和空行，不禁讓人懷疑這中間是否包含什么特殊的字符。

使用vi查看a文件的內容：發現里面包含了大量的^@字符！

^@是一個特殊字符，通過ctrl+V ctrl+@可以敲出來。

在實際使用中，是檢查日志的時候發現的這個問題。這里只是用歌詞代替日志。

首先備份日志：cat log >> log.bak

然后清空日志：echo "" > log

之后再讓程序寫入日志（log文件），然后再去檢查這個日志文件。

發現程序每次寫入日志時，前面會有大量的^@字符。原因有可能是程序寫入日志的代碼有問題。

解決

在vi末行模式下輸入：冒號%s/^@//g

注意：是通過ctrl+V ctrl+@敲出來。

這是目前為止我所知道的從文件上把字符去掉，但是如果是做成自動化去獲取日志，手動去操作就不現實了。

目前的解決辦法是：傳入一個字符串，並查找這個字符串的位置，然后從這個位置開始截取

    def executeCmd(self, cmd, isErr=False, initial='nope'):
        cmd = self.toServer(cmd)
        print 'exec_command:%s' % cmd
        stdin, stdout, stderr = self.ssh.exec_command(cmd)
        out = stdout.read()
        out = self.fromServer(out)
        if initial != 'nope':
            # 截取正文，過濾特殊字符^@
            startPosition = out.find(initial)
            out = out[startPosition:len(out) - 1]
        else:
            out = out[:len(out) - 1]
        if isErr == True:
            err = stderr.read()
            err = self.fromServer(err)
            err = err[:len(err) - 1]
            return out, err
        else:
            return out

執行：

print sa.executeCmd('''sed -n '3,5p' /tmp/test/a''',initial='Selena')

輸出：

因為實際使用過程中，每次去獲取日志都是最新的日志（經過了備份和清空），所以包含^@符號只有一段，而且是在第一行內容的前面，所以這種方法適用。

如果要獲取的日志包含多段^@符號，就不適用。

如果你有更好的方法，歡迎分享。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 js正則刪除字符串中的部分內容（支持變量和特殊符號）網頁部分內容顯示不全 c# NOPI導出excel后 “發現有部分內容有問題 ” jquery 顯示/ 隱藏頁面中部分內容關於 NPOI 導出的 Excel 出現“部分內容有問題” 的解決方法 Linux /proc/$pid部分內容詳解【轉】 C語言修改文件某部分內容如何替換文件中的部分內容？ python修改txt部分內容，並保存。 Linux命令中特殊符號