python分析文本文件/json


對文本文件進行處理

下面來提取test.txt文件里面的數據,並嘗試計算它包含多少個單詞。我們使用方法split(),它根據一個字符串創建一個單詞表。

>>> information = "I love you!"
>>> information.split()
['I', 'love', 'you!']

方法split()以空格為分隔將字符串分拆成多個部分,並將這些部分都存儲到一個列表中。結果是一個包含字符串中所有單詞的列表,雖然有些單詞可能包含標點。

文本處理:

>>> try:
...     with open(address,encoding="utf-8") as f:
...             contents = f.read()
... except Exception as e:
...     print(str(e))
... else:
...     words = contents.split()
...     num_words = len(words)
...     print(num_words)
...
3
>>> words
['要使用文本文件中的信息,首先需要將信息讀取到內存中。為此你可以一次性讀取文件的全部內容,也可以以每次一行的方式逐行讀取。', '1.讀取這個文件', '首先我們創建一個txt文件,里面寫上幾行數字或者文本信息---test']
>>>

很明顯對於中文字也只是檢測換行時為一個元素。你可以嘗試處理英文單詞試試看。

 存儲數據json

模塊json讓你能夠將簡單的Python數據結構轉存儲到文件中,並在程序再次運行時加載該文件中的數據。json數據格式並非pyhon專用的,這讓你能夠將以json格式存儲的數據與使用其它編程語言的人分享。

1.使用json.dump()和json.load()

提示:JSON格式最初是javaScript開發的,但隨后成了一種常見的數據格式,被包括python在內的眾多語言采用。

我們來編寫一個存儲一組數字的簡短程序,再編寫一個將這些數字讀取到內存中的程序。

第一個程序將使用json.dump()來存儲這組數字,而第二個程序將使用json.load():

存儲數據

函數json.dump()接受兩個實參:要存儲的數據以及可用於存儲數據的文件對象。

 

>>> filename = r"C:\Users\BBC\Desktop\numbers.json"
>>> numbers = [1,2,3,4,5,6]
>>> with open(filename,'w') as f:
...     json.dump(numbers,f)
...
>>>

 

此時在我電腦桌面上生成了一個numbers.json的文件。

下面再編寫一個程序,使用json.load()將這個列表讀取到內存中:

>>> import json
>>> filename = r"C:\Users\BBC\Desktop\numbers.json"
>>> with open(filename) as f:
...     numbers = json.load(f)
...
>>> print(numbers)
[1, 2, 3, 4, 5, 6]

 

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM