一、計算文件的行數
最簡單的辦法是把文件讀入一個大的列表中,然后統計列表的長度.如果文件的路徑是以參數的形式filepath傳遞的,那么只用一行代碼就可以完成我們的需求了:
count = len(open(filepath,'rU').readlines())
如果是非常大的文件,上面的方法可能很慢,甚至失效.此時,可以使用循環來處理:
count = -1
for count, line in enumerate(open(thefilepath, 'rU')):
pass
count += 1
另外一種處理大文件比較快的方法是統計文件中換行符的個數'\n '(或者包含'\n'的字串,如在windows系統中):
count = 0
thefile = open(thefilepath, 'rb')
while True:
buffer = thefile.read(8192*1024)
if not buffer:
break
count += buffer.count('\n')
thefile.close( )
參數'rb'是必須的,否則在windows系統上,上面的代碼會非常慢.
linecache是專門支持讀取大文件,而且支持行式讀取的函數庫。 linecache預先把文件讀入緩存起來,后面如果你訪問該文件的話就不再從硬盤讀取
二、讀取文件某一行的內容(測試過1G大小的文件,效率還可以)
import linecache
count = linecache.getline(filename,linenum)
三、用linecache讀取文件內容(測試過1G大小的文件,效率還可以)
str = linecache.getlines(filename)
str為列表形式,每一行為列表中的一個元素
原文章鏈接:http://www.cnblogs.com/nkwy2012/p/6023710.html