python計算文件的行數和讀取某一行內容的實現方法


一、計算文件的行數

   最簡單的辦法是把文件讀入一個大的列表中,然后統計列表的長度.如果文件的路徑是以參數的形式filepath傳遞的,那么只用一行代碼就可以完成我們的需求了:

count = len(open(filepath,'rU').readlines())

   如果是非常大的文件,上面的方法可能很慢,甚至失效.此時,可以使用循環來處理:

count = -1
for count, line in enumerate(open(thefilepath, 'rU')):
    pass
count += 1

   另外一種處理大文件比較快的方法是統計文件中換行符的個數'\n  '(或者包含'\n'的字串,如在windows系統中):

count = 0
thefile = open(thefilepath, 'rb')
while True:
    buffer = thefile.read(8192*1024)
    if not buffer:
        break
    count += buffer.count('\n')
thefile.close( )

   參數'rb'是必須的,否則在windows系統上,上面的代碼會非常慢.

linecache是專門支持讀取大文件,而且支持行式讀取的函數庫。 linecache預先把文件讀入緩存起來,后面如果你訪問該文件的話就不再從硬盤讀取

二、讀取文件某一行的內容(測試過1G大小的文件,效率還可以)

import linecache

count = linecache.getline(filename,linenum)

 

三、用linecache讀取文件內容(測試過1G大小的文件,效率還可以)

str = linecache.getlines(filename)

str為列表形式,每一行為列表中的一個元素

原文章鏈接:http://www.cnblogs.com/nkwy2012/p/6023710.html


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM