Python最快的方式來讀取大文本文件（幾GB）

本文轉載自查看原文 2019-08-29 10:05 1331

我有一個大文本文件（約7 GB）。我正在尋找是否存在閱讀大文本文件的最快方法。我一直在閱讀有關使用多種方法作為讀取chunk-by-chunk以加快進程的過程。

例如，effbot建議

# File: readline-example-3.py file = open("sample.txt") while 1: lines = file.readlines(100000) if not lines: break for line in lines: pass # do something**strong text**

為了每秒處理96,900行文本。其他作者建議使用islice（）

from itertools import islice with open(...) as f: while True: next_n_lines = list(islice(f, n)) if not next_n_lines: break # process next_n_lines

list(islice(f, n))將返回n文件的下一行列表f。在循環中使用它將為您提供大量n行的文件

解決方案

with open(<FILE>) as FileObj: for lines in FileObj: print lines # or do some other thing with the line...

將在此時讀取一行內存，並在完成后關閉文件...

本文首發於Python黑洞網，博客園同步更新

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 c#分頁讀取GB文本文件 python 讀取文本文件 Python 讀取txt文本文件 Python之讀取大型文本文件用Python讀取一個文本文件並統計詞頻 python讀取文本文件數據 Python讀取分割壓縮TXT文本文件 python讀取並輸出文本文件同時加上行號 python庫--pandas--文本文件讀取 JAVA 讀取本地文本文件