python當中如何處理大規模csv文件

本文轉載自查看原文 2018-09-11 09:43 809 python小知識

使用pandas包進行處理：

1.讀取限定列：file = pd.read_csv('demo.csv',usecols=['column1', 'column2', 'column3'])

2.讀取限定行: file = pd.read_csv('demo.csv',nrows=1000,usecols=['column1', 'column2', 'column3']) #此時讀取的是前1000行數據，可以作為測試

3.分塊讀取：

reader = pd.read_csv('demo.csv',nrows=1000，usecols=['column1','column2','column3'],chunksize=1000,iterator=True) #此時chunksize=1000指定了塊的大小

4.使用head和tail函數讀取小部分數據觀察其特征

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 MPP(大規模並行處理) MPP(大規模並行處理)簡介 MPP(大規模並行處理)架構多線程導出大規模excel文件 python處理CSV文件 python大規模數據處理技巧之一：數據常用操作大規模數據爬取 -- Python 【Python】Python處理csv文件 Python批量處理CSV文件淺談python對csv文件的處理