對於csv文件進行處理一個重要的步驟是為數據添加索引,方便后續的數據操作,這里我們使用pandas庫中的read_csv()函數,在讀取csv數據的同時可以對其添加行索引和列索引。
import pandas as pd obj=pd.read_csv('testdata.csv') print(obj)
read_csv()不對屬性進行設置的缺省狀態下,對於csv文件進行讀取操作后,即使原來的數據存在索引,也會自動添加數字的行索引和列索引。
obj=pd.read_csv('testdata.csv',header=None,names=range(1,1200))
當設置 header=None 時,則認為csv文件沒有列索引,為其添加相應范圍的索引,range(1,1200)指建立索引號從1開始最大到1199的列索引,當數據長度超過范圍時,索引沿列數據的右側對齊。
obj=pd.read_csv('testdata.csv',header=0,names=range(1,4))
當設置 header=0 時,則認為csv文件數據第一行是列索引,將用新的列索引替換舊的列索引。
obj=pd.read_csv('testdata.csv',index_col=0,usecols=[1,2,3])
當設置 index_col=0 時,則是csv文件數據的指定數據中的第一列是行索引,usecols指選中數據的對應列數,[1,2,3]指第2列到第4列。
obj=pd.read_csv('testdata.csv',index_col=0,usecols=5)
用usecols選擇前n行數據進行后續處理,n為正整型。