pandas-pd.read_csv


read_csv()接受以下常見參數

參數 中文名 參數類型 默認參數 參數功能 說明
filepath_or_buffer   various

:文件路徑、URL、或者

是read()函數返回的對象

   
sep 指定分隔符 str 默認是','    
delimiter 定界符 str 默認是None   指定該參數,sep失效
delim_whitespace   boolean 默認是False 指定空格或者'\t'是否作為分隔符使用 如果該參數指定為True,則delimiter失效
header       指定行號用於列名,默認指定是第0行作為列名。如果沒有列名,則顯式指定header = None  
names     默認是None 如果表格中沒有列名,就顯式指定header = None,然后由names= ["xx","xx"]指定列名。  
index_col   int or sequence or False 默認是None 用作行索引的列編號或者列名 當設定index_col = False時,強制pandas不使用第一個列作為行名
usecols   list-like 或者callable 默認是None 返回列的子集,就是你可以指定哪些列返回,比如usecols = [1,3,5]或者usecols = [' xx','xx']  xx是列名 輸入0、1這種數字則順序就沒了,若想保留列的順序,就輸入列名。
squeeze   boolean 默認是False 如果只包含一列,則設置為True,會返回一個Series.  
prefix   str 默認是None 在沒有列標題時,用來給列添加前綴。 比如prefix = 'xx',則列名就是xx0,xx1,xx2....
mangle_dupe_cols   boolean 默認是True 將列名重復的列,更名為X.0,X.1,X.2.. 如果設置為False,則覆蓋所有重名列。
dtype   type 默認是None 指定每列數據的類型 dtype = {‘a’:np.float64,'b':np.int32}
skiprows   list-like或者interger 默認是None 跳過指定的行 skiprows = [1,2,3,4] or skiprows = lambda x :x%2 !=0
skipfooter   int 默認是0 從底部跳過的行 skiprows = [1,2,3]從尾部忽略123行
nrows   int 默認是None 需要讀取的行數 nrows  = [1,2,3]從頭部讀取123行
na_values   scalar或者str或者list-like 默認是NOne 用於替換NA/NaN的值  
memory_map   boolean 默認是False 如果filepath是filepath_or_buffer,則直接將其映射到內存  
keep_default_na   boolearn 默認是True 與na_values搭配使用,  
na_values          
na_filter   boolean 默認是True 如果設置為False,則不檢查有無空值,提高速度  
verbose   boolean 默認是False 指示替代非數字列的NA的數量  
skip_blank_lines   boolean 默認是True 如果是True則跳過空白行,為False則空白行用NaN替代。  
encoding   str 默認是None encoding  = 'utf-8'  
           
           
           
           
           
           
           
           
           

參考網址:https://pandas.pydata.org/pandas-docs/stable/user_guide/io.html#io-read-csv-table

建議還是看英文介紹,詳細


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM