read_csv()接受以下常見參數:
參數 | 中文名 | 參數類型 | 默認參數 | 參數功能 | 說明 |
filepath_or_buffer | various | :文件路徑、URL、或者 是read()函數返回的對象 |
|||
sep | 指定分隔符 | str | 默認是',' | ||
delimiter | 定界符 | str | 默認是None | 指定該參數,sep失效 | |
delim_whitespace | boolean | 默認是False | 指定空格或者'\t'是否作為分隔符使用 | 如果該參數指定為True,則delimiter失效 | |
header | 指定行號用於列名,默認指定是第0行作為列名。如果沒有列名,則顯式指定header = None | ||||
names | 默認是None | 如果表格中沒有列名,就顯式指定header = None,然后由names= ["xx","xx"]指定列名。 | |||
index_col | int or sequence or False | 默認是None | 用作行索引的列編號或者列名 | 當設定index_col = False時,強制pandas不使用第一個列作為行名 | |
usecols | list-like 或者callable | 默認是None | 返回列的子集,就是你可以指定哪些列返回,比如usecols = [1,3,5]或者usecols = [' xx','xx'] xx是列名 | 輸入0、1這種數字則順序就沒了,若想保留列的順序,就輸入列名。 | |
squeeze | boolean | 默認是False | 如果只包含一列,則設置為True,會返回一個Series. | ||
prefix | str | 默認是None | 在沒有列標題時,用來給列添加前綴。 | 比如prefix = 'xx',則列名就是xx0,xx1,xx2.... | |
mangle_dupe_cols | boolean | 默認是True | 將列名重復的列,更名為X.0,X.1,X.2.. | 如果設置為False,則覆蓋所有重名列。 | |
dtype | type | 默認是None | 指定每列數據的類型 | dtype = {‘a’:np.float64,'b':np.int32} | |
skiprows | list-like或者interger | 默認是None | 跳過指定的行 | skiprows = [1,2,3,4] or skiprows = lambda x :x%2 !=0 | |
skipfooter | int | 默認是0 | 從底部跳過的行 | skiprows = [1,2,3]從尾部忽略123行 | |
nrows | int | 默認是None | 需要讀取的行數 | nrows = [1,2,3]從頭部讀取123行 | |
na_values | scalar或者str或者list-like | 默認是NOne | 用於替換NA/NaN的值 | ||
memory_map | boolean | 默認是False | 如果filepath是filepath_or_buffer,則直接將其映射到內存 | ||
keep_default_na | boolearn | 默認是True | 與na_values搭配使用, | ||
na_values | |||||
na_filter | boolean | 默認是True | 如果設置為False,則不檢查有無空值,提高速度 | ||
verbose | boolean | 默認是False | 指示替代非數字列的NA的數量 | ||
skip_blank_lines | boolean | 默認是True | 如果是True則跳過空白行,為False則空白行用NaN替代。 | ||
encoding | str | 默認是None | encoding = 'utf-8' | ||
參考網址:https://pandas.pydata.org/pandas-docs/stable/user_guide/io.html#io-read-csv-table
建議還是看英文介紹,詳細