DataFrame 是 Python 中的一種數據結構,類似 excel,是一種二維表,其單元個可以存放各種數據類型的數據。同時 DataFrame 可以設置列名 columns 和行名 index 對數據進行定位。
現以xlsx表為例:
讀取參數為:
def xlsx_to_csv_pd(name): data_xls = pd.read_excel(name + ".xlsx",index_col= None,header = 0,encoding="utf-8" ) return data_xls
DataFrame 數據如下:
print(data_base.tail)
以下代碼供參考:
注意,此時切下的單個字符串是 string 類型,元素則是 series類型,查找相關元素內容則是按照你的數據選取相對轉換成 list 或者 dict 查找方法。
# df.loc[index, column_name],選取指定行和列的數據 df.loc[0,'Name'] # 'ZHBB01A005' df.loc[0:2, ['Name','Comments']] # 選取第0行到第2行,Name和Comments列的數據, 注意這里的行選取是包含下標的。 df.loc[[2,3],['Name','Comments']] # 選取指定的第2行和第3行,Name和Comments列的數據 df.loc[df['Name']=='ZHBB01A005','Comments'] # 選取Nmae列是ZHB01A005,Comments列的數據 df.loc[df['Name']=='ZHBB01A005',[Comments','Type']] # 選取Nmae列是ZHB01A005,Comments和Type列的數據