Pandas是python的一個數據分析包,納入了大量庫和一些標准的數據模型,提供了高效地操作大型數據集所需的工具。
Pandas提供了大量能使我們快速便捷地處理數據的函數和方法。
Pandas官方文檔:https://pandas.pydata.org/pandas-docs/stable/
Pandas中文文檔:https://www.pypandas.cn
一、安裝包
pandas處理Excel需要xlrd、openpyxl依賴包
pip3 install pandas pip3 install xlrd pip3 install openpyxl
二、創建Excel,寫入數據
import pandas as pd from pandas import DataFrame #寫 dic1 = {'標題列1': ['張三','李四'], '標題列2': [80, 90] } df = pd.DataFrame(dic1) df.to_excel('1.xlsx', index=False)
read_excel方法說明
pd.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False,dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, parse_dates=False, date_parser=None, thousands=None, comment=None, skipfooter=0, convert_float=True, **kwds)
io:excel文件
sheet_name:返回指定sheet,默認索引0返回第一個,也可用名稱,如果返回多個則可用列表,為None則返回全表
header:指定表頭,也可用列表指定多行
names:自定義列名,長度和Excel列長度必須一致
index_col:用作索引的列
usecols:讀取指定的列,參數為列表,如[0,1]表示第1和第2列
三、讀取Excel
import pandas as pd from pandas import DataFrame #讀 data = pd.read_excel('1.xlsx') #查看所有的值 print(data.values) #查看第一行的值 print(data.values[0]) #查看某一列所有的值 print(data['標題列1'].values) #新增列 data['標題列3'] = None #新增行 data.loc[3] = ['王五', 100, '男'] #刪除行:axis=0 data = data.drop([0,1], axis=0) #刪除列:axis=1 data.drop('標題列3', axis=1) #保存 DataFrame(data).to_excel('1.xlsx', sheet_name='Sheet1', index=False, header=True)