1. 下載安裝pandas
pip install pandas pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple
Pandas需要先讀取表格類型的數據,然后進行分析
數據類型 | 說明 | Pandas讀取方法 |
---|---|---|
csv, tsv, txt | 用逗號分隔,tab分隔的純文本文件 | pd.read_csv |
excel | 微軟xls或者xlsx文件 | pd.read_excel |
mysql | 關系型數據庫表 | pd.read_sql |
# 讀取csv文件,使用默認的標題行,逗號分隔符 import pandas as pd file_path = '../files/ratings.csv' # 使用pd.read_csv讀取數據 ratings = pd.read_csv(file_path) print(ratings) # 查看數據的前幾行 print("查看數據的前幾行:\n ", ratings.head()) # 查看數據的形狀(返回行數,列數) print("查看數據的形狀:\n ", ratings.shape) # 查看列表列名 print("查看列表列名:\n ", ratings.columns) # 查看索引列 print("查看索引列:\n ", ratings.index) # 查看每列的數據類型 print("查看每列的數據類型:\n ", ratings.dtypes)
# 讀取csv文件,使用默認的標題行,逗號分隔符 import pandas as pd file_path = '../files/access_pvuv.txt' # 使用pd.read_csv讀取數據 pvuv = pd.read_csv(file_path, sep='\t', header=None, names=['pdate', 'pv', 'uv']) """ sep: 指定列的分隔符 header: 沒有標題行設置為None names: 自定義列名 """ print(pvuv) # 查看數據的前幾行 print("查看數據的前幾行:\n ", pvuv.head()) # 查看數據的形狀(返回行數,列數) print("查看數據的形狀:\n ", pvuv.shape) # 查看列表列名 print("查看列表列名:\n ", pvuv.columns) # 查看索引列 print("查看索引列:\n ", pvuv.index) # 查看每列的數據類型 print("查看每列的數據類型:\n ", pvuv.dtypes)
# 讀取csv文件,使用默認的標題行,逗號分隔符 import pandas as pd file_path = '../files/access_pvuv.xlsx' # 使用pd.read_excel讀取數據 pvuv = pd.read_excel(file_path) print(pvuv)
# 讀取csv文件,使用默認的標題行,逗號分隔符 import pymysql import pandas as pd # 創建數據庫連接 conn = pymysql.connect(host='127.0.0.1', user='root', password='123456', database='demo', charset='utf8') # 使用pd.read_excel讀取數據 pvuv = pd.read_sql("select * from crazyant_pvuv", con=conn) print(pvuv)