Pandas系列教程(1)Pandas數據讀取
1. 下載安裝pandas
|
1
2
|
pip install pandas
pip install pandas
-
i https:
/
/
pypi.tuna.tsinghua.edu.cn
/
simple
|
Pandas需要先讀取表格類型的數據,然后進行分析
| 數據類型 | 說明 | Pandas讀取方法 |
|---|---|---|
| csv, tsv, txt | 用逗號分隔,tab分隔的純文本文件 | pd.read_csv |
| excel | 微軟xls或者xlsx文件 | pd.read_excel |
| mysql | 關系型數據庫表 | pd.read_sql |
# 讀取csv文件,使用默認的標題行,逗號分隔符
import pandas as pd
file_path = '../files/ratings.csv'
# 使用pd.read_csv讀取數據
ratings = pd.read_csv(file_path)
print(ratings)
# 查看數據的前幾行
print("查看數據的前幾行:\n ", ratings.head())
# 查看數據的形狀(返回行數,列數)
print("查看數據的形狀:\n ", ratings.shape)
# 查看列表列名
print("查看列表列名:\n ", ratings.columns)
# 查看索引列
print("查看索引列:\n ", ratings.index)
# 查看每列的數據類型
print("查看每列的數據類型:\n ", ratings.dtypes)
# 讀取csv文件,使用默認的標題行,逗號分隔符
import pandas as pd
file_path = '../files/access_pvuv.txt'
# 使用pd.read_csv讀取數據
pvuv = pd.read_csv(file_path, sep='\t', header=None, names=['pdate', 'pv', 'uv'])
"""
sep: 指定列的分隔符
header: 沒有標題行設置為None
names: 自定義列名
"""
print(pvuv)
# 查看數據的前幾行
print("查看數據的前幾行:\n ", pvuv.head())
# 查看數據的形狀(返回行數,列數)
print("查看數據的形狀:\n ", pvuv.shape)
# 查看列表列名
print("查看列表列名:\n ", pvuv.columns)
# 查看索引列
print("查看索引列:\n ", pvuv.index)
# 查看每列的數據類型
print("查看每列的數據類型:\n ", pvuv.dtypes)
# 讀取csv文件,使用默認的標題行,逗號分隔符 import pandas as pd file_path = '../files/access_pvuv.xlsx' # 使用pd.read_excel讀取數據 pvuv = pd.read_excel(file_path) print(pvuv)
# 讀取csv文件,使用默認的標題行,逗號分隔符
import pymysql
import pandas as pd
# 創建數據庫連接
conn = pymysql.connect(host='127.0.0.1', user='root', password='123456', database='demo', charset='utf8')
# 使用pd.read_excel讀取數據
pvuv = pd.read_sql("select * from crazyant_pvuv", con=conn)
print(pvuv)

