Pandas系列教程(1)Pandas数据读取
1. 下载安装pandas
|
1
2
|
pip install pandas
pip install pandas
-
i https:
/
/
pypi.tuna.tsinghua.edu.cn
/
simple
|
Pandas需要先读取表格类型的数据,然后进行分析
| 数据类型 | 说明 | Pandas读取方法 |
|---|---|---|
| csv, tsv, txt | 用逗号分隔,tab分隔的纯文本文件 | pd.read_csv |
| excel | 微软xls或者xlsx文件 | pd.read_excel |
| mysql | 关系型数据库表 | pd.read_sql |
# 读取csv文件,使用默认的标题行,逗号分隔符
import pandas as pd
file_path = '../files/ratings.csv'
# 使用pd.read_csv读取数据
ratings = pd.read_csv(file_path)
print(ratings)
# 查看数据的前几行
print("查看数据的前几行:\n ", ratings.head())
# 查看数据的形状(返回行数,列数)
print("查看数据的形状:\n ", ratings.shape)
# 查看列表列名
print("查看列表列名:\n ", ratings.columns)
# 查看索引列
print("查看索引列:\n ", ratings.index)
# 查看每列的数据类型
print("查看每列的数据类型:\n ", ratings.dtypes)
# 读取csv文件,使用默认的标题行,逗号分隔符
import pandas as pd
file_path = '../files/access_pvuv.txt'
# 使用pd.read_csv读取数据
pvuv = pd.read_csv(file_path, sep='\t', header=None, names=['pdate', 'pv', 'uv'])
"""
sep: 指定列的分隔符
header: 没有标题行设置为None
names: 自定义列名
"""
print(pvuv)
# 查看数据的前几行
print("查看数据的前几行:\n ", pvuv.head())
# 查看数据的形状(返回行数,列数)
print("查看数据的形状:\n ", pvuv.shape)
# 查看列表列名
print("查看列表列名:\n ", pvuv.columns)
# 查看索引列
print("查看索引列:\n ", pvuv.index)
# 查看每列的数据类型
print("查看每列的数据类型:\n ", pvuv.dtypes)
# 读取csv文件,使用默认的标题行,逗号分隔符 import pandas as pd file_path = '../files/access_pvuv.xlsx' # 使用pd.read_excel读取数据 pvuv = pd.read_excel(file_path) print(pvuv)
# 读取csv文件,使用默认的标题行,逗号分隔符
import pymysql
import pandas as pd
# 创建数据库连接
conn = pymysql.connect(host='127.0.0.1', user='root', password='123456', database='demo', charset='utf8')
# 使用pd.read_excel读取数据
pvuv = pd.read_sql("select * from crazyant_pvuv", con=conn)
print(pvuv)

