CSV数据的处理:
1.数据行和列索引的设置。
2.数据的解析代码和时间的处理。
3.从原始数据中切片数据(提取部分数据)。
4.行列数据的提取(含多行数据)
5.数据的构造。
# hanbb # come on!!! import pandas as pd import csv # 标题的设置 column_title = ['时间','上海A股','上海A股最新值','股票家数','亏损家数','近一月数据','近三月数据','近六月数据','近一年月数据', '深圳A股','深圳A股最新值','深圳A股股票家数','深圳A股亏损家数','深圳A股近一月数据','深圳A股近三月数据','深圳A股近六月数据','深圳A股近一年月数据', '沪深A股板块名称','沪深A股最新值','沪深A股股票家数','沪深A股亏损家数','沪深A股近一月数据','沪深A股近三月数据','沪深A股近六月数据','沪深A股近一年月数据', '深市主板板块名称','深市主板最新值','深市主板股票家数','深市主板亏损家数','深市主板近一月数据','深市主板近三月数据','深市主板近六月数据','深市主板近一年月数据', '中小板板块名称','中小板最新值','中小板股票家数','中小板亏损家数','中小板近一月数据','中小板近三月数据','中小板近六月数据','中小板近一年月数据', '创业板板块名称','创业板最新值','创业板股票家数','创业板亏损家数','创业板近一月数据','创业板近三月数据','创业板近六月数据','创业板近一年月数据',] # 部分数据的截取 guxilv = pd.read_csv("E:\\download2\\guxilv.csv",encoding="gbk",names=column_title,index_col='时间',usecols=[0,1,3],parse_dates=True) # usecols 提取部分数据 print(guxilv) # 数据的读取,解码,设置列标题,设置行表标题 guxilv = pd.read_csv("E:\\download2\\guxilv.csv",encoding="gbk",names=column_title,index_col='时间') # 需要设置编码,否则打不开 # column 标题 print(guxilv.columns) # 时间设置为index print(guxilv.index) # 提取列信息 print(guxilv['中小板最新值']) # 带时间索引 print(guxilv['中小板最新值'].values) # 只有值 print(guxilv[['中小板最新值','创业板最新值']]) # 两列数据 # 提取行信息 print(guxilv.ix['2017-12-06']) # 数据的构造 new_info = pd.DataFrame({'shA':guxilv['上海A股最新值']}) new_info = new_info.join(pd.DataFrame({'szA':guxilv['深圳A股最新值']})) # new_info = new_info.join(pd.DataFrame({'shA':guxilv['深圳A股最新值']})) # new_info = new_info.fillna(method='ffill') print(new_info)
数据的保存
1.将新修改的数据保存早新的文件中
import pandas as pd # 标题的设置 column_title = ['时间','上海A股','上海A股最新值','股票家数','亏损家数','近一月数据','近三月数据','近六月数据','近一年月数据', '深圳A股','深圳A股最新值','深圳A股股票家数','深圳A股亏损家数','深圳A股近一月数据','深圳A股近三月数据','深圳A股近六月数据','深圳A股近一年月数据', '沪深A股板块名称','沪深A股最新值','沪深A股股票家数','沪深A股亏损家数','沪深A股近一月数据','沪深A股近三月数据','沪深A股近六月数据','沪深A股近一年月数据', '深市主板板块名称','深市主板最新值','深市主板股票家数','深市主板亏损家数','深市主板近一月数据','深市主板近三月数据','深市主板近六月数据','深市主板近一年月数据', '中小板板块名称','中小板最新值','中小板股票家数','中小板亏损家数','中小板近一月数据','中小板近三月数据','中小板近六月数据','中小板近一年月数据', '创业板板块名称','创业板最新值','创业板股票家数','创业板亏损家数','创业板近一月数据','创业板近三月数据','创业板近六月数据','创业板近一年月数据',] # 数据的读取 guxilv = pd.read_csv("E:\\download2\\guxilv.csv",encoding="gbk",names=column_title,index_col='时间',parse_dates=True) # usecols 提取部分数据 # 数据的存取 guxilv.to_csv("E:\\download2\\guxilv2.csv") print(guxilv)