CSV數據的處理:
1.數據行和列索引的設置。
2.數據的解析代碼和時間的處理。
3.從原始數據中切片數據(提取部分數據)。
4.行列數據的提取(含多行數據)
5.數據的構造。
# hanbb # come on!!! import pandas as pd import csv # 標題的設置 column_title = ['時間','上海A股','上海A股最新值','股票家數','虧損家數','近一月數據','近三月數據','近六月數據','近一年月數據', '深圳A股','深圳A股最新值','深圳A股股票家數','深圳A股虧損家數','深圳A股近一月數據','深圳A股近三月數據','深圳A股近六月數據','深圳A股近一年月數據', '滬深A股板塊名稱','滬深A股最新值','滬深A股股票家數','滬深A股虧損家數','滬深A股近一月數據','滬深A股近三月數據','滬深A股近六月數據','滬深A股近一年月數據', '深市主板板塊名稱','深市主板最新值','深市主板股票家數','深市主板虧損家數','深市主板近一月數據','深市主板近三月數據','深市主板近六月數據','深市主板近一年月數據', '中小板板塊名稱','中小板最新值','中小板股票家數','中小板虧損家數','中小板近一月數據','中小板近三月數據','中小板近六月數據','中小板近一年月數據', '創業板板塊名稱','創業板最新值','創業板股票家數','創業板虧損家數','創業板近一月數據','創業板近三月數據','創業板近六月數據','創業板近一年月數據',] # 部分數據的截取 guxilv = pd.read_csv("E:\\download2\\guxilv.csv",encoding="gbk",names=column_title,index_col='時間',usecols=[0,1,3],parse_dates=True) # usecols 提取部分數據 print(guxilv) # 數據的讀取,解碼,設置列標題,設置行表標題 guxilv = pd.read_csv("E:\\download2\\guxilv.csv",encoding="gbk",names=column_title,index_col='時間') # 需要設置編碼,否則打不開 # column 標題 print(guxilv.columns) # 時間設置為index print(guxilv.index) # 提取列信息 print(guxilv['中小板最新值']) # 帶時間索引 print(guxilv['中小板最新值'].values) # 只有值 print(guxilv[['中小板最新值','創業板最新值']]) # 兩列數據 # 提取行信息 print(guxilv.ix['2017-12-06']) # 數據的構造 new_info = pd.DataFrame({'shA':guxilv['上海A股最新值']}) new_info = new_info.join(pd.DataFrame({'szA':guxilv['深圳A股最新值']})) # new_info = new_info.join(pd.DataFrame({'shA':guxilv['深圳A股最新值']})) # new_info = new_info.fillna(method='ffill') print(new_info)
數據的保存
1.將新修改的數據保存早新的文件中
import pandas as pd # 標題的設置 column_title = ['時間','上海A股','上海A股最新值','股票家數','虧損家數','近一月數據','近三月數據','近六月數據','近一年月數據', '深圳A股','深圳A股最新值','深圳A股股票家數','深圳A股虧損家數','深圳A股近一月數據','深圳A股近三月數據','深圳A股近六月數據','深圳A股近一年月數據', '滬深A股板塊名稱','滬深A股最新值','滬深A股股票家數','滬深A股虧損家數','滬深A股近一月數據','滬深A股近三月數據','滬深A股近六月數據','滬深A股近一年月數據', '深市主板板塊名稱','深市主板最新值','深市主板股票家數','深市主板虧損家數','深市主板近一月數據','深市主板近三月數據','深市主板近六月數據','深市主板近一年月數據', '中小板板塊名稱','中小板最新值','中小板股票家數','中小板虧損家數','中小板近一月數據','中小板近三月數據','中小板近六月數據','中小板近一年月數據', '創業板板塊名稱','創業板最新值','創業板股票家數','創業板虧損家數','創業板近一月數據','創業板近三月數據','創業板近六月數據','創業板近一年月數據',] # 數據的讀取 guxilv = pd.read_csv("E:\\download2\\guxilv.csv",encoding="gbk",names=column_title,index_col='時間',parse_dates=True) # usecols 提取部分數據 # 數據的存取 guxilv.to_csv("E:\\download2\\guxilv2.csv") print(guxilv)