CSV數據的處理(增加行列索引,提取,構造,保存)


CSV數據的處理:

1.數據行和列索引的設置。

2.數據的解析代碼和時間的處理。

3.從原始數據中切片數據(提取部分數據)。

4.行列數據的提取(含多行數據)

5.數據的構造。

# hanbb
# come on!!!
import pandas as pd
import csv

# 標題的設置
column_title = ['時間','上海A股','上海A股最新值','股票家數','虧損家數','近一月數據','近三月數據','近六月數據','近一年月數據',
                '深圳A股','深圳A股最新值','深圳A股股票家數','深圳A股虧損家數','深圳A股近一月數據','深圳A股近三月數據','深圳A股近六月數據','深圳A股近一年月數據',
                '滬深A股板塊名稱','滬深A股最新值','滬深A股股票家數','滬深A股虧損家數','滬深A股近一月數據','滬深A股近三月數據','滬深A股近六月數據','滬深A股近一年月數據',
                '深市主板板塊名稱','深市主板最新值','深市主板股票家數','深市主板虧損家數','深市主板近一月數據','深市主板近三月數據','深市主板近六月數據','深市主板近一年月數據',
                '中小板板塊名稱','中小板最新值','中小板股票家數','中小板虧損家數','中小板近一月數據','中小板近三月數據','中小板近六月數據','中小板近一年月數據',
                '創業板板塊名稱','創業板最新值','創業板股票家數','創業板虧損家數','創業板近一月數據','創業板近三月數據','創業板近六月數據','創業板近一年月數據',]

# 部分數據的截取
guxilv = pd.read_csv("E:\\download2\\guxilv.csv",encoding="gbk",names=column_title,index_col='時間',usecols=[0,1,3],parse_dates=True)   # usecols 提取部分數據
print(guxilv)

# 數據的讀取,解碼,設置列標題,設置行表標題
guxilv = pd.read_csv("E:\\download2\\guxilv.csv",encoding="gbk",names=column_title,index_col='時間')  # 需要設置編碼,否則打不開

# column 標題
print(guxilv.columns)

# 時間設置為index
print(guxilv.index)

# 提取列信息
print(guxilv['中小板最新值'])                   # 帶時間索引
print(guxilv['中小板最新值'].values)            # 只有值
print(guxilv[['中小板最新值','創業板最新值']])  # 兩列數據

# 提取行信息
print(guxilv.ix['2017-12-06'])

# 數據的構造
new_info = pd.DataFrame({'shA':guxilv['上海A股最新值']})
new_info = new_info.join(pd.DataFrame({'szA':guxilv['深圳A股最新值']}))
# new_info = new_info.join(pd.DataFrame({'shA':guxilv['深圳A股最新值']}))
# new_info = new_info.fillna(method='ffill')
print(new_info)

 

數據的保存

1.將新修改的數據保存早新的文件中

import pandas as pd

# 標題的設置
column_title = ['時間','上海A股','上海A股最新值','股票家數','虧損家數','近一月數據','近三月數據','近六月數據','近一年月數據',
                '深圳A股','深圳A股最新值','深圳A股股票家數','深圳A股虧損家數','深圳A股近一月數據','深圳A股近三月數據','深圳A股近六月數據','深圳A股近一年月數據',
                '滬深A股板塊名稱','滬深A股最新值','滬深A股股票家數','滬深A股虧損家數','滬深A股近一月數據','滬深A股近三月數據','滬深A股近六月數據','滬深A股近一年月數據',
                '深市主板板塊名稱','深市主板最新值','深市主板股票家數','深市主板虧損家數','深市主板近一月數據','深市主板近三月數據','深市主板近六月數據','深市主板近一年月數據',
                '中小板板塊名稱','中小板最新值','中小板股票家數','中小板虧損家數','中小板近一月數據','中小板近三月數據','中小板近六月數據','中小板近一年月數據',
                '創業板板塊名稱','創業板最新值','創業板股票家數','創業板虧損家數','創業板近一月數據','創業板近三月數據','創業板近六月數據','創業板近一年月數據',]

# 數據的讀取
guxilv = pd.read_csv("E:\\download2\\guxilv.csv",encoding="gbk",names=column_title,index_col='時間',parse_dates=True)   # usecols 提取部分數據

# 數據的存取
guxilv.to_csv("E:\\download2\\guxilv2.csv")

print(guxilv)

 


 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM