Python讀取文件並寫入ODPS

本文轉載自查看原文 2022-03-28 09:03 1114 ODPS/ Python

前提：

　　將本地csv文件，用pandas讀取，並進行數據ETL，最后導入到ODPS表中。

代碼如下：

import pandas as pd
from tqdm import tqdm_notebook
from odps import ODPS
from odps import options
from odps.df import DataFrame


from odps.df import DataFrame

# 查看相對路徑
%pwd

odps = ODPS('ODPS_ak', 'ODPS_pw', 'ODPS項目空間',
            endpoint='http://service.cn-shanghai.maxcompute.aliyun.com/api',
            tunnel_endpoint="http://dt.cn-shanghai.maxcompute.aliyun.com")

# 讀取數據
data = pd.read_csv('/home/linxz/datadir/202108.csv',encoding='utf-8') # 07已同步

# 查看數據是否全部讀取成功
data.describe()

# 數據ETL
a = data[['company_id','ofr_id','bid_id','security_id','bond_id','listed_market','short_name','time','bid_price','bid_volume','ofr_price','ofr_volume','bid_yield','bid_net_price','bid_flag_bargain','bid_flag_relation','bid_exercise','bid_price_description','bid_quote_type','ofr_yield','ofr_net_price','ofr_flag_bargain','ofr_flag_relation','ofr_exercise']]
b = data[['ofr_price_description']]
b_new = b.replace('[,]','，',regex = True) # 使用正則表達式，將數據中的英文逗號改為中文

c = data[['ofr_quote_type','bid_ss_detect','ofr_ss_detect']]
data_join = a.join(b_new) data_new = data_join.join(c) data_new.head()

# 新增最后面一列，作為分區
data_new['month_date'] = '202108'
data_new.head()

# 最后導入ODPS表中 
options.connect_timeout=200
options.tunnel.use_instance_tunnel = True
options.tunnel.limit_instance_tunnel = False
odps_awake_model_result = DataFrame(data_new)
print(odps_awake_model_result)
odps_awake_model_result.persist('ODPS項目空間.o_sumscope_bond_relation_detail_d', partitions=['month_date'], odps=odps)

# 導出方式二：導出到本地
# 導出修改后的csv文件
# data_new.to_csv('/home/linxz/datadir/202101_new.csv')

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Python 文件的讀取與寫入 python讀取或寫入文件 python文件的寫入和讀取 Python——文件讀取與寫入 python之文件的讀取與寫入 python寫入文件和讀取文件 Python對CSV文件的讀取與寫入 python之讀取和寫入csv文件 python中關於文件的讀取和寫入 python讀取和寫入CSV文件