大數據中心檢索數據題
1、仔細認真,不急,但也要有時間觀念,越快完成越好
2、理清楚邏輯,不行的直接就暴力丟excell里面去
3、注意效率,后面的題會更加浪費時間
4、及時與隊友溝通,可以讓隊友幫忙
5、建議多進行自主訓練,加快解題速度,提高解題准確率
編程檢索數據題
ts_code的說明
600 開頭的代碼一般 是要以 .SH 結尾
上交所sh和深交所sz
總之在Python中一定要加上后綴 sz 或者 sh
monthly接口相關(月線接口)
一些參數
trade_date #交易日期
start_date #開始日期
end_date #結束日期
fields #最終需要的參數
open #開盤價
high #最高價
low #最低價
close #收盤價
pct_chg # 未復權漲跌幅
import tushare as ts
pro = ts.pro_api('token')
ds = pro.monthly(ts_code='600271.SH', start_date='20131201', end_date='20181231', fields='trade_date,close')
# 篩選數據
ds = ds[ds.trade_date.map(lambda x:x.find('12',4,6)>=0)]
print(ds)
pro_bar 接口相關(通用行情接口)
一些參數
asset #資產類別:E股票 I滬深指數 C數字貨幣 FT期貨 FD基金 O期權 CB可轉債(v1.2.39),默認E
freq #數據頻度 :支持分鍾(min)/日(D)/周(W)/月(M)K線,其中1min表示1分鍾(類推1/5/15/30/60分鍾) ,默認D。
adj #復權類型(只針對股票):None未復權 qfq前復權 hfq后復權 , 默認None,目前只支持日線復權。
import tushare as ts
ts.set_token('token')
ds = ts.pro_bar(ts_code='399101.SZ', asset='I', freq='M', start_date='20130101', end_date='20181231')
# 其中 asset 為這個證券的類型,比如 E股票 I滬深指數,freq為數據頻率(M代表月)
#篩選數據
ds = ds[ds.trade_date.map(lambda x:x.find('12',4,6)>=0)]
ds = ds[['trade_date','close']]
print(ds)
import tushare as ts
import matplotlib as mp
import matplotlib.pyplot as plt
from pandas.plotting import register_matplotlib_converters
register_matplotlib_converters()
# 抓取數據
ds = ts.pro_bar(ts_code='002193.SZ', start_date='20180601', end_date='20180630', adj='None')
ds.to_csv('D:/bigdata/如意集團2018年6月公司股價變動日收盤價.csv')
# 清洗數據
df = ds[['trade_date', 'high']]
df.to_csv('D:/bigdata/如意集團2018年6月公司股價變動日最高價(已清洗).csv')
print(df)
# 為了防止出現中文亂碼,在這里進行一下設置
plt.rcParams['font.sans-serif']=['SimSun']
plt.rcParams['axes.unicode_minus']=False
#生成折線圖
x_cel = ds['trade_date'] #取值給曲線x
y_col1 = ds['open'] #取值給y
y_col2 = ds['close']
y_col3 = ds['high']
plt.figure(figsize=(9, 7)) #定義畫布尺寸
plt.plot_date(x_cel, y_col1, '-', label='open price') #畫線以及定義線的類型和命名
plt.plot_date(x_cel, y_col2, '-', label='closing price')
plt.plot_date(x_cel, y_col3, '-', label='peak price')
plt.xlabel('日期') #給x和y軸命名
plt.ylabel('指數')
plt.legend() #給圖像加上圖例
plt.xticks(rotation=45) #將x軸的圖例坐標值,傾斜 45度放置
plt.style.use('ggplot') #設置背景樣式
plt.grid(True) #顯示網格線
plt.title('如意集團2018年6月開盤價收盤價最高價折線圖', fontsize=10)
plt.savefig('D:/bigdata/如意集團開盤價收盤價最高折線圖.png')
balancesheet接口(資產負債表)
total_hldr_eqy_exc_min_int # 股東權益合計(不含少數股東權益)
total_hldr_eqy_inc_min_int # 股東權益合計(含少數股東權益)
total_liab # 負債合計
題目
import tushare as ts
pro = ts.pro_api('token')
df=pro.balancesheet(ts_code='300410.SZ',start_date='20210101', end_date='20210631',fields='ts_code,end_date,total_hldr_eqy_inc_min_int,total_liab')
df = df[df.end_date.map(lambda x:x.find('12',4,6)>=0)]
df.to_csv('300410.csv')
print(df)
產權比率=負債/權益=1570748408.55/629392801.51=2.5
根據資料的信息收集題
仔細閱讀所給材料(一般是背景資料或者背景資料中的PDF)
PDF中也可進行文字搜索
尋找隊友幫助
作者:~逍遙子~
本文連接: https://www.cnblogs.com/femme/p/15470833.html
版權:本人個人所有
轉載請注明出處