由於量化策略研究需要用到盡量全的歷史數據,包括:股票、外匯、期貨、基金等等的分鍾、小時、日歷史數據,而且數據盡量全,最好能從九幾年起。所以我在網上做了較多的搜查以找到可用的數據源。以下分別列出幾個方案,並討論其優缺,最后總結出一條可行的路。
Tushare 數據接口:
該接口基本是使用新浪的數據源做一個python的封裝。而且目前只針對股票,能獲取到日線數據較為完整。分鍾線和小時線都不行,明細數據有些股票能獲取到較早的時間,大概2004年左右。
直接新浪 數據接口:
該方法能獲取到股票、外匯、期貨的歷史及實時數據,股票數據情況同tushare。期貨外匯的數據都不是很全。期貨的明細獲取辦法暫時未找到。
通聯數據:
該渠道還是主打事實數據為主,歷史數據接口還沒找到較好的。這個也要付費,但可以試用。
Wind 數據接口:
下載wind 客戶端,可以開啟Python接口,可以通過獲取到期貨、外匯、基金等等一系列產品的實時以及歷史行情,包括日線、小時、分鍾。具體最早能獲取到多早未知。但是要付費! 3.8萬一年。
盈透 IB 數據接口:
需要獲得IB的賬戶才能使用它的接口獲取數據,數據獲取也有一定的限制。但相對來說,如果在那里進行實盤交易,獲取歷史數據就相當於免費。具體的限制可以參加這里。
直接購買:
淘寶能搜到不少提供歷史數據的商家。網上找到一個微盛投資,可以提供各種歷史數據,也比較全面。但這家公司如何未了解。
手動下載:
這個方法基於軟件。MT4平台主要可以下載外匯和股指的歷史數據,直接導出成csv格式,也很全面。缺點是手動,而且沒有股票和較全的期貨數據。
其余的方法,比如Yahoo的數據等還未具體調查,但基本可以認為並不比以上的方法好。
總結:
先通過tushare和新浪的接口獲取股票、期貨、外匯的數據。然后做好數據整理。如果需要較為完整的數據的地方,可以通過手動下載的方式。后期再使用wind和盈透的數據。如果盈透和wind的數據也不夠完整,可以考慮數據購買。