量化歷史數據獲取


  由於量化策略研究需要用到盡量全的歷史數據,包括:股票、外匯、期貨、基金等等的分鍾、小時、日歷史數據,而且數據盡量全,最好能從九幾年起。所以我在網上做了較多的搜查以找到可用的數據源。以下分別列出幾個方案,並討論其優缺,最后總結出一條可行的路。

 

Tushare 數據接口:

  該接口基本是使用新浪的數據源做一個python的封裝。而且目前只針對股票,能獲取到日線數據較為完整。分鍾線和小時線都不行,明細數據有些股票能獲取到較早的時間,大概2004年左右。

 

直接新浪 數據接口:

  該方法能獲取到股票、外匯、期貨的歷史及實時數據,股票數據情況同tushare。期貨外匯的數據都不是很全。期貨的明細獲取辦法暫時未找到。

 

通聯數據:

  該渠道還是主打事實數據為主,歷史數據接口還沒找到較好的。這個也要付費,但可以試用。

 

Wind 數據接口:

  下載wind 客戶端,可以開啟Python接口,可以通過獲取到期貨、外匯、基金等等一系列產品的實時以及歷史行情,包括日線、小時、分鍾。具體最早能獲取到多早未知。但是要付費! 3.8萬一年。

 

盈透 IB 數據接口:

  需要獲得IB的賬戶才能使用它的接口獲取數據,數據獲取也有一定的限制。但相對來說,如果在那里進行實盤交易,獲取歷史數據就相當於免費。具體的限制可以參加這里

 

直接購買:

  淘寶能搜到不少提供歷史數據的商家。網上找到一個微盛投資,可以提供各種歷史數據,也比較全面。但這家公司如何未了解。

 

手動下載:

  這個方法基於軟件。MT4平台主要可以下載外匯和股指的歷史數據,直接導出成csv格式,也很全面。缺點是手動,而且沒有股票和較全的期貨數據。

 

其余的方法,比如Yahoo的數據等還未具體調查,但基本可以認為並不比以上的方法好。

 

總結:

  先通過tushare和新浪的接口獲取股票、期貨、外匯的數據。然后做好數據整理。如果需要較為完整的數據的地方,可以通過手動下載的方式。后期再使用wind和盈透的數據。如果盈透和wind的數據也不夠完整,可以考慮數據購買。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM