最近在做一個項目,主要是基於股票市場來驗證一些model,看看能否做量化交易。那么如何獲取數據呢?因為客戶這邊前期是不想花錢買數據的,只能自己想辦法了,從sina和yahoo財經頻道爬到一些數據,但是有些數據比較難找,看到了知乎上面的一個帖子,於是就嘗試一下。
- tushare的介紹。
- 使用前提,安裝anaconda。
- 按照好了之后,如何開發呢?選擇什么樣的IDE呢?如何基於anaconda搭建IDE環境。
- 安裝tushare:windows下打開cmd.exe,OS X下打開terminal,pip install tushare。
- 使用mysql驅動的時候遇到了問題:ImportError: No module named 'MySQLdb'
- 找出mysql所有的驅動:http://docs.sqlalchemy.org/en/latest/dialects/mysql.html#module-sqlalchemy.dialects.mysql.pymysql
- 尋找其中合適的使用,pymysql:pip install pymysql
import tushare as ts #import pandas as pd #import numpy as np #import matplotlib.pyplot as plt from sqlalchemy import create_engine engine = create_engine('mysql+pymysql://loginuser:loginuser@172.16.130.6/nevmiss?charset=utf8') df = ts.get_area_classified() df.to_sql('area_data_py',engine,if_exists='append') df = ts.get_industry_classified() df.to_sql('industry_data_py',engine,if_exists='append')
好了,可以輕松地使用tushare的數據源了。