由於最近再做推薦系統的特征處理,需要借助一些工具來篩選特征。最初使用了R,R的安裝很簡單,而且API也很容易使用,直接就能出圖。后來,發現很多人在python和R之間做選擇,所以我也在兩個工具間搖擺不定。后來,發現Tensorflow里面有很多python的代碼,而且python可以做爬蟲寫web,幾乎是萬金油的角色。本着想找一門以后日常使用的工具的心態,最終還是選擇了python。
那么本篇就從下面幾個方面介紹下,如何在日常使用python做數據分析:
- python安裝以及numpy、matplotlib的安裝
- python的hello world
- SublimeText的python集成
- 相關推薦
希望對那些剛剛打算做數據分析的朋友,提供參考。
Python以及必要的庫安裝
Python目前有兩個版本,一個是2.7,一個是3.4,在同事的推薦下,選擇了2.7。Python的下載直接去官網就可以了,但是想要做數據分析,還需要依賴很多其他的模塊,比如科學計算庫Numpy,圖形庫matplotlib,數值計算庫scipy,數據挖掘分析庫pandas,本篇就先安裝個Numpy和matplotlib,以做演示,其他庫的安裝基本類似。
python安裝的幾種方式
- 一種是在sourceforge上下載exe文件,只要操作系統版本沒問題,幾乎是一鍵安裝
- 一種是下載zip或者tar.gz壓縮包,使用里面的setup.py執行
setup.py install
命令安裝 - 另一種是下載whl文件,放在python的scripts文件夾中,使用命令
pip install xxx.whl
安裝
我這次由於需要的庫比較多,下載的安裝文件什么樣子都有,所以幾種方式都會演示下。
相關的下載資源參考分享鏈接:鏈接:http://pan.baidu.com/s/1i4Jhez7 密碼:t1sw
安裝Python
直接運行python-2.7.13.amd64.msi
,無腦下一步即可,不過要記住python所在的目錄C:\Python27\
,稍后需要對這個目錄進行添加文件。
安裝numpy和matplotlib
如果版本沒問題(比如不是64位系統下載安裝32位軟件),那么會自動識別到python所在的目錄,直接下一步安裝即可。
Matplotlib也是一樣安裝即可。
安裝cycler、dateutil
把whl文件拷貝到python27/scripts目錄下,可以暫時忽略requests那個文件,這個requests庫是webhdfs庫連接hdfs環境用的,如果不使用可以用安裝
然后分別執行命令:
pip install cycler-0.10.0-py2.py3-none-any.whl
pip install python_dateutil-2.6.1-py2.py3-none-any.whl
安裝pyparsing
解壓pyparsing壓縮包,在setup.py那層目錄執行setup.py install
命令安裝即可
安裝到這里,numpy和matplotlib就可以使用了~
python初體驗
python安裝完,來體驗一下吧。python支持控制台輸出,也支持在新的文件中寫入多行內容,統一執行。
SublimeText集成
直接使用IDLE,有點太麻煩,直接基於sublime text開發過ruby和web前端,體驗非常好,所以還是想通過sublimeText編寫python代碼。
因此首先在點擊Tools->Build System->New Build System
,彈出文件:
{
"shell_cmd": "make"
}
按照下面的配置輸入:
{
"cmd": ["C:/Python27/python.exe", "-u", "$file"],
"file_regex": "[1]File "(…?)", line ([0-9]*)",
"selector": "source.python"
}
並保存成自己的名字(我起名叫做my_python),注意路徑需要修改為本地的python路徑。路徑為C:\Users\xxh\AppData\Roaming\Sublime Text 3\Packages\User
在Tools -> Build System 中重新選擇my_pyhton
然后再SublimeText中體驗一下matplotlib的魅力,代碼如下:
import numpy as np
import matplotlib.pyplot as plt
plt.figure(1)
ax1=plt.subplot(211)
x=np.linspace(0,100,100)
for i in xrange(1,100):
plt.figure(1)
plt.plot(x,x*2)
plt.show()
按ctrl+B即可執行:
相關推薦
1 廖雪峰的python教程:http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/
2 runoob的python教程:http://www.runoob.com/python/python-tutorial.html