手把手教你從零搭建Python數據分析環境


由於最近再做推薦系統的特征處理,需要借助一些工具來篩選特征。最初使用了R,R的安裝很簡單,而且API也很容易使用,直接就能出圖。后來,發現很多人在python和R之間做選擇,所以我也在兩個工具間搖擺不定。后來,發現Tensorflow里面有很多python的代碼,而且python可以做爬蟲寫web,幾乎是萬金油的角色。本着想找一門以后日常使用的工具的心態,最終還是選擇了python。

那么本篇就從下面幾個方面介紹下,如何在日常使用python做數據分析:

  • python安裝以及numpy、matplotlib的安裝
  • python的hello world
  • SublimeText的python集成
  • 相關推薦

希望對那些剛剛打算做數據分析的朋友,提供參考。

Python以及必要的庫安裝

Python目前有兩個版本,一個是2.7,一個是3.4,在同事的推薦下,選擇了2.7。Python的下載直接去官網就可以了,但是想要做數據分析,還需要依賴很多其他的模塊,比如科學計算庫Numpy,圖形庫matplotlib,數值計算庫scipy,數據挖掘分析庫pandas,本篇就先安裝個Numpy和matplotlib,以做演示,其他庫的安裝基本類似。

python安裝的幾種方式

  • 一種是在sourceforge上下載exe文件,只要操作系統版本沒問題,幾乎是一鍵安裝
  • 一種是下載zip或者tar.gz壓縮包,使用里面的setup.py執行setup.py install命令安裝
  • 另一種是下載whl文件,放在python的scripts文件夾中,使用命令pip install xxx.whl安裝

我這次由於需要的庫比較多,下載的安裝文件什么樣子都有,所以幾種方式都會演示下。

相關的下載資源參考分享鏈接:鏈接:http://pan.baidu.com/s/1i4Jhez7 密碼:t1sw

安裝Python

直接運行python-2.7.13.amd64.msi,無腦下一步即可,不過要記住python所在的目錄C:\Python27\,稍后需要對這個目錄進行添加文件。

安裝numpy和matplotlib

如果版本沒問題(比如不是64位系統下載安裝32位軟件),那么會自動識別到python所在的目錄,直接下一步安裝即可。

Matplotlib也是一樣安裝即可。

安裝cycler、dateutil

把whl文件拷貝到python27/scripts目錄下,可以暫時忽略requests那個文件,這個requests庫是webhdfs庫連接hdfs環境用的,如果不使用可以用安裝

然后分別執行命令:

pip install cycler-0.10.0-py2.py3-none-any.whl
pip install python_dateutil-2.6.1-py2.py3-none-any.whl

安裝pyparsing

解壓pyparsing壓縮包,在setup.py那層目錄執行setup.py install命令安裝即可

安裝到這里,numpy和matplotlib就可以使用了~

python初體驗

python安裝完,來體驗一下吧。python支持控制台輸出,也支持在新的文件中寫入多行內容,統一執行。

SublimeText集成

直接使用IDLE,有點太麻煩,直接基於sublime text開發過ruby和web前端,體驗非常好,所以還是想通過sublimeText編寫python代碼。

因此首先在點擊Tools->Build System->New Build System,彈出文件:
{
"shell_cmd": "make"
}

按照下面的配置輸入:
{
"cmd": ["C:/Python27/python.exe", "-u", "$file"],
"file_regex": "[1]File "(…?)", line ([0-9]*)",
"selector": "source.python"
}
並保存成自己的名字(我起名叫做my_python),注意路徑需要修改為本地的python路徑。路徑為C:\Users\xxh\AppData\Roaming\Sublime Text 3\Packages\User

在Tools -> Build System 中重新選擇my_pyhton

然后再SublimeText中體驗一下matplotlib的魅力,代碼如下:

import numpy as np
import matplotlib.pyplot as plt
plt.figure(1)
ax1=plt.subplot(211)
x=np.linspace(0,100,100)
for i in xrange(1,100):
	plt.figure(1)
	plt.plot(x,x*2)
plt.show()

按ctrl+B即可執行:

相關推薦

1 廖雪峰的python教程:http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/
2 runoob的python教程:http://www.runoob.com/python/python-tutorial.html


  1. ↩︎


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM