最近看了些關於數據分析的書,想系統的整理下相關知識,算是學習筆記吧,也希望能幫到初學者。
1、Anaconda介紹
安裝python的方法有很多種,數據分析方面比較常用Anaconda。Anaconda是一個開源的Python發行版本,其包含了conda、Python等多個科學包及其依賴項,也可以使用Miniconda這個較小的發行版,僅包含conda和 Python。Anaconda可以管理包,就是能夠安裝、更新、移除工具包,比如Numpy、Scipy、pandas、Scikit-learn等數據分析中常用的包;也可以管理環境,能夠創建、訪問、共享、移除環境,用於隔離不同項目所需要的不同版本的工具包,所以,我們可以建立 Python2 和 Python3 兩個環境,來分別運行不同版本的 Python 代碼。
2、Anaconda安裝
可以從官網下載 Anaconda 的安裝程序,也可以在清華大學開源軟件鏡像站下載,后者因為在國內,所以下載速度相對快些。無論是 Windows、Linux 還是 MAC 的 OSX 系統,都可以找到對應的安裝軟件。如果電腦是64位的就選64位版本。根據提示進行安裝,完成后會發現有幾項內容:
- Anaconda Navigator:管理工具包和環境的圖形用戶界面。
- Anaconda Prompt:終端,可以使用命令行來管理包和環境。
- Jupyter Notebook :基於web的交互式計算環境,可以編輯易於人們閱讀的文檔,用於展示數據分析的過程。
- Spyder:一個使用Python語言、跨平台、科學運算的集成開發環境。
2.1 配置環境變量
有的情況下,可能會遇到找不到 conda 命令的錯誤提示,這很可能是環境路徑設置的問題,下面是 window、mac 下配置環境變量的方法:
1. window 系統
計算機->右鍵選擇屬性->高級系統設置->環境變量->系統變量->path。在path中加入anaconda安裝的目錄就可以了,如下圖:
2. MAC 電腦
在終端輸入以下命令:
export PATH=~/anaconda3/bin:$PATH
2.2 配置國內鏡像
如果運行以下更新包命令:
conda upgrade --all
如果出現 CondaHTTPError: HTTP 000 CONNECTION FAILED for url...的錯誤信息,需要運行以下命令:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ conda config --set show_channel_urls yes
即可添加 Anaconda Python 免費倉庫。
至此,完成安裝Anaconda,下面讓我們看一下如何用Anaconda管理環境和工具包。
3、Anaconda使用
3.1 環境管理器
1. 創建環境
格式:
conda create --name env_name package_names
其中,env_name 是環境的名稱,package_names 是安裝在創建環境中的包名稱。
例如,要創建環境 python36,其中包含包python,並指定版本,在 Anaconda Prompt(終端)中輸入:
conda create --name python36 python=3.6
也可以使用以下命令創建環境
conda create -n python2 python=2.7
2. 進入環境
windows 下格式
activate env_name
Linux & Mac 下格式
source activate env_name
3. 離開環境
windows 下格式
deactivate
Linux & Mac 下格式
source deactivate
4. 列出環境
格式:
conda env list
執行命令之后,結果如下圖:
其中,帶星號(*)的環境是當前環境。
5. 刪除環境
格式:
conda remove --name env_name --all
其中,env_name 是環境的名稱。
例如,刪除環境 python36,在 Anaconda Prompt(終端)中輸入:
conda remove --name python36 --all
也可以使用以下命令刪除環境python36
conda env remove -n python36
3.2 包管理
1. 安裝包
格式:
conda install package_name
package_name為包的名稱
例如,要安裝 numpy,在 Anaconda Prompt(終端)中輸入:
conda install numpy
如果要同時安裝多個包,可以輸入:
conda install pandas numpy
如果想要指定包的版本,可以輸入
conda install numpy=1.14
也可以指定環境安裝包,可以輸入以下命令安裝 numpy
conda install -n python36 numpy
2. 移除包
格式:
conda remove package_name
例如,要移除 numpy,在 Anaconda Prompt(終端)中輸入:
conda remove numpy
也可以指定環境移除包,可以輸入以下命令移除 numpy
conda remove -n python36 numpy
3. 更新包
格式:
conda update package_name
要更新環境中的所有包,在 Anaconda Prompt(終端)中輸入:
conda update --all
也可以指定環境更新包,可以輸入以下命令更新 numpy
conda update -n python36 numpy
4. 列出已安裝的包
要查看所有的包,在 Anaconda Prompt(終端)中輸入:
conda list
也可以查詢某個指定環境的已安裝包
conda list -n python36
5. 查詢包的信息
格式:
conda search package_name
例如,下面是查詢包 numpy 的信息
conda search numpy
注:1、如果在終端用命令創建了多個環境,然而在 Jupyter Notebook 中不顯示創建的環境,這時候需要安裝包 nb_conda 用於 Jupyter Notebook 自動關聯 Anaconda 環境,執行命令如下:
conda install nb_conda
2、創建新的 python 環境,比如3.6,運行
conda create --name python36 python=3.6
之后,conda 僅安裝 python 3.6 相關的必須包,如 python,pip 等,如果希望 python36 像默認環境,在 Anaconda Prompt(終端)中輸入:
conda create -n python36 python=3.6 anaconda