python爬蟲之Anaconda安裝


Anaconda概述

Anaconda是一個用於科學計算的Python發行版,支持 Linux, Mac, Windows系統,提供了包管理與環境管理的功能,可以很方便地解決多版本python並存、切換以及各種第三方包安裝問題。Anaconda利用工具/命令conda來進行package和environment的管理,並且已經包含了Python和相關的配套工具。

這里先解釋下conda、anaconda這些概念的差別。conda可以理解為一個工具,也是一個可執行命令,其核心功能是包管理環境管理。包管理與pip的使用類似,環境管理則允許用戶方便地安裝不同版本的python並可以快速切換。Anaconda則是一個打包的集合,里面預裝好了conda、某個版本的python、眾多packages、科學計算工具等等,所以也稱為Python的一種發行版。其實還有Miniconda,顧名思義,它只包含最基本的內容——python與conda,以及相關的必須依賴項,對於空間要求嚴格的用戶,Miniconda是一種選擇。

進入下文之前,說明一下conda的設計理念——conda將幾乎所有的工具、第三方包都當做package對待,甚至包括python和conda自身!因此,conda打破了包管理與環境管理的約束,能非常方便地安裝各種版本python、各種package並方便地切換。

Anaconda的安裝

Anaconda的下載頁參見官網下載,Linux、Mac、Windows均支持。

安裝時,會發現有兩個不同版本的Anaconda,分別對應Python 2.7和Python 3.5,兩個版本其實除了這點區別外其他都一樣。后面我們會看到,安裝哪個版本並不本質,因為通過環境管理,我們可以很方便地切換運行時的Python版本。(由於我常用的Python是2.7和3.4,因此傾向於直接安裝Python 2.7對應的Anaconda)

下載后直接按照說明安裝即可。這里想提醒一點:盡量按照Anaconda默認的行為安裝——不使用root權限,僅為個人安裝,安裝目錄設置在個人主目錄下(Windows就無所謂了)。這樣的好處是,同一台機器上的不同用戶完全可以安裝、配置自己的Anaconda,不會互相影響。

 

Anaconda 的優點?

Anaconda的優點總結起來就八個字:省時省心、分析利器。

  • 省時省心: Anaconda通過管理工具包、開發環境、Python版本,大大簡化了你的工作流程。不僅可以方便地安裝、更新、卸載工具包,而且安裝時能自動安裝相應的依賴包,同時還能使用不同的虛擬環境隔離不同要求的項目。

  • 分析利器:Anaconda 官網中是這么宣傳自己的:適用於企業級大數據分析的Python工具。其包含了720多個數據科學相關的開源包,在數據可視化、機器學習、深度學習等多方面都有涉及。不僅可以做數據分析,甚至可以用在大數據和人工智能領域。

 
        

什么是 conda ?

conda 是開源包(packages)和虛擬環境(environment)的管理系統。

   packages 管理:

     可以使用 conda 來安裝、更新 、卸載工具包 ,並且它更關注於數據科學相關的工具包。在安裝 anaconda 時就預先集成了像 Numpy、Scipy、 pandas、Scikit-learn 這些在數據分析中常用的包。另外值得一提的是,conda 並不僅僅管理Python的工具包,它也能安裝非python的包。比如在新版的 Anaconda 中就可以安裝R語言的集成開發環境 Rstudio。

   虛擬環境管理: 在conda中可以建立多個虛擬環境,用於隔離不同項目所需的不同版本的工具包,以防止版本上的沖突。對糾結於 Python 版本的同學們,我們也可以建立 Python2 和 Python3 兩個環境,來分別運行不同版本的 Python 代碼。

 
        

  國外下載(官網):

    下載地址:https://www.anaconda.com/download/

    下載版本:https://repo.continuum.io/archive/Anaconda3-5.0.0.1-Linux-x86_64.sh

  國內下載:

       http://mirrors.ustc.edu.cn/

    下載:https://mirrors.ustc.edu.cn/anaconda/archive/

 

Linux安裝:

#首先給腳本一個可執行權限
chmod 755 Anaconda3-5.0.0.1-Linux-x86_64.sh

#執行腳本,根據提示該回車的回車。
sh Anaconda3-5.0.0.1-Linux-x86_64.sh

#添加環境變量
export PATH=/root/anaconda3/bin:$PATH

#要不你重啟執行,要不就執行下面命令讓環境變量立刻生效。
source /etc/profile

#查看版本
anaconda -V

#測試安裝scrapy
coda install scrapy


[root@localhost ~]# python
Python 3.6.2 |Anaconda, Inc.| (default, Sep 30 2017, 18:42:57)
[GCC 7.2.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import scrapy
>>>

  

 

 

 

安裝完成后,我們還需要對所有工具包進行升級,以避免可能發生的錯誤。打開你電腦的終端,在命令行中輸入:

conda upgrade --all

 

這里 package_name 是需要安裝包的名稱。你也可以同時安裝多個包,比如同時安裝numpy 、scipy 和 pandas,則執行如下命令:

conda install numpy scipy pandas

 

你也可以指定安裝的版本,比如安裝 1.1 版本的 numpy :

conda install numpy=1.10

 

移除一個 package:

conda remove package_name

 

升級 package 版本:

conda update package_name

  

查看所有的 packages:

conda list

  

如果你記不清 package 的具體名稱,也可以進行模糊查詢:

conda  search search_term

  

 

參考與:http://www.jianshu.com/p/169403f7e40c


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM