sklearn學習筆記之開始


簡介

  自2007年發布以來,scikit-learn已經成為Python重要的機器學習庫了。scikit-learn簡稱sklearn,支持包括分類、回歸、降維和聚類四大機器學習算法。還包含了特征提取、數據處理和模型評估三大模塊。
  sklearn是Scipy的擴展,建立在NumPy和matplotlib庫的基礎上。利用這幾大模塊的優勢,可以大大提高機器學習的效率。
  sklearn擁有着完善的文檔,上手容易,具有着豐富的API,在學術界頗受歡迎。sklearn已經封裝了大量的機器學習算法,包括LIBSVM和LIBINEAR。同時sklearn內置了大量數據集,節省了獲取和整理數據集的時間。

機器學習基礎

  定義:針對經驗E和一系列的任務T和一定表現的衡量P,如果隨着經驗E的積累,針對定義好的任務T可以提高表現P,就說明機器具有學習能力。

 sklearn安裝

    sklearn目前的版本是0.17.1,可以使用pip安裝。在安裝時需要進行包依賴檢查,具體有以下幾個要求:

  • Python(>=2.6 or >=3.3)
  • NumPy(>=1.6.1)
  • SciPy(>=0.9)

    如果滿足上述條件,就能使用pip進行安裝了:

1 pip install -U scikit-learn

      當然,使用pip安裝會比較麻煩,推薦使用Anaconda科學計算環境,里面已經內置了NumPy、SciPy、sklearn等模塊,直接可用。或者使用conda進行包管理。conda安裝與pip類似:

1  conda install scikit-learn

       安裝完sklearn以后,可以檢查以下版本:

1  >>> import sklearn
2  >>> sklearn.__version__
3  '0.17.1'

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM