numpy, pandas, matplotlib等常用庫的學習手冊


 

pandas介紹:

待續

參考資料:

中文:https://www.cnblogs.com/skying555/p/5914391.html

英文:http://www.datadependence.com/2016/05/scientific-python-pandas/

 

numpy介紹:

 

待續

參考資料:

https://www.jianshu.com/p/83c8ef18a1e8

 

Matplotlib

Matplotlib 是一個 Python 的 2D繪圖庫,它以各種硬拷貝格式和跨平台的交互式環境生成出版質量級別的圖形。

待續

 

gensim介紹:

在安裝gensim需要注意,gensim 用conda install gensim 與pip install gensim 安裝是不同的,個人建議用anaconda安裝。操作系統系統最好使用linux。

在Windows環境下,使用pip安裝gensim會出現以下問題:

 

 

 

sklearn

sklearn是機器學習中一個常用的python第三方模塊,網址: http://scikit-learn.org/stable/index.html ,里面對一些常用的機器學習方法進行了封裝,在進行機器學習任務時,並不需要每個人都實現所有的算法,只需要簡單的調用sklearn里的模塊就可以實現大多數機器學習任務。機器學習任務通常包括分類(Classification)和回歸(Regression),常用的分類器包括SVM、KNN、貝葉斯、線性回歸、邏輯回歸、決策樹、隨機森林、xgboost、GBDT、boosting、神經網絡NN。常見的降維方法包括TF-IDF、主題模型LDA、主成分分析PCA等。
 
 

補充

學習如何使用這些包應該直接去閱讀官方文檔,現在網上的博客質量大多都良莠不齊,並且也不系統,最好的方式是直接去閱讀官方文檔,但是苦於英語水平,直接閱讀官方文檔也不太現實。幸好有一些網絡界的雷鋒同志給我們翻譯了這些文檔:

numpy中文文檔:https://www.numpy.org.cn/index.html

panda中文文檔:https://www.pypandas.cn/index.html

matplotlib中文文檔:https://www.matplotlib.org.cn/index.html

這個三個文檔應該是同一個團體翻譯的,里面有一些翻譯錯誤,並且翻譯也不算完全。

還有就是一個叫ApacheCN的團體,翻譯了很多文檔和機器學習的書籍,同樣也包括numpy, panda, matplotlib這個三個文檔。

地址:https://github.com/DaiKuai/home

python也自帶查詢功能,例如help(sum)就可以查詢sum函數的具體用法。

 

吐槽

有時候我常常在想,寫博客是不是要事無巨細,什么都往上寫,但是我后來想了想,這樣沒有必要,也很浪費時間,因為有很多工作,人家做的比你好的多,這個時候你只需要學習別的人工作就行了,沒有必要自己再做一遍。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM