因為干活要用到,所以我大概於19年5月開始學python,大概學了1個月后,我就能干公司的活了,而且這python項目還包含了機器學習等要素,大概3個月后,我還承擔了項目里開發機器學習數據分析的任務。所以我感到,雖然python里包含了爬蟲、機器學習和數據分析等熱門要素,但python並不難學,而且如果方法得當,學到能干項目的程度也很快。在這篇文章里,就講給出我學Python的流程,向大家展示如何高效學python。
1 搭建開發環境
由於我有學java的基礎,所以我知道首先得搭建開發環境,當時我是用eclipse+Python解釋器+pydev插件搭的環境,當時我還用的是3.4解釋器,當然現在解釋器似乎到3.9了,我也用Pycharm集成開發環境了。
如果大家現在要學python,建議用如下的步驟搭建環境。
1. 到官網上去下載python解釋器,並安裝
這個是官網,https://www.python.org/downloads/windows/,在這里大家可以選擇最新的版本,並根據你機器的操作系統,下載windows或linux或mac的版本,我下載的是windows版本。下載后按提示即可完成安裝。
python是解釋型語言,所以下載並安裝解釋器后,就能在你本地運行python語言了。
2. 安裝pycharm集成開發環境
安裝好python解釋器以后,理論上你就可以通過命令行的方式,開發並運行python程序了。但這很不方便,所以建議再到https://www.jetbrains.com/pycharm/download/ 這個網站去下載並安裝pycharm集成開發環境。
3. 安裝第三方包
當安裝好python解釋器后,該解釋器會自帶一些比較基本的依賴包,但如果要開發機器學習或數據分析等程序,就需要安裝第三方包,比如后文提到的numpy等。
我安裝第三方包的做法是,在命令窗口,通過cd等命令,進入到Python解釋器所在的路徑,比如C:\Users\think\AppData\Local\Programs\Python\Python37,在該路徑里,再進入Scripts路徑,找到pip3命令,隨后通過pip3 install 包名的方式,安裝第三方包,比如要安裝numpy包,對應的命令是pip3 install numpy。
至此就搭好了開發環境。
2 搭建開發環境時遇到的坑
我在搭建開發環境時遇到過兩個坑,第一是換源,第二是在pycharm里找到對應的解釋器。
什么叫換源?
在用pip3 install numpy等命令安裝第三方庫的時候,默認似乎是到國外網站去下載,這樣如果遇到包比較大,而且網絡不好的情況下,下載會比較困難,所以可以用如下-i參數,指定下載第三方報道的源。
pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple virtualen
這里-i參數后https://pypi.tuna.tsinghua.edu.cn/simple指定的是清華源,而virtualen則是待下載的第三方包,這樣就能以比較快的方式下載並安裝第三方包。
在pycharm里確定解釋器
我在這塊搞了很久,后來我在培訓班里帶同學入門python時,發現初學者經常在這里犯錯誤。
我們知道,pycharm會自帶python解釋器。
但這個解釋器版本未必是我們預期的,所以我們還會再裝其它的解釋器。問題就在這里,安裝的第三方包是跟着解釋器的。
比如我們在pycharm自帶的3.8解釋器里安裝了若干第三方包,但如果切換到自己裝的3.9python解釋器里,這些第三方包就會全部變掉。
比如當我們切換解釋器后,發現第三方包全變了。
所以在安裝第三方包時,一定得注意,要到選中解釋器,比如3.9這個解釋器的目錄里,運行其中的pip3命令,這樣就能為特定的解釋器安裝包。
3 通過敲代碼熟悉語法
Python入門書其實都差不多,我當時用的是這本。入門書不用多,運行通一本書里的語法代碼即可。
Python的基本語法包括:分支循環,集合(列表字典元組等),面向對象(類和繼承等),文件讀寫和異常處理,這些語法點,運行通一遍,基本就能了解了,在開始學習階段,不用太多地深入。
如果你編程基礎自認為一般,就可以再找本書,比如這本。但基本語法不用多看,運行兩本書的代碼就足夠了。因為Python的重點在於數據分析、爬蟲和機器學習等要素。
4 學習數據分析三劍客組件
我的項目是用Python進行股票量化分析,不過我觀察了下,不管用Python做什么樣的應用,數據分析三劍客,比如Numpy,Pandas和Matplotlib這三個庫,一般都得掌握。
我當時看的是這本,其中包含了三劍客的語法和應用沒,一般看了一本,然后照着里面的代碼運行一遍的話,數據分析這塊,應該也能達到能干活的地步了。
5 學習Scrapy爬蟲框架
我的項目里沒包含爬蟲功能,但當時接了個私活,幫一個學校錄制python爬蟲視頻。所以我就用了2周時間,買了這本書,照着里面的案例跑了一遍,就知道Scrapy爬蟲的細節了。
學Scrapy框架的注意點如下。
- Scrapy第三方比較難搭建,需要事先裝其它的包,這里建議用python3.8和3.9解釋器的基礎上,搭建環境。
- 建議把包下載到本地,在本地裝。
但如果你真的搭建好Scrapy環境了,照着這本書上的做,基本上也不會遇到太大的問題。
6 以案例入門機器學習sklearn庫
機器學習方面,我當時看的是這本書,其中有機器學習,同時也有用sklearn庫做線性回歸和SVM分析的案例。
我的體會是:雖然機器學習的算法比較復雜,但基本都已經封裝在sklearn庫里了,也就是說,在python里只需要調用方法,傳入正確的參數,即可在項目里用到機器學習的算法。
7 以股票量化案例全面學習python數據分析
在之前的書里,有比較全面的整合機器學習和數據分析的案例,在其中也能綜合用到numpy+pandas+matplotlib+sklearn庫,不過我做的項目是和金融量化有關,所以我又買了這本書,用量化的案例來綜合學習數據分析。
8 歸納:我學python的心得體會
我自己感覺我學python的效率還算高,這里就來總結下我的學習心得。
- 學習一定要有目的,比如用python去找工作,項目里要用到python,或者用python去接私活,否則沒目的別學。
- 剛開始不建議通過視頻學,而是去買書學,因為書里的知識點比較系統,而且書里的代碼能確保可以運行。
- 一定別光看書,一定得邊運行代碼邊掌握技能。
照着上述方法,你一定能在一個月內熟悉python。
9 總結:我學python的成本和收益
金錢成本
我前后買書大概用400元
時間成本
一個月的晚上和周末,其它沒干就運行python,就能熟悉python語法+數據分析,外加一個月,就熟悉了機器學習相關語法。
收益:
工作里能干項目,掙到工資。
后來出了兩本書,稿酬大概是2萬5左右
能去講課,這塊掙錢到還行。
做了一個python爬蟲私活,掙了1萬多。
不過我感覺,由於python包含了深度學習等熱點,所以各位程序員還真應當先去找個目標,比如跳槽,然后去學下python。按照我本文給出的流程,應該也能很快學到能干活的程度。
請大家關注我的公眾號:一起進步,一起掙錢,在本公眾號里,會有很多精彩文章。