教你閱讀Python開源項目代碼


為什么要閱讀開源代碼

閱讀 Python 開源項目代碼主要有如下三個原因:

  • 在工作過程中遇到一些問題 Google 和 StackOverFlow 等網站找不到解決辦法,只能去翻源碼。
  • 對某些項目或者方向非常感興趣,希望深入。
  • 學習遇到瓶頸需要汲取開源項目的經驗和用法來做提高。
    注意:很多人學Python過程中會遇到各種煩惱問題沒有人幫答疑。為此小編建了個Python全棧免費答疑交流.裙 :一久武其而而流一思(數字的諧音)轉換下可以找到了,不懂的問題有老司機解決里面還有最新Python教程項目可拿,,一起相互監督共同進步!

要有目的的閱讀開源項目

沒有目的的閱讀開源項目就是耍流氓,浪費了時間,但是能學到的東西也很少。怎么樣根據自身情況去閱讀呢?

  1. 和興趣以及工作契合。舉個例子,工作中沒有機會用到 Celery 又不是想自己造個輪子,讀它的源碼做什么?所以要從平時能接觸到的那些項目中選取。有時候不去看 Django 的代碼,因為日常工作基本遇不到,遇到了現翻就好了。
  2. 一個方向只看一兩個典型的就可以了。比如 Web 框架只看過 Bottle 和 Flask 的源碼。
  3. 清楚自己看代碼的目的。就是你看代碼是想了解人家怎么設計、調試 BUG、還是只是想學習正確的編程用法呢?其實沒有必要細摳每個代碼細節,有時候當黑盒看,知道輸入輸出就可以了。

優秀的開源作者

和工作中看別人代碼差不多,基本每個人、每個項目、每個團隊都有自己寫代碼的風格,比如變量命名風格、某些語言特性使用方式、代碼規范要求、目錄風格等,其實開源項目的作者也是一樣。看代碼,如看人「團隊」

  • kennethreitz Requests 和 Python-guide 作者。他還有一個非常勵志的故事,有興趣的可以看 誰說程序員不是潛力股?
  • mitsuhiko flask、Jinja2、werkzeug 和 flask-sqlalchemy 作者。
  • sigmavirus24 flake8、pycodestyle「原 pep 8」、requests、urllib3 等項目的主要貢獻者和維護者。
  • ask Celery 及相關依賴的作者。
  • ajdavis mongo-python-driver「pymongo」、tornado 等項目的主要貢獻者。
  • bitprophet fabric、paramiko「Python 的 ssh 庫」作者。

前 2 個是公認的 Python 領域代碼寫的最好的、最有創意的工程師。

初學者推薦閱讀項目

初學者可以先閱讀一些代碼量比較少的,最好是單文件的項目:

看代碼主要是了解別人寫代碼的方式,語法實踐這些內容。看完之后,你可以針對這些項目能解決的問題自己寫個項目,寫完之后和上述項目去對比一下,看看哪些方面做的不好。

進階閱讀項目

進階的時候就要閱讀一些相對復雜的項目,它們能幫助你提升 Python 編程技巧:

  • faif/python-patterns 使用 Python 實現一些設計模式的例子。
  • pallets/werkzeug flask 的 WSGI 工具集。其中包含了實現非常好的 LocalProxy、cached_property、import_string、find_modules、TypeConversionDict 等。
  • bottlepy/bottle 閱讀一個 Web 框架對 Web 開發就會有更深刻的理解,flask 太大,bottle 就 4k 多行,當然如果你有毅力和興趣直接看 flask 是最好了的。
  • msiemens/tinydb 了解用 Python 實現數據庫。
  • coleifer/peewee 了解 ORM 的實現。
  • pallets/click click 已經內置於在 flask 0.11 里,提供命令行功能,值得閱讀。
  • mitsuhiko/flask-sqlalchemy 了解一個 flask 插件是怎么實現的。

除此之外 Web 開發者可以閱讀一些相關的項目:

500 Lines

推薦一個非常厲害的項目 GitHub - aosabook/500lines: 500 Lines or Less, 它里面包含了 22 個由該領域的專家完成,用不到 500 行的代碼實現一個特定功能的子項目。連 Guido van Rossum 都親自來寫基於 asyncio 爬蟲了,Nick Coghlan、ajdavis 也出場了。更具體的介紹可以看 Python 的練手項目有哪些值得推薦? - 小小搬運工的回答

建議

不要畏懼

大家都經常會感嘆 XXX 強大,YYY 流行,無形中你會把它放在一個不可觸及到的地位,感覺它很難,而令自己不敢去挑戰它。其實是人就會產出 bug,假如你發現它有問題,就應該抓住機會去驗證它。這個過程中,它的神秘感也就消失了,有過這么幾次經驗你就有信心了。其次是不要怕你提交的 PR 被拒絕。這是非常正常的,我有很多 PR 是被拒絕的,尤其是給標准庫提交的 Patch,絕大多數都被拒絕了。

帶着問題去閱讀代碼

這也是我認為最有效的方式。這會讓你在閱讀時候有個主線,比較有針對性。

斷點調試

在 Python 代碼中使用 pdb 一般不太好使,因為代碼復雜的話,這種斷點需要你使用多個 N 跳到對應的位置,我一般都是先拋出異常,然后使用 pdb 的 up、down、n 等命令調試。當然在目標位置添加一些 print 日志或注釋部分代碼然后直接使用 exit() 退出也是可以的。

善用文檔

閱讀一個項目一開始會有點無從下手,那么就先好好這些內容,它們一般都是作者表達這個項目的第一個入口。quickstart、tutorial 等內容中的最小化的例子其實就是最好的閱讀入口,先去看這些引用的模塊和調用的對應方法或者函數的對應實現,從下至上去閱讀。

理解作者的思考方式

不同的項目要有不同的思考方式來閱讀,不要擰着自己的習慣去閱讀,這樣會很累,得嘗試接受別人的觀點,甚至於改變自己。

閱讀項目的早期版本

一些項目隨着時間演進已經非常復雜了,讀起來有難度,那么你可以回到項目的早期版本上,先去看相對簡單地版本,然后設置幾個時間點或者版本節點,漸進的來閱讀。

記憶並繪制項目架構

項目就是一堆代碼的組合,除了學習編程技巧,還要了解項目的架構決策,這對於未來自己寫大型項目非常用用。這種理解越補充,你會對它就越來越清晰。
總結:很多人學Python過程中會遇到各種煩惱問題沒有人幫答疑。為此小編建了個Python全棧免費答疑交流.裙 :一久武其而而流一思(數字的諧音)轉換下可以找到了,不懂的問題有老司機解決里面還有最新Python教程項目可拿,,一起相互監督共同進步!
本文的文字及圖片來源於網絡加上自己的想法,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯系我們以作處理。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM