以下筆記是我在數據分析小組所整理分享的心得。相關背景是:我選擇中文詞頻統計案例作為考察大家python基礎功掌握程度。
通過《Python讀取文件內容為字符串的方法》,我們已經拿到那個很長的字符了。現在我們需要統計這個字符串中,有哪些字符,每個字符分別出現了多少次。
這里還要注意:不管你是為了Python就業還是興趣愛好,記住:項目開發經驗永遠是核心,如果你沒有2020最新python入門到高級實戰視頻教程,可以去小編的Python交流.裙 :七衣衣九七七巴而五(數字的諧音)轉換下可以找到了,里面很多新python教程項目,還可以跟老司機交流討教!
方法1:
這個方法相當簡單,掌握《自學是門手藝》第一章就能寫出來。零基礎自學編程,代碼寫成這樣能滿足需求,但它逐個逐個計數,比較笨拙。
rlt = {}
for i in content: if i in rlt.keys(): rlt[i] += 1 else: rlt[i] = 1 復制代碼
方法2:
利用 python 內置函數 count() 來統計每個字符出現的次數,同時通過if i not in rlt.keys():
確保每個字符只用統計一次。方法2比1要效率一些。
rlt = {}
for i in content: if i not in rlt.keys(): rlt[i] = content.count(i) 復制代碼
方法3:
數據分析自學小組成員 jeff 代碼是這么寫的:
rlt = {}
for i in content: rlt.setdefault(i,content.count(i)) 復制代碼
這里有一個大家之前沒看到過、或沒用過的方法 setdefault()
,你如果去搜python setdefault()
拿到它的說明,會發現它一定程度上相當於封裝了方法2。
Python 字典 setdefault() 函數和 get()方法 類似, 如果鍵不存在於字典中,將會添加鍵並將值設為默認值。
小結
這里分享一個小常識是,編程世界里,一門編程語言會自帶很多封裝好、高效、好用的函數、類、庫等等,你根據自己需求去搜,就會找到它們。是的,方法幾乎總是非常多的。
作為零基礎自學編程的人,你剛起步,你可以不知道 setdefault()
但你所掌握的基礎功,足夠讓你能寫出方法 1 或者 2。
現在你可能會心急,怎么自己這個不知道,哪個也沒聽說過?——沒關系的,你只要掌握:會拆解、勤搜索、多使用。使用也分兩層,既可以自己多敲代碼,也應該多讀別人的代碼,琢磨同一個需求的不同實現方法,整理成類似這種筆記,然后點滴積累你的牛逼。
最后注意:不管你是為了Python就業還是興趣愛好,記住:項目開發經驗永遠是核心,如果你沒有2020最新python入門到高級實戰視頻教程,可以去小編的Python交流.裙 :七衣衣九七七巴而五(數字的諧音)轉換下可以找到了,里面很多新python教程項目,還可以跟老司機交流討教!
本文的文字及圖片來源於網絡加上自己的想法,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯系我們以作處理。