Python統計長字符串中字符頻次【入門必學】


以下筆記是我在數據分析小組所整理分享的心得。相關背景是:我選擇中文詞頻統計案例作為考察大家python基礎功掌握程度。

通過《Python讀取文件內容為字符串的方法》,我們已經拿到那個很長的字符了。現在我們需要統計這個字符串中,有哪些字符,每個字符分別出現了多少次。

這里還要注意:不管你是為了Python就業還是興趣愛好,記住:項目開發經驗永遠是核心,如果你沒有2020最新python入門到高級實戰視頻教程,可以去小編的Python交流.裙 :七衣衣九七七巴而五(數字的諧音)轉換下可以找到了,里面很多新python教程項目,還可以跟老司機交流討教!

方法1:

這個方法相當簡單,掌握《自學是門手藝》第一章就能寫出來。零基礎自學編程,代碼寫成這樣能滿足需求,但它逐個逐個計數,比較笨拙。


rlt = {}
for i in content: if i in rlt.keys(): rlt[i] += 1 else: rlt[i] = 1 復制代碼

方法2:

利用 python 內置函數 count() 來統計每個字符出現的次數,同時通過if i not in rlt.keys():確保每個字符只用統計一次。方法2比1要效率一些。


rlt = {}
for i in content: if i not in rlt.keys(): rlt[i] = content.count(i) 復制代碼

方法3:

數據分析自學小組成員 jeff 代碼是這么寫的:


rlt = {}
for i in content: rlt.setdefault(i,content.count(i)) 復制代碼

這里有一個大家之前沒看到過、或沒用過的方法 setdefault(),你如果去搜python setdefault()拿到它的說明,會發現它一定程度上相當於封裝了方法2。

Python 字典 setdefault() 函數和 get()方法 類似, 如果鍵不存在於字典中,將會添加鍵並將值設為默認值。

小結

這里分享一個小常識是,編程世界里,一門編程語言會自帶很多封裝好、高效、好用的函數、類、庫等等,你根據自己需求去搜,就會找到它們。是的,方法幾乎總是非常多的。

作為零基礎自學編程的人,你剛起步,你可以不知道 setdefault() 但你所掌握的基礎功,足夠讓你能寫出方法 1 或者 2。

現在你可能會心急,怎么自己這個不知道,哪個也沒聽說過?——沒關系的,你只要掌握:會拆解、勤搜索、多使用。使用也分兩層,既可以自己多敲代碼,也應該多讀別人的代碼,琢磨同一個需求的不同實現方法,整理成類似這種筆記,然后點滴積累你的牛逼。
最后注意:不管你是為了Python就業還是興趣愛好,記住:項目開發經驗永遠是核心,如果你沒有2020最新python入門到高級實戰視頻教程,可以去小編的Python交流.裙 :七衣衣九七七巴而五(數字的諧音)轉換下可以找到了,里面很多新python教程項目,還可以跟老司機交流討教!

本文的文字及圖片來源於網絡加上自己的想法,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯系我們以作處理。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM