【Python】哈姆雷特字數統計


def getText():  #賦予txt哈姆雷特小說-全英文小寫-全符號變空格-返回txt
txt = open('C:/Users/eternal/Desktop/hamlet.txt','r').read()  #路徑要選好
txt = txt.lower()
for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_`{|}~':
txt = txt.replace(ch," ")
return txt
hamletTxt = getText()
words = hamletTxt.split()  #以空字符做列表返回
counts = {}
for word in words:
counts[word] = counts.get(word,0) + 1    #get不到word就創建word為下標的值0+1,如果get到了就在word的值上加1,然后更新字典
items = list(counts.items())            #字典的鍵值對變成列表
items.sort(key=lambda x:x[1],reverse=True)    #以出現次數為標准排列,從大到小
print(items)
for i in range(10):
word,count = items[i]
print('{0:<10}{1:>5}'.format(word,count))


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM