python—沉默的羔羊之最多单词


沉默的羔羊 下载地址

链接:https://pan.baidu.com/s/14EzwV-Mn5_A27aSVy-XYIw
提取码:k272

 

描述

附件是《沉默的羔羊》中文版内容,请读入内容,分词后输出长度大于2且最多的单词。‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬

如果存在多个单词出现频率一致,请输出按照Unicode排序后最大的单词。‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬

输入格式

文件‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬

输出格式

字符串

#第一种方法
import jieba txt = open("沉默的羔羊.txt",encoding="utf-8").read() words = jieba.lcut(txt) counts = {} for word in words: if len(word) <2: #判断小于2个字的直接跳过 continue else: #大于2个字的进行计算出现次数 counts[word]= counts.get(word,0)+1 items = list(counts.items()) #items提取键和值 转换列表类型 items.sort(key=lambda x:x[1],reverse=True ) #进行出现次数排序
print(items)
print(items[0])
print(items[0][0])
print(type(items[0][0]))

  

 

 

#第二种方法 参考别人的,也是一种思路
总体思路就是把出现的次数进行依次判断,每出现一个比
上一个数大,就保存,遍历完得出一个最大的出现次数(maxc)
import jieba
f = open("沉默的羔羊.txt",encoding="utf-8")
words = jieba.lcut(f.read())
counts = {}
for word in words:
counts[word] = counts.get(word, 0) + 1
maxc = 0 #定义一个起始出现数
maxw = ""
for k in counts:
# 每当拿到一个词时k 就取对应的value值 进行和maxc对比,
# 当两个条件都成立时,修改maxc的值(也就是出现次数),全部遍历完,maxc就是最大数
if counts[k] > maxc and len(k) > 2:
maxc = counts[k] #通过key取value值,
maxw = k #通过遍历得到的key
# if counts[k] == maxc and len(k) > 2 :
if counts[k] == maxc and len(k) > 2 and k > maxw:
maxw = k
print(maxw)

  

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM