python—沉默的羔羊之最多单词

本文转载自查看原文 2020-05-14 16:14 1708 python

沉默的羔羊下载地址

链接：https://pan.baidu.com/s/14EzwV-Mn5_A27aSVy-XYIw
提取码：k272

描述

附件是《沉默的羔羊》中文版内容，请读入内容，分词后输出长度大于2且最多的单词。‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬

如果存在多个单词出现频率一致，请输出按照Unicode排序后最大的单词。‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬

输入格式

文件‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬

输出格式

字符串

#第一种方法
import jieba
txt = open("沉默的羔羊.txt",encoding="utf-8").read()
words = jieba.lcut(txt)
counts = {}
for word in words:
    if len(word) <2:    #判断小于2个字的直接跳过
        continue
    else:               #大于2个字的进行计算出现次数
        counts[word]= counts.get(word,0)+1
items = list(counts.items())   #items提取键和值 转换列表类型
items.sort(key=lambda x:x[1],reverse=True )  #进行出现次数排序

print(items)
print(items[0])
print(items[0][0])
print(type(items[0][0]))

#第二种方法 参考别人的，也是一种思路
总体思路就是把出现的次数进行依次判断，每出现一个比
上一个数大，就保存，遍历完得出一个最大的出现次数(maxc)

import jieba
f = open("沉默的羔羊.txt",encoding="utf-8")
words = jieba.lcut(f.read())
counts = {}
for word in words:
    counts[word] = counts.get(word, 0) + 1
maxc = 0          #定义一个起始出现数
maxw = ""
for k in counts:
    # 每当拿到一个词时k 就取对应的value值 进行和maxc对比，
    # 当两个条件都成立时，修改maxc的值(也就是出现次数)，全部遍历完，maxc就是最大数
    if counts[k] > maxc and len(k) > 2:
        maxc = counts[k]    #通过key取value值，
        maxw = k            #通过遍历得到的key
    # if counts[k] == maxc and len(k) > 2 :
    if counts[k] == maxc and len(k) > 2 and k > maxw:
        maxw = k
print(maxw)

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 【shell脚本实例】shell脚本统计单词频率、出现次数最多的n个单词 Python 常用单词 python实现单词本功能 python背单词 python简单词频统计 java语言找出文章中出现次数最多的单词用C语言实现了对英文文章中单词频率的统计，得到出现最多的前十个！ Python 统计文本中单词的个数 python制作查找单词翻译的脚本利用python检测单词的相似度