python數據分析高頻詞提取，pyecharts詞雲制作並保存

本文轉載自查看原文 2020-06-11 10:40 2731 python腳本學習/ python腳本

import pandas as pd
import jieba
import jieba.analyse

filename = "E:\\數據處理\\隱患類型.txt"
#載入數據
df_data = pd.read_csv(filename, header=0, encoding='gbk', dtype=str)#DataFrame

#去重並轉換為list
ls_data = df_data.drop_duplicates().values.tolist()#df_data.values為array類型
ls_data = ";".join([str(j) for i in ls_data for j in i])#將列表元素轉換為一個字符串，供lcut函數使用

print(ls_data)

seg_list = jieba.lcut(ls_data, cut_all=False, HMM=True) # 精確切割模式(默認為精確模式)
seg = '/'.join(seg_list)#str類型

#關鍵詞抽取
tags = jieba.analyse.extract_tags(seg, topK=300, withWeight=True, allowPOS=('ns', 'n', 'vn', 'v'),)

import pyecharts.options as opts
from pyecharts.charts import WordCloud

def wordcloud():
    g = WordCloud()
    g.add(series_name="熱點分析", data_pair=tags, word_size_range=[6, 66])
    g.set_global_opts(
        title_opts=opts.TitleOpts(
            title="高頻詞條", title_textstyle_opts=opts.TextStyleOpts(font_size=23)
        ),
        tooltip_opts=opts.TooltipOpts(is_show=True),
    )
    #.render("basic_wordcloud.html")
    return g

# 使用snapshot-selenium渲染成圖片
from snapshot_selenium import snapshot
from pyecharts.render import make_snapshot

make_snapshot(snapshot, wordcloud().render(), "E:\\數據處理\\詞雲圖2.png")# 保存為圖片

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 NLP（二）：jieba高頻詞提取 seo與python大數據結合給文本分詞並提取高頻詞如何從大量數據中找出高頻詞 Python 爬取熱詞並進行分類數據分析-[雲圖制作+數據導入] 如何從大量數據中找出高頻詞數據分析——pyecharts Python 爬取熱詞並進行分類數據分析-[解釋修復+熱詞引用] Python 爬取熱詞並進行分類數據分析-[熱詞關系圖+報告生成] Python 爬取熱詞並進行分類數據分析-[熱詞分類+目錄生成] python 數據分析--詞雲圖，圖形可視化美國競選辯論