python使用jieba庫實現關鍵詞提取的方法主要分為兩種:
第一種,使用extract_tags方法:
keywords = jieba.analyse.extract_tags(text, topK=5)
第二種,使用textrank方法:
keywords = jieba.analyse.textrank(text, topK=5)
其中text為與分析的文本,topK為輸出的關鍵詞數量
具體代碼如下:
import jieba.analyse def analyse(text, id): # kwords = jieba.analyse.extract_tags(text, topK=5) # print(kwords) keywords = jieba.analyse.textrank(text, topK=5) keys = '' for keyword in keywords: keys += keyword + ' ' try: updatekeyword(keys, id) print('更新成功',id,keys) except: print('更新失敗',id) if __name__ == '__main__': texts = selectintroduction()//該處我讀取的數據庫數據 for text in texts: try: analyse(text['introduction'],text['id']) except: print('Error!')