python庫--flashtext--大規模數據清洗利器


 

flashtext.keyword (flashtext)
類/方法 返回值 參數 說明
.KeywordProcessor() 對象kp case_sensitive=False 是否區分大小寫
添加關鍵詞      
kp.add_keyword()   keyword 檢索的詞
clean_name=None 顯示或要被替換為的詞(默認keywords本身)
kp.add_keywords_from_dict()   keyword_dict key: 類似於clean_name
value: 類似於[keyword]
kp.add_keywords_from_list()   keyword_list 類似於[keyword]
刪除關鍵詞      
kp.remove_keywords()   keywoed 要刪除的keyword
kp.remove_..._from_dict()   keyword_dict 參考添加
kp.remove_..._from_list()   keyword_list 參考添加
設置單詞邊界      
kp.add_non_word_boundary()   character 添加非單詞邊界的字符, 比如添加'/', 那么此字符將不會被識別為單詞邊界
關鍵字提取      
kp.extract_keywords() list 關鍵字提取
sentence 要被檢索的字符串, 匹配到則返回clean_name
span_info=False 是否返回關鍵字位置信息
       
關鍵字替換      
kp.replace_keywords() str 關鍵字替換
sentence 要被替換的字符串, 把keywords替換為clean_name
       


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM