【分詞與詞向量】
主要是 jieba 和 gensim.models.word2vec 使用
參數數據源:http://mattmahoney.net/dc/text8.zip
【自然語言處理】
【NLP之算法】:PayPal高級工程總監的100篇論文(附下載)
【NLP之算法】:驀然回首之學習模型的評估系列文章(1-4)
【NLP之算法】:揭秘馬爾可夫模型神秘面紗系列文章(1-5)
NLP中的預訓練語言模型(一)—— ERNIE們和BERT-wwm
NLP中的預訓練語言模型(二)—— Facebook的SpanBERT和RoBERTa
NLP中的預訓練語言模型(三)—— XL-Net和Transformer-XL
NLP中的預訓練語言模型(四)—— 小型化bert(DistillBert, ALBERT, TINYBERT)
NLP之文本挖掘:Python NLTK處理系列文章(1-5)
【文本分類實戰】
【文本處理】自然語言處理在現實生活中運用
【文本處理】多種貝葉斯模型構建及文本分類的實現
【文本處理】快速了解什么是自然語言處理
【文本處理】領域本體構建方法概述
【文本處理】OpenNLP:駕馭文本,分詞那些事
【文本處理】【NLP】Tika 文本預處理:抽取各種格式文件內容
【文本處理】自己動手搭建搜索工具
文本分類實戰(五)—— Bi-LSTM + Attention模型