NLP Github


作者:cstghitpku
鏈接:https://zhuanlan.zhihu.com/p/51279338
來源:知乎
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。

1.分詞 Word Segmentation

chqiwang/convseg ,基於CNN做中文分詞,提供數據和代碼。

對應的論文Convolutional Neural Network with Word Embeddings for Chinese Word Segmentation IJCNLP2017.

 

2.詞預測 Word Prediction

Kyubyong/word_prediction ,基於CNN做詞預測,提供數據和代碼。

 

3. 文本蘊涵 Textual Entailment

Steven-Hewitt/Entailment-with-Tensorflow,基於Tensorflow做文本蘊涵,提供數據和代碼。

 

4. 語音識別 Automatic Speech Recognition

buriburisuri/speech-to-text-wavenet,基於DeepMind WaveNet和Tensorflow做句子級語音識5. 自動摘要 Automatic Summarisation

PKULCWM/PKUSUMSUM,北大萬小軍老師團隊的自動摘要方法匯總,包含了他們大量paper的實現,支持單文檔摘要、多文檔摘要、topic-focused多文檔摘要。

 

6. 文本糾錯 Text Correct

atpaino/deep-text-corrector,基於深度學習做文本糾錯,提供數據和代碼。

 

7.字音轉換 Grapheme to Phoneme

cmusphinx/g2p-seq2seq,基於網紅transformer做, 提供數據和代碼。

 

8. 復述檢測 Paraphrase Detection 和 問答 Question Answering

Paraphrase-Driven Learning for Open Question Answering, 基於復述驅動學習的開放域問答。

 

9. 音漢互譯 Pinyin-To-Chinese

Kyubyong/neural_chinese_transliterator,基於CNN做音漢互譯。

 

10. 情感分析 Sentiment Analysis

情感分析包括的內容太多了,目前沒發現比較全的。推薦兩個適合練手的吧:Deeply Moving: Deep Learning for Sentiment Analysis

 

11. 手語識別 Sign Language Recognition

Home - SignAll, 該項目在手語識別做的非常成熟。

 

12. 詞性標注(POS)、 命名實體識別(NER)、 句法分析(parser)、 語義角色標注(SRL) 等。

HIT-SCIR/ltp, 包括代碼、模型、數據,還有詳細的文檔,而且效果還很好。

 

13. 詞干 Word Stemming

snowballstem/snowball, 實現的詞干效果還不錯。

 

14. 語言識別 Language Identification

,語言識別比較好的開源工具。

 

15. 機器翻譯 Machine Translation

OpenNMT/OpenNMT-py, 基於PyTorch的神經機器翻譯,很適合練手。

 

16. 復述生成 Paraphrase Generation

vsuthichai/paraphraser,基於Tensorflow的句子級復述生成,適合練手。

 

17. 關系抽取 Relationship Extraction

ankitp94/relationship-extraction,基於核方法的關系抽取。

 

18. 句子邊界消歧 Sentence Boundary Disambiguation

,很有意思。

 

19.事件抽取 Event Extraction

liuhuanyong/ComplexEventExtraction, 中文復合事件抽取,包括條件事件、因果事件、順承事件、反轉事件等事件抽取,並形成事理圖譜。

 

20. 詞義消歧 Word Sense Disambiguation

alvations/pywsd,代碼不多,方法簡單,適合練手。

 

21. 命名實體消歧 Named Entity Disambiguation

dice-group/AGDISTIS,實體消歧是很重要的,尤其對於實體融合(比如知識圖譜中多源數據融合)、實體鏈接。

 

22. 幽默檢測 Humor Detection

pln-fing-udelar/pghumor

 

23. 諷刺檢測 Sarcasm Detection

AniSkywalker/SarcasmDetection,基於神經網絡的諷刺檢測。

 

24. 實體鏈接 Entity Linking

hasibi/EntityLinkingRetrieval-ELR, 實體鏈接用途非常廣,非常適合練手。

 

25. 指代消歧 Coreference Resolution

huggingface/neuralcoref,基於神經網絡的指代消歧。

 

26. 關鍵詞/短語抽取和社會標簽推薦 Keyphrase Extraction and Social Tag Suggestion

thunlp/THUTag, 用多種方法 實現了多種關鍵詞/短語抽取和社會標簽推薦。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM