花費 12 ms
無所不能的Embedding2 - 詞向量三巨頭之FastText詳解

Fasttext是FaceBook開源的文本分類和詞向量訓練庫。最初看其他教程看的我十分迷惑,咋的一會ngram是字符一會ngram又變成了單詞,最后發現其實是兩個模型,一個是文本分類模型[Ref2] ...

Sat Sep 05 22:22:00 CST 2020 0 1173
無所不能的Embedding3 - word2vec->Doc2vec[PV-DM/PV-DBOW]

這一節我們來聊聊不定長的文本向量,這里我們暫不考慮有監督模型,也就是任務相關的句子表征,只看通用文本向量,根據文本長短有叫sentence2vec, paragraph2vec也有叫doc2vec的。 ...

Tue Oct 06 22:25:00 CST 2020 1 728
無所不能的Embedding4 - skip-thought & tf-Seq2Seq源碼解析

前一章Doc2Vec里提到,其實Doc2Vec只是通過加入Doc_id捕捉了文本的主題信息,並沒有真正考慮語序以及上下文語義,n-gram只能在局部解決這一問題,那么還有別的解決方案么?依舊是通用文本 ...

Sat Nov 21 05:46:00 CST 2020 0 432

 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM