花费 18 ms
无所不能的Embedding2 - 词向量三巨头之FastText详解

Fasttext是FaceBook开源的文本分类和词向量训练库。最初看其他教程看的我十分迷惑,咋的一会ngram是字符一会ngram又变成了单词,最后发现其实是两个模型,一个是文本分类模型[Ref2] ...

Sat Sep 05 22:22:00 CST 2020 0 1173
无所不能的Embedding3 - word2vec->Doc2vec[PV-DM/PV-DBOW]

这一节我们来聊聊不定长的文本向量,这里我们暂不考虑有监督模型,也就是任务相关的句子表征,只看通用文本向量,根据文本长短有叫sentence2vec, paragraph2vec也有叫doc2vec的。 ...

Tue Oct 06 22:25:00 CST 2020 1 728
无所不能的Embedding4 - skip-thought & tf-Seq2Seq源码解析

前一章Doc2Vec里提到,其实Doc2Vec只是通过加入Doc_id捕捉了文本的主题信息,并没有真正考虑语序以及上下文语义,n-gram只能在局部解决这一问题,那么还有别的解决方案么?依旧是通用文本 ...

Sat Nov 21 05:46:00 CST 2020 0 432

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM