原文:Distributed Representations of Words and Phrases and their Compositionality论文阅读及实战

本文讲解 skip gram 模型以及优化和扩展。主要包括层次 Softmax 负采样 学习短语的表示。 先提一下词向量: 词向量 也叫词嵌入,word embedding ,简单地说就是用一个低维向量表示一个词。由于独热编码 one hot encoding 存在维度灾难,即稀疏性,且无法理解词与词之间的内在联系,词向量的出现就可解决这些问题,大大简化了操作。 特点: 维度大小是固定值 维度值是 ...

2020-04-30 20:14 0 986 推荐指数:

查看详情

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM