原文:用中文把玩Google开源的Deep-Learning项目word2vec

google最近新开放出word vec项目,该项目使用deep learning技术将term表示为向量,由此计算term之间的相似度,对term聚类等,该项目也支持phrase的自动识别,以及与term等同的计算。 word vec项目首页:https: code.google.com p word vec ,文档比较详尽,很容易上手。可能对于不同的系统和gcc版本,需要稍微改一下代码和mak ...

2013-08-31 22:14 3 21219 推荐指数:

查看详情

利用中文数据跑Google开源项目word2vec

word2vec注释 1、多线程并行处理: 1、分配内存空间,创建多线程,执行多线程。malloc,pthread_create,pthread_join 2、每个多线程处理的训练文档根据线程id,分配不同的文档内容,由fseek定位 ...

Fri May 12 00:10:00 CST 2017 0 4005
利用中文数据跑Google开源项目word2vec

一直听说word2vec在处理词与词的相似度的问题上效果十分好,最近自己也上手跑了跑Google开源的代码(https://code.google.com/p/word2vec/)。 1、语料 首先准备数据:采用网上博客上推荐的全网新闻数据(SogouCA),大小为2.1G ...

Tue Jan 07 23:35:00 CST 2014 16 27775
Word2Vec中文的应用

  google最近新开放出word2vec项目,该项目使用deep-learning技术将term表示为向量,由此计算term之间的相似度,对term聚类等,该项目也支持phrase的自动识别,以及与term等同的计算。   word2vecword to vector)顾名思义,这是一个 ...

Fri Oct 25 06:57:00 CST 2013 4 7247
Deep Learning基础--word2vec 中的数学原理详解

word2vecGoogle 于 2013 年开源推出的一个用于获取 word vector 的工具包,它简单、高效,因此引起了很多人的关注。由于 word2vec 的作者 Tomas Mikolov 在两篇相关的论文 [3,4] 中并没有谈及太多算法细节,因而在一定程度上增加了 ...

Thu Nov 09 18:44:00 CST 2017 0 1637
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM