花费 6 ms
TFIDF介绍

任务一:现在有一篇长文《中国的蜜蜂养殖》,用计算机提取它的关键词。 1、词频:如果某个词很重要,它应该在这篇文章中多次出现。我们进行"词频"(Term Frequency,缩写为TF)统计。 2、 ...

Wed Oct 19 18:22:00 CST 2016 0 24288
《2018自然语言处理研究报告》整理(附报告)

这篇文章是阅读AMiner《2018自然语言处理研究报告》前几篇内容整理所得。 一. 自然语言处理概述 自然语言处理就是要计算机理解自然语言,计算机要理解自然语言文本的意义,最后能以自然 ...

Sun Jan 12 07:34:00 CST 2020 0 1776
形式语言与自动机

学习资料:《统计自然语言处理》第三章 一. 语言的描述 乔姆斯基将语言定义为:“按照一定规律构成的句子和符号串的有限或无限集合。” 我国计算语言学家吴蔚天也给出了自己对语言的定义:“语 ...

Sat Apr 11 06:55:00 CST 2020 0 1087
特征选择与特征抽取的区别(总结)

本篇博客的目的不是深刻的讲解特征提取和特征选择的方法,而是区分清楚他们之间的关系和区别,让大家对特征抽取 特征选择 PCA LDA有个概念框架上的了解,为大家的下一步的深入理解打好基础。 如 ...

Sun Aug 09 00:33:00 CST 2015 0 2854
NLP中的预训练技术

关于NLP领域内预训练的一些知识。记得很杂乱,主要用于个人理解,精华内容在学习资料。 一. 学习资料 从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史 n ...

Sat Apr 11 23:32:00 CST 2020 0 894
Attention和Transformer

学习资料中关于Attention机制和Transformer的总结 一. 学习资料 深度学习中的注意力模型 BERT大火却不懂Transformer?读这一篇就够了 李宏毅讲解Tra ...

Sat Apr 11 23:38:00 CST 2020 0 604
感知哈希算法的java实现

一、原理讲解 实现这种功能的关键技术叫做"感知哈希算法"(Perceptual Hash Algorithm), 意思是为图片生成一个指纹(字符串格式), 两张图片的指纹越相似, 说明两张图 ...

Mon Jul 20 05:30:00 CST 2015 1 1669

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM