原文:HanLP笔记 - 篇章理解

.关键词提取 HanLP.extractKeyword Stringcontent, int num 第一个参数文本内容,第二个参数提取关键词个数 .自动摘要 HanLP.extractSummary Stringcontent,int num 第一个参数文本内容,第二个参数提取句子个数 .短语提取 HanLP.extractPhrase Stringcontent,int num 第一个参数文 ...

2018-06-21 23:22 0 795 推荐指数:

查看详情

HanLP笔记 - 命名实体识别

HanLP这五个,基于HMM角色标注的命名实体识别 (速度快) 另外有基于线性模型的命名实体识别(精度高): ...

Fri Jun 22 07:13:00 CST 2018 0 1865
HanLP笔记 - 依存句法分析

1. 最大熵依存句法分析器 2. CRF依存句法分析器 3. 输出格式   3.1 输出为CoNLL格式 ...

Sat Jun 23 08:13:00 CST 2018 0 2036
HanLP笔记 - 配置分词器

所有分词器都是 Segment 的子类, Segment 提供以下配置接口: 用户可以使用链式语法对Segment执行创建和配置操作,一气呵成: ...

Fri Jun 22 07:14:00 CST 2018 0 822
你真的深入理解计算机系统了吗之篇章三:程序的结构

  计算机中的信息=位+上下文。进一步,信息可以分为两大类:一类是数据,一类是指令。指令用来表明操作的动作,数据用来表明被操作的对象,这两者同时也构成了一个完整的程序。   对于数据而言,我们先来谈 ...

Thu Jan 15 20:54:00 CST 2015 6 3696
java学习笔记--1_常见输入输出语句熟悉篇章

今天上oj,想来是准备做做算法和数据结构的。看了看以前做的基础题目,想着就先熟悉一下java的语言吧! 以下是今天做的10道题目。 备注:oj有时候对格式要求非常严格,因为不在格式上纠结太久,只要 ...

Sat May 23 23:43:00 CST 2015 0 4296
HanLP《自然语言处理入门》笔记--2.词典分词

笔记转载于GitHub项目:https://github.com/NLP-LOVE/Introduction-NLP 2. 词典分词 中文分词:指的是将一段文本拆分为一系列单词的过程,这些单词顺序拼接后等于原文本。 中文分词算法大致分为基于词典规则与基于机器学习这两大派 ...

Wed Feb 05 21:57:00 CST 2020 0 1256
HanLP《自然语言处理入门》笔记--5.感知机模型与序列标注

笔记转载于GitHub项目:https://github.com/NLP-LOVE/Introduction-NLP 5. 感知机分类与序列标注 第4章我们利用隐马尔可夫模型实现了第一个基于序列标注的中文分词器,然而效果并不理想。事实上,隐马尔可夫模型假设人们说的话仅仅取决于一个隐藏的{B.M ...

Sun Feb 09 20:51:00 CST 2020 0 907
HanLP《自然语言处理入门》笔记--1.新手上路

1. 新手上路 自然语言处理(Natural Language Processing,NLP)是一门融合了计算机科学、人工智能及语言学的交叉学科,它们的关系如下图所示。这门学科研究的是如何通过机器学习等技术,让计算机学会处理人类语言,乃至实现终极目标--理解人类语言或人工智能。 美国 ...

Wed Feb 05 05:42:00 CST 2020 0 1665
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM