【文章推荐】IKAnalyzer 源码走读

原文：IKAnalyzer 源码走读

首先摘抄一段关于IK的特性介绍：采用了特有的正向迭代最细粒度切分算法，具有万字秒的高速处理能力。采用了多子处理器分析模式，支持：英文字母 IP地址 Email URL 数字日期，常用中文数量词，罗马数字，科学计数法，中文词汇姓名地名处理等分词处理。优化的词典存储，更小的内存占用。支持用户词典扩展定义。针对Lucene全文检索优化的查询分析器IKQueryParser，采用 ...

2013-08-26 10:13 1 3399 推荐指数：

查看详情

pytest源码走读-开始

1、走读目的主要目的是学习源码走读的过程，之后可以走读自己喜欢的任意代码。稍次要的目的是学习pytest框架。毕竟，在上一份工作中，一直用这个框架，也尝试走读了，希望以后面试会更加明白这个框架。 2、走读时间20210226 3、走读模式。随意点开看看，找个入口 ...

kcp源码走读

kcp协议与tcp协议类似，是一种ARQ协议。他的优点在于比tcp的延迟更小30%-40%，但相应的会牺牲一部分的带宽，大该比tcp多浪费10%~20%。tcp的设计目标是增大网络利用率，而kcp的设 ...

Canal 源码走读

前言 canal 是什么？引用一下官方回答：阿里巴巴mysql数据库binlog的增量订阅&消费组件 canal 能做什么？基于日志增量订阅&消费支持的业务： ...

Apache Spark源码走读之9 -- Spark源码编译

欢迎转载，转载请注明出处，徽沪一郎。概要本来源码编译没有什么可说的，对于java项目来说，只要会点maven或ant的简单命令，依葫芦画瓢，一下子就ok了。但到了Spark上面，事情似乎不这么简单，按照spark officical document上的来做，总会出现这样或那样的编译 ...

Apache Spark源码走读之8 -- Spark on Yarn

欢迎转载，转载请注明出处，徽沪一郎。概要 Hadoop2中的Yarn是一个分布式计算资源的管理平台，由于其有极好的模型抽象，非常有可能成为分布式计算资源管理的事实标准。其主要职责将是分布式计算集 ...

【Atheros】minstrel速率调整算法源码走读

先说几个辅助的宏，因为内核不支持浮点运算，当然还有实现需要，minstrel对很多浮点值做了缩放： MINSTREL_SCALE是一个放大的倍数，minstrel设定的是16，缩放16 ...

【Atheros】Ath9k速率调整算法源码走读

上一篇文章介绍了驱动中minstrel_ht速率调整算法，atheros中提供了可选的的两种速率调整算法，分别是ath9k和minstrel，这两个算法分别位于：无论从理论分析还是实 ...

Apache Spark源码走读之4 -- DStream实时流数据处理

欢迎转载，转载请注明出处，徽沪一郎。 Spark Streaming能够对流数据进行近乎实时的速度进行数据处理。采用了不同于一般的流式数据处理模型，该模型使得Spark Streaming有非常高的 ...

原文：IKAnalyzer 源码走读

相关推荐

相关标签