原文:IKAnalyzer 源码走读

首先摘抄一段关于IK的特性介绍: 采用了特有的 正向迭代最细粒度切分算法 ,具有 万字 秒的高速处理能力。 采用了多子处理器分析模式,支持:英文字母 IP地址 Email URL 数字 日期,常用中文数量词,罗马数字,科学计数法 ,中文词汇 姓名 地名处理 等分词处理。 优化的词典存储,更小的内存占用。支持用户词典扩展定义。 针对Lucene全文检索优化的查询分析器IKQueryParser,采用 ...

2013-08-26 10:13 1 3399 推荐指数:

查看详情

pytest源码走读-开始

1、走读目的 主要目的是学习源码走读的过程,之后可以走读自己喜欢的任意代码。 稍次要的目的是学习pytest框架。毕竟,在上一份工作中,一直用这个框架,也尝试走读了,希望以后面试会更加明白这个框架。 2、走读时间20210226 3、走读模式。随意点开看看,找个入口 ...

Sat Feb 27 02:35:00 CST 2021 0 291
kcp源码走读

kcp协议与tcp协议类似,是一种ARQ协议。他的优点在于比tcp的延迟更小30%-40%,但相应的会牺牲一部分的带宽,大该比tcp多浪费10%~20%。tcp的设计目标是增大网络利用率,而kcp的设 ...

Thu May 11 02:21:00 CST 2017 0 4962
Canal 源码走读

前言 canal 是什么? 引用一下官方回答: 阿里巴巴mysql数据库binlog的增量订阅&消费组件 canal 能做什么? 基于日志增量订阅&消费支持的业务: ...

Wed Feb 27 01:26:00 CST 2019 1 571
Apache Spark源码走读之9 -- Spark源码编译

欢迎转载,转载请注明出处,徽沪一郎。 概要 本来源码编译没有什么可说的,对于java项目来说,只要会点maven或ant的简单命令,依葫芦画瓢,一下子就ok了。但到了Spark上面,事情似乎不这么简单,按照spark officical document上的来做,总会出现这样或那样的编译 ...

Sat May 17 00:44:00 CST 2014 4 5352
Apache Spark源码走读之8 -- Spark on Yarn

欢迎转载,转载请注明出处,徽沪一郎。 概要 Hadoop2中的Yarn是一个分布式计算资源的管理平台,由于其有极好的模型抽象,非常有可能成为分布式计算资源管理的事实标准。其主要职责将是分布式计算集 ...

Thu May 15 18:48:00 CST 2014 1 6092
【Atheros】minstrel速率调整算法源码走读

先说几个辅助的宏,因为内核不支持浮点运算,当然还有实现需要,minstrel对很多浮点值做了缩放: MINSTREL_SCALE是一个放大的倍数,minstrel设定的是16,缩放16 ...

Thu Nov 13 05:01:00 CST 2014 12 3066
【Atheros】Ath9k速率调整算法源码走读

上一篇文章介绍了驱动中minstrel_ht速率调整算法,atheros中提供了可选的的两种速率调整算法,分别是ath9k和minstrel,这两个算法分别位于: 无论从理论分析还是实 ...

Thu Nov 13 05:02:00 CST 2014 25 3327
Apache Spark源码走读之4 -- DStream实时流数据处理

欢迎转载,转载请注明出处,徽沪一郎。 Spark Streaming能够对流数据进行近乎实时的速度进行数据处理。采用了不同于一般的流式数据处理模型,该模型使得Spark Streaming有非常高的 ...

Sat Apr 26 05:22:00 CST 2014 0 7214
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM