Kylin查询性能低下原因分析

本文转载自查看原文 2016-10-30 10:57 1957

在处理指数行情数据时（IDXD），我遇到一个KYLIN性能查询低下的问题，非常奇怪。经过一番研究发现了其中的原因并顺利解决：

症状：

select count(*) from sensitop.idxd where ticker = ‘000300’ and tradedate between ‘2016-01-01’ and ‘2016-07-01'
很快，不到一秒

select * from sensitop.idxd where ticker = ‘000300’ and tradedate between ‘2016-01-01’ and ‘2016-07-01'
很慢，要50多秒，有时候还会超时。

分析：

既然count很快，说明检索cube本身是很快的，问题可能出在获取数据上，可能是读取数据的存在问题，需要检查cube的设置

解决：

发现默认情况下，cube中的TRADEDATE字段是dict，当改成date时，性能问题得到解决。

NewImage

结论：

这应该是一个反序列化的问题。当检索cube完成之后，得到索引，之后需要从磁盘读取数据并反序列化成对象。针对TRADEDATE，显然dict的encoding和date的encoding存在巨大的性能差异。这一点值得我们注意！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 OpenXML性能真的低下吗？性能分析—查询运行慢的原因(SQLServer2008宝典) MongoDB慢查询性能分析 Kylin存储和查询的分片问题 Kylin 下压查询 (Pushdown) 到 Impala SQL2000滥用 join 语句带来的悲催后果（查询效率低下）玩转mongodb（五）：mongodb 3.0+ 查询性能分析 [转]mysql性能优化-慢查询分析、优化索引和配置 Kafka高性能原因 Java 性能优化实战记录(3)--JVM OOM的分析和原因追查