原文:ElasticSearch做实时OLAP框架~实时搜索、统计和OLAP需求,甚至可以作为NOSQL来使用(转)

使用ElasticSearch作为大数据平台的实时OLAP框架 lxw的大数据田地 http: lxw .com archives .htm 一直想找一个用于大数据平台实时OLAP 甚至是实时计算 的框架,之前调研的Druid druid.io 太过复杂,整个Druid由 个服务组成,而且加载数据也不太方便,性能一般,亦或是我还不太会用它。后来发现使用ElasticSearch就可以满足海量数据 ...

2019-11-22 17:36 0 278 推荐指数:

查看详情

Flink+Druid构建实时OLAP的探索

场景 k12在线教育公司的业务场景中,有一些业务场景需要实时统计和分析,如分析在线上课老师数量、学生数量,实时销售额,课堂崩溃率等,需要实时反应上课的质量问题,以便于对整个公司的业务情况有大致的了解。 方案对比 对比了很多解决方案,如下几种,列出来供参考。 方案 ...

Sat Aug 10 02:09:00 CST 2019 0 3687
OLAP之Druid之实时数据摄入

实时数据摄入 我们采用Kafka Indexing Service作为实时摄入数据的方案。 准备工作 将数据实时灌入某个Kafka topic中 与批量导入数据类似:考虑清楚数据中哪一列可以作为时间列、哪些列可以作为维度列、哪些列可以作为指标列(尤其是指标的聚合函数,包括count ...

Thu Apr 09 06:33:00 CST 2020 0 641
实时OLAP分析利器Druid介绍

文章目录 前言 Druid介绍 主要特性 基础概念 数据格式 数据摄入 数据存储 数据查询 查询类型 架构 运维 OLAP方案对比 使用场景 使用建议 参考 近期主题 前言 项目早期、数据(报表分析)的生产、存储和获取业务,MySQL基本上可以满足需要 ...

Fri Apr 17 06:46:00 CST 2020 0 2352
客户端埋点实时OLAP指标计算方案

背景 产品经理想要实时查询一些指标数据,在新版本的APP上线之后,我们APP的一些质量指标,比如课堂连接掉线率,课堂内崩溃率,APP崩溃率等指标,以此来看APP升级之后上课的体验是否有所提升,上课质量是否有所提高,为下一步的APP升级做准备。 客户端埋点 1.0版本设计 流程 按照需求 ...

Thu Aug 08 01:15:00 CST 2019 1 1074
ElasticSearch实时搜索的实现

1.近实时搜索 1.1 实时与近实时 实时搜索(Real-time Search)很好理解,对于一个数据库系统,执行插入以后立刻就能搜索到刚刚插入到数据。而近实时(Near Real-time),所谓“近”也就是说比实时要慢一点点。 1.2 近实时的挑战 对于一个单机系统来说 ...

Thu Oct 14 06:15:00 CST 2021 0 148
轻量级OLAP(二):Hive + Elasticsearch

1. 引言 在做OLAP数据分析时,常常会遇到过滤分析需求,比如:除去只有性别、常驻地标签的用户,计算广告媒体上的覆盖UV。OLAP解决方案Kylin不支持复杂数据类型(array、struct、map),要求数据输入Schema必须是平铺的,但是平铺后丢失了用户的聚合标签信息,而没有办法判断 ...

Mon Oct 10 04:40:00 CST 2016 0 4063
ElasticSearch + Canal 开发千万级的实时搜索系统【

公司是社交相关产品的,社交类产品对搜索功能需求要求就比较高,需要根据用户城市、用户ID昵称等进行搜索。 项目原先的搜索接口采用SQL查询的方式实现,数据库表采用了按城市分表的方式。但随着业务的发展,搜索接口调用频次越来越高,搜索接口压力越来越大,搜索数据库经常崩溃,从而导致搜索功能 ...

Thu Apr 06 18:00:00 CST 2017 2 6709
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM