【文章推荐】打造实时数据集成平台——DataPipeline基于Kafka Connect的应用实践

原文：打造实时数据集成平台——DataPipeline基于Kafka Connect的应用实践

作者：DataPipeline数见科技CTO 陈肃导读：传统ETL方案让企业难以承受数据集成之重，基于Kafka Connect构建的新型实时数据集成平台被寄予厚望。在月日的Kafka Beijing Meetup第四场活动上，DataPipeline CTO陈肃分享了DataPipeline是如何基于Kafka Connect框架构建实时数据集成平台的应用实践。以下内容是基于现场录音整理 ...

2018-05-21 14:06 0 6577 推荐指数：

查看详情

打造实时数据集成平台——DataPipeline基于Kafka Connect的应用实践

导读：传统ETL方案让企业难以承受数据集成之重，基于Kafka Connect构建的新型实时数据集成平台被寄予厚望。在4月21日的Kafka Beijing Meetup第四场活动上，DataPipeline CTO陈肃分享了DataPipeline是如何基于Kafka Connect框架 ...

以Kafka Connect作为实时数据集成平台的基础架构有什么优势？

Kafka Connect是一种用于在Kafka和其他系统之间可扩展的、可靠的流式传输数据的工具，可以更快捷和简单地将大量数据集合移入和移出Kafka的连接器。Kafka Connect为DataPipeline提供了一个相对成熟稳定的基础框架，还提供了一些开箱即用的工具，大大地降低研发的投入 ...

DataPipeline丨构建实时数据集成平台时，在技术选型上的考量点

文 | 陈肃 DataPipeline CTO 随着企业应用复杂性的上升和微服务架构的流行，数据正变得越来越以应用为中心。服务之间仅在必要时以接口或者消息队列方式进行数据交互，从而避免了构建单一数据库集群来支撑不断增长的业务需要。以应用为中心的数据持久化架构，在带来可伸缩性好处 ...

基于 Kafka 的实时数仓在搜索的实践应用

一、概述 Apache Kafka 发展至今，已经是一个很成熟的消息队列组件了，也是大数据生态圈中不可或缺的一员。Apache Kafka 社区非常的活跃，通过社区成员不断的贡献代码和迭代项目，使得 Apache Kafka 功能越发丰富、性能越发稳定，成为企业大数据技术架构解决方案中重要的一环 ...

spark-streaming集成Kafka处理实时数据

在这篇文章里，我们模拟了一个场景，实时分析订单数据，统计实时收益。场景模拟我试图覆盖工程上最为常用的一个场景： 1）首先，向Kafka里实时的写入订单数据，JSON格式，包含订单ID-订单类型-订单收益 2）然后，spark-streaming每十秒实时去消费kafka中的订单数据 ...

知乎的 Flink 数据集成平台建设实践

简介：本文由知乎技术平台负责人孙晓光分享，主要介绍知乎 Flink 数据集成平台建设实践。内容如下： 1. 业务场景； 2. 历史设计； 3. 全面转向 Flink 后的设计； 4. 未来 Flink 应用场景的规划。本文由知乎技术平台负责人孙晓光分享，主要介绍知 ...

Flume和Kafka完成实时数据的采集

Flume和Kafka完成实时数据的采集写在前面 Flume和Kafka在生产环境中，一般都是结合起来使用的。可以使用它们两者结合起来收集实时产生日志信息，这一点是很重要的。如果，你不了解flume和kafka，你可以先查看我写的关于那两部分的知识。再来学习，这部分的操作，也是可以的。 实时数据 ...

kafka和websocket实时数据推送

需求已有Kafka服务，通过kafka服务数据（GPS）落地到本地磁盘（以文本文件存储）。现要根据echarts实现一个实时车辆的地图。分析前端实时展现：使用websocket技术，实现服务器端数据推送到前端展现通过Java的kafka client端 ...

原文：打造实时数据集成平台——DataPipeline基于Kafka Connect的应用实践

相关推荐

相关标签