一、簡介 1.1 概述 Kafka是最初由Linkedin公司開發,是一個分布式、分區的、多副本的、多訂閱者,基於zookeeper協調的分布式日志系統(也可以當做MQ系統),常見可以用於web/nginx日志、訪問日志,消息服務等等,Linkedin於2010年貢獻給了Apache基金會 ...
一直在思考寫一些什么東西作為 年開篇博客。突然看到一篇 Kafka學習之路 的博文,覺得十分應景,於是決定搬來這 他山之石 。雖然對於Kafka博客我一向堅持原創,不過這篇來自Confluent團隊Gwen Shapira女士的博文實在精彩,所以還是翻譯給大家,原文參見這里。 Kafka學習之路 看上去很多工程師都已經把 學習Kafka 加到了 年的to do列表中。這沒什么驚訝的,畢竟Apac ...
2017-01-19 22:56 3 6689 推薦指數:
一、簡介 1.1 概述 Kafka是最初由Linkedin公司開發,是一個分布式、分區的、多副本的、多訂閱者,基於zookeeper協調的分布式日志系統(也可以當做MQ系統),常見可以用於web/nginx日志、訪問日志,消息服務等等,Linkedin於2010年貢獻給了Apache基金會 ...
一、下載 下載地址: http://kafka.apache.org/downloads.html http://mirrors.hust.edu.cn/apache/ 二、安裝前提(zookeeper安裝) 參考http://www.cnblogs.com/qingyunzong/p ...
一、Kafka的架構 如上圖所示,一個典型的Kafka集群中包含若干Producer(可以是web前端產生的Page View,或者是服務器日志,系統CPU、Memory等),若干broker(Kafka支持水平擴展,一般broker數量越多,集群吞吐率越高),若干Consumer ...
一、高可用的由來 1.1 為何需要Replication 在Kafka在0.8以前的版本中,是沒有Replication的,一旦某一個Broker宕機,則其上所有的Partition數據都不可被消費,這與Kafka數據持久性及Delivery Guarantee的設計目標相悖 ...
一、Kafka在zookeeper中存儲結構圖 二、分析 2.1 topic注冊信息 /brokers/topics/[topic] : 存儲某個topic的partitions所有分配信息 2.2 partition狀態信息 /brokers ...
最近事情多有點犯懶,依然帶來一篇譯文:Apache Kafka Producer Improvements with the Sticky Partitioner 消息在系統中流轉的時間對於Kafka的性能來說至關重要。具體到Producer而言,Producer端的延時(Latency ...
本文來自於DataWorks Summit/Hadoop Summit上的《Apache Kafka最佳實踐》分享,里面給出了很多關於Kafka的使用心得,非常值得一看,今推薦給大家。 硬件配置 JBOD: Just bunch of disks,就是普通的一堆磁盤組成的集群 OS ...
Flink提供了Kafka connector用於消費/生產Apache Kafka topic的數據。Flink的Kafka consumer集成了checkpoint機制以提供精確一次的處理語義。在具體的實現過程中,Flink不依賴於Kafka內置的消費組位移管理,而是在內部自行記錄和維護 ...