什么是Kafka

本文轉載自查看原文 2021-10-31 19:54 1458 kafka

kafka是一個分布式的基於發布/訂閱模式的消息隊列，主要應用於大數據實時處理領域。

Kafka是一個分布式消息隊列。Kafka對消息保存時根據Topic進行歸類，發送消息者稱為Producer，消息接受者稱為Consumer，此外kafka集群有多個kafka實例組成，每個實例(server)稱為broker。

無論是kafka集群，還是consumer都依賴於zookeeper集群保存一些meta信息，來保證系統可用性。

1）Producer ：消息生產者，就是向kafka broker發消息的客戶端；

2）Consumer ：消息消費者，向kafka broker取消息的客戶端；

3）Topic ：可以理解為一個隊列；

4） Consumer Group （CG）：這是kafka用來實現一個topic消息的廣播（發給所有的consumer）和單播（發給任意一個consumer）的手段。一個topic可以有多個CG。topic的消息會復制（不是真的復制，是概念上的）到所有的CG，但每個partion只會把消息發給該CG中的一個consumer。如果需要實現廣播，只要每個consumer有一個獨立的CG就可以了。要實現單播只要所有的consumer在同一個CG。用CG還可以將consumer進行自由的分組而不需要多次發送消息到不同的topic；

5）Broker ：一台kafka服務器就是一個broker。一個集群由多個broker組成。一個broker可以容納多個topic；

6）Partition：為了實現擴展性，一個非常大的topic可以分布到多個broker（即服務器）上，一個topic可以分為多個partition，每個partition是一個有序的隊列。partition中的每條消息都會被分配一個有序的id（offset）。kafka只保證按一個partition中的順序將消息發給consumer，不保證一個topic的整體（多個partition間）的順序；

7）Offset：kafka的存儲文件都是按照offset.kafka來命名，用offset做名字的好處是方便查找。例如你想找位於2049的位置，只要找到2048.kafka的文件即可。當然the first offset就是00000000000.kafka。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 什么是Kafka? Kafka——Spring集成Kafka Kafka 性能篇：為何 Kafka 這么快？ Kafka監控-Kafka Eagle kafka 教程(一)-初識kafka kafka之一：kafka簡介 RabbitMQ和Kafka kafka的消費 Kafka的Controller Kafka為什么速度那么快？