原文:【原創】如何確定Kafka的分區數、key和consumer線程數

在Kafak中國社區的qq群中,這個問題被提及的比例是相當高的,這也是Kafka用戶最常碰到的問題之一。本文結合Kafka源碼試圖對該問題相關的因素進行探討。希望對大家有所幫助。 怎么確定分區數 我應該選擇幾個分區 如果你在Kafka中國社區的群里,這樣的問題你會經常碰到的。不過有些遺憾的是,我們似乎並沒有很權威的答案能夠解答這樣的問題。其實這也不奇怪,畢竟這樣的問題通常都是沒有固定答案的。Ka ...

2015-08-25 12:28 21 53994 推薦指數:

查看詳情

如何確定Kafka分區keyconsumer線程

轉自:http://www.tuicool.com/articles/Aj6fAj3 如何確定Kafka分區keyconsumer線程 在Kafak中國社區的qq群中,這個問題被提及的比例是相當高的,這也是Kafka用戶最常碰到的問題之一。本文結合 ...

Mon Jun 26 19:30:00 CST 2017 0 1852
線程如何確定線程

最佳線程 在使用多線程的時候要注意幾個點,1.執行這個處理的時間多長,2.執行這類任務的消息有多頻繁 我一般的處理, 1.如果執行是時間過長但任務很少,我會只用一個線程(這里是無限循環,直到你的進程退出),而且最好在線程池里面直接開一個出來,不要單獨去new一個線程實例,好處的話就去看下線程池 ...

Fri Mar 09 00:15:00 CST 2018 0 1492
原創Kafka Consumer線程消費

上一篇《Kafka Consumer線程實例續篇》修正了多線程提交位移的問題,但依然可能出現數據丟失的情況,原因在於多個線程可能拿到相同分區的數據,而消費的順序會破壞消息本身在分區中的順序,因而擾亂位移的提交。這次我使用KafkaConsumer的pause和resume方法來防止這種情形的發生 ...

Tue Sep 15 17:51:00 CST 2020 8 3028
原創Kafka Consumer線程實例

  Kafka 0.9版本開始推出了Java版本的consumer,優化了coordinator的設計以及擺脫了對zookeeper的依賴。社區最近也在探討正式用這套consumer API替換Scala版本的consumer的計划。鑒於目前這方面的資料並不是很多,本文將嘗試給出一個 ...

Fri Dec 02 19:10:00 CST 2016 52 28685
原創Kafka Consumer線程實例續篇

  在上一篇《Kafka Consumer線程實例》中我們討論了KafkaConsumer多線程的兩種寫法:多KafkaConsumer多線程以及單KafkaConsumer多線程。在第二種用法中我使用的是自動提交的方式,省去了多線程提交位移的麻煩。很多人跑來問如果是手動提交應該怎么寫 ...

Wed Jun 28 23:33:00 CST 2017 6 7409
Kafka 分區可以增加或減少嗎?為什么?

我們可以使用 bin/kafka-topics.sh 命令對 Kafka 增加 Kafka分區數據,但是 Kafka 不支持減少分區Kafka 分區數據不支持減少是由很多原因的,比如減少的分區其數據放到哪里去?是刪除,還是保留?刪除的話,那么這些沒消費的消息不就丟了。如果保留這些消息 ...

Tue May 26 08:06:00 CST 2020 0 3130
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM