Kafka問題總結

本文轉載自查看原文 2019-09-06 17:44 560 Kafka

kafka問題總結

kafka如何保證數據可靠性和數據一致性

Kafka Rebalance機制分析

Kafka的用途有哪些？使用場景如何？

Kafka中的ISR、AR又代表什么？ISR的伸縮又指什么

Kafka中的HW、LEO、LSO、LW等分別代表什么?

Kafka中是怎么體現消息順序性的？

Kafka中的分區器、序列化器、攔截器是否了解？它們之間的處理順序是什么？

Kafka生產者客戶端的整體結構是什么樣子的？

Kafka生產者客戶端中使用了幾個線程來處理？分別是什么？

Kafka的舊版Scala的消費者客戶端的設計有什么缺陷？

“消費組中的消費者個數如果超過topic的分區，那么就會有消費者消費不到數據”這句話是否正確？如果正確，那有沒有什么hack的手段？

消費者提交消費位移時提交的是當前消費到的最新消息的offset還是offset+1?

有哪些情形會造成重復消費？

那些情景下會造成消息漏消費？

KafkaConsumer是非線程安全的，那么怎么樣實現多線程消費？

簡述消費者與消費組之間的關系

當你使用kafka-topics.sh創建（刪除）了一個topic之后，Kafka背后會執行什么邏輯？

topic的分區數可不可以增加？如果可以怎么增加？如果不可以，那又是為什么？

topic的分區數可不可以減少？如果可以怎么減少？如果不可以，那又是為什么？

創建topic時如何選擇合適的分區數？

Kafka目前有那些內部topic，它們都有什么特征？各自的作用又是什么？

優先副本是什么？它有什么特殊的作用？

Kafka有哪幾處地方有分區分配的概念？簡述大致的過程及原理

簡述Kafka的日志目錄結構

Kafka中有那些索引文件？

如果我指定了一個offset，Kafka怎么查找到對應的消息？

如果我指定了一個timestamp，Kafka怎么查找到對應的消息？

聊一聊你對Kafka的Log Retention的理解

聊一聊你對Kafka的Log Compaction的理解

聊一聊你對Kafka底層存儲的理解（頁緩存、內核層、塊層、設備層）

聊一聊Kafka的延時操作的原理

聊一聊Kafka控制器的作用

消費再均衡的原理是什么？（提示：消費者協調器和消費組協調器）

Kafka中的冪等是怎么實現的

Kafka中的事務是怎么實現的（這題我去面試6加被問4次，照着答案念也要念十幾分鍾，面試官簡直湊不要臉

Kafka中有那些地方需要選舉？這些地方的選舉策略又有哪些？

失效副本是指什么？有那些應對措施？

多副本下，各個副本中的HW和LEO的演變過程

為什么Kafka不支持讀寫分離？

Kafka在可靠性方面做了哪些改進？（HW, LeaderEpoch）

Kafka中怎么實現死信隊列和重試隊列？

Kafka中的延遲隊列怎么實現（這題被問的比事務那題還要多！！！聽說你會Kafka，那你說說延遲隊列怎么實現？）

Kafka中怎么做消息審計？

Kafka中怎么做消息軌跡？

Kafka中有那些配置參數比較有意思？聊一聊你的看法

Kafka中有那些命名比較有意思？聊一聊你的看法

Kafka有哪些指標需要着重關注？

怎么計算Lag？(注意read_uncommitted和read_committed狀態下的不同)

Kafka的那些設計讓它有如此高的性能？

Kafka有什么優缺點？

還用過什么同質類的其它產品，與Kafka相比有什么優缺點？

為什么選擇Kafka?

在使用Kafka的過程中遇到過什么困難？怎么解決的？

怎么樣才能確保Kafka極大程度上的可靠性？

聊一聊你對Kafka生態的理解

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Kafka丟失數據問題優化總結 kafka學習總結014 --- consumer多線程問題 kafka命令總結 java連接kafka總結 Kafka 總結學習【kafka】celery與kafka的聯用問題 kafka 遇到的問題關於Kafka的ack問題 kafka配置的問題排查 kafka使用時的問題