前段時間有個朋友遇到kafka集群的topic太多出現too many file類似的錯誤,只能搭建新的集群。
查找一些資料發現問題是:
topic太多造成partition過多。partition是kafka的最小並行單元,每個partition都會在對應的broker上有日志文件。
當topic過多,partition增加,日志文件數也隨之增加,就需要允許打開更多的文件數。
partition過多在controller選舉和controller重新選舉partition leader的耗時會大大增加,造成kafka不可用的時間延長
目前kafka 1.1.0后的版本做了不少優化
參考鏈接: