作者: 大圓那些事 | 文章可以轉載,請以超鏈接形式標明文章原始出處和作者信息
前段時間項目中使用到了Hadoop Capacity Scheduler調度器,根據業務需求,需要進行二次開發工作,因此研究了其實現原理及源碼,這里是自己做的一些總結工作(摘自ppt)。
1. 基本原理
更多資料:
Capacity Scheduler Guide
2. 配置實用
3. 源碼分析
1)啟動過程
2)作業初始化-1
3)作業初始化-2
4)調度算法
5)作業調度
6)作業完成
4. 總結
以上只是對Capacity Scheduler內部實現的一些學習總結,接下來有時間再和大家詳細分享我們的業務需求以及對Capacity Scheduler的實際改造工作。
一句話概括:Capacity Scheduler是一個基於隊列的多用戶單資源的作業調度器,首先要理解其基本原理,然后學會如何正確配置使用,接着在實際應用中排查定位遇到的問題,最后還要能夠根據特定需求對其進行定制開發:)
