1. 介紹
經過Apache Hudi項目委員會討論及投票決定,來自阿里雲的Pengzhiwei和DannyChan成為Apache Hudi Committer,新晉人才也保證了Hudi社區在正確的軌道上不斷發展。
Pengzhiwei持續在Apache Hudi社區貢獻,開發了諸多特性,如Spark SQL集成Hudi,該功能降低了用戶使用Hudi的門檻,SQL化操作讓數據入湖更加順滑,還貢獻了Spark流式讀取Hudi表,Spark FileIndex等一系列Spark側的特性,同時在Github Issue、Hudi中國微信群積極回答用戶各種問題,Pengzhiwei是一個非常好的團隊協作同學,Pengzhiwei具有多年流計算SQL引擎開發經驗,目前主要負責數據湖格式以及實時入湖方面的研發工作。
Danny Chan也貢獻了非常多的特性,主要集中在Flink與Hudi的集成,包括新的無阻塞的Flink寫入鏈路,Flink流和批讀Hudi表(COW和MOR),以及實現了Hudi Flink SQL Connector(讀和寫),極大方便了數據入湖。同時Danny也積極回答用戶的各類問題,同時也輸出了Flink與Hudi集成指南,並且開了一場Flink集成Hudi的直播,DannyChan目前專注於Flink與Hudi的集成。
2. 社區
隨着AWS、阿里巴巴等世界頂級雲廠商內置Hudi為數據湖基礎設施,賦能世界范圍內成千上萬公司,基於Hudi構建事務型實時數據湖平台,以Lakehouse架構賦能AI和BI等典型的大數據場景,驅動企業數字化轉型。
Apache Hudi社區在不斷發展壯大,微信群/社區Slack/郵件列表非常活躍,討論也非常開放,隨着Hudi被越來越多公司熟知和使用,也吸引全球越來越多的小伙伴參與到社區中,對華人非常友好,其中來自國內開發者的聲音越來越大,也歡迎一起更多國內小伙伴一起參與社區,讓你的代碼創造世界范圍的影響力。
3. 如何參與
如果你想參與Hudi社區但還不了解如何參與,可參考如下兩篇文章:
持續參與社區貢獻,如特性開發、bugfix、Code Review、回答用戶問題、積極參與討論、推廣Hudi等,Committer便水到渠成,行動起來,下一個Committer可能就是你。
4. 最后
再次恭喜Pengzhiwei和DannyChan,一起打造更好的數據湖平台。
Apache Hudi項目github地址:https://github.com/apache/hudi,歡迎fork & star