大數據開發過程中,常常涉及數據遷移的過程。比如實時同步kafka消息隊列中的數據到HBase的需求中,從kafka中取到的數據是jsonObject對象。

通過跳板機輸入查看kafka消息隊列的命令,可以拿到經過BASE64加密后的數據源。復制數據源到BASE64解碼工具進行解碼,得到JSON串,再利用JSON在線編輯器,將JSON字符串整理以便觀察。


通過JSON在線編輯器可以看到,images這個字段存儲的是一個數組對象,數組里的元素個數為1。而我從kafka消息隊列中拿到的數據是jsonObject對象。那么怎樣將jsonObject對象轉化為List集合呢?(考慮到可能存在重復的元素,所以使用List)
首先我們導入阿里巴巴的JSON包和genson的解析工具jar包。

代碼中可以看到,通過生成的jsonObject對象,可以解析從kafka消息隊列中獲取的數據源,得到對應的jsonObject對象。這時再調用fromJson方法,可以轉化為任意類型的對象,類型根據存儲變量的類型決定。這樣便可以調用List的size()方法獲得集合中元素的個數。
