spark與hive引擎差異致結果集不一致


sql樣例

select *
from open.dws_openmall_item_inc_d a
where  a.log_date = '日期'
  and business = 'mall'
  and a.item_id=10022085

hive 執行有兩條數據 spark執行有一條數據,經過排查發現存儲路徑如

 

 

表結構

 

 

spark 中任務前面有空格的數據字段是' 10022085' 而不是'10022085' 所以查詢以上sql僅一條,hive有兩條


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM