Hive Map结构
平时很少用到map类型,这次用到了记录一下。 适用场景:行转列,且mid的key个数可能不一样的情况。 举个栗子: 构造数据: mid ...
平时很少用到map类型,这次用到了记录一下。 适用场景:行转列,且mid的key个数可能不一样的情况。 举个栗子: 构造数据: mid ...
今天遇到了百亿级别的数据量JOIN 十亿级别的数据量 发现reduce 40分钟还没有出来,进去看单个task 某些task要30min+才能跑完成 ...