spark combineByKey用法


 

本例子是根据某个字段作为key,然后将记录合并为list集合。

 

        type myType = (String,Double)
        val goodsTradeRankRdd = goodsTradeRankDF.rdd.map(item => {
            val tenantId = item.getAs[String]("tenantId")
            val spuId = item.getAs[String]("spuId")
            val totalQty = item.getAs[Double]("totalQty")
            (tenantId,score(spuId,totalQty))
        }).combineByKey(
           List(_), (c:List[score],v) => v::c, (c1:List[score],c2:List[score]) => c1:::c2
        ).map(x => goodsTradeRank(x._1,x._2))

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM