花费 26 ms
Spark入门(五)--Spark的reduce和reduceByKey

reduce和reduceByKey的区别 reduce和reduceByKey是spark中使用地非常频繁的,在字数统计中,可以看到reduceByKey的经典使用。那么reduce和re ...

Sun Jan 12 08:16:00 CST 2020 0 7116
Spark入门(四)--Spark的map、flatMap、mapToPair

spark的RDD操作 在上一节Spark经典的单词统计中,了解了几个RDD操作,包括flatMap,map,reduceByKey,以及后面简化的方案,countByValue。那么这一节 ...

Sun Jan 12 08:15:00 CST 2020 0 5336
Spark入门(二)--如何用Idea运行我们的Spark项目

用Idea搭建我们的Spark环境 用IDEA搭建我们的环境有很多好处,其中最大的好处,就是我们甚至可以在工程当中直接运行、调试我们的代码,在控制台输出我们的结果。或者可以逐行跟踪代码,了解 ...

Sat Jan 11 04:05:00 CST 2020 0 3749
Spark入门(三)--Spark经典的单词统计

spark经典之单词统计 准备数据 既然要统计单词我们就需要一个包含一定数量的文本,我们这里选择了英文原著《GoneWithTheWind》(《飘》)的文本来做一个数据统计,看看文章中各 ...

Sun Jan 12 08:00:00 CST 2020 0 1989
Spark实战--搭建我们的Spark分布式架构

Spark的分布式架构 如我们所知,spark之所以强大,除了强大的数据处理功能,另一个优势就在于良好的分布式架构。举一个例子在Spark实战--寻找5亿次访问中,访问次数最多的人 ...

Sat Jan 11 03:59:00 CST 2020 0 680

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM