spark工作原理 1、分布式 2、基于内存 3、迭代式计算 每一批节点上的每一批数据就是一个RDD RDD是spark的核心抽象 1、RDD是Spark提供的核心抽象,全称为Resillient ...
大数据集群搭建 1、virtualbox 1、关闭虚拟机选择第一个休眠,会记录各种进程的状态。如果直接关掉虚拟机会关闭各种进程,导致环境崩溃。 2、Centos7 1、修改网络 网卡桥接,配置主机 ...