spark工作原理 1、分布式 2、基於內存 3、迭代式計算 每一批節點上的每一批數據就是一個RDD RDD是spark的核心抽象 1、RDD是Spark提供的核心抽象,全稱為Resillient ...
大數據集群搭建 1、virtualbox 1、關閉虛擬機選擇第一個休眠,會記錄各種進程的狀態。如果直接關掉虛擬機會關閉各種進程,導致環境崩潰。 2、Centos7 1、修改網絡 網卡橋接,配置主機 ...