标签【SparkCore】 - 码上欢乐

大家可能都知道很熟悉Spark的两种常见的数据读取方式（存放到RDD中）：（1）、调用parallelize函数直接从集合中获取数据，并存入RDD中；Java版本如下： ...

运行Spark作业出现异常： ERROR ObjectStore: Version information found in metastore differs 1.1.0 from expecte ...

需要在代码中假如序列化配置，或者提交的时候假如序列化配置。比如： spark-shell --master local[2] --conf spark.serializer=org.apache ...

java.lang.IllegalArgumentException: offset (0) + length (8) exceed the capacity of the array: 1at or ...

第1章 RDD概念弹性分布式数据集

第1章 RDD概念弹性分布式数据集 1.1 RDD为什么会产生 RDD是Spark的基石，是实现Spark数据处理的核心抽象。那么RDD为什么会产生呢？ Hadoop的MapReduce是一 ...