【文章推荐】Spark底层原理详细解析(深度好文，建议收藏)

原文：Spark底层原理详细解析(深度好文，建议收藏)

Spark简介 Apache Spark是用于大规模数据处理的统一分析引擎，基于内存计算，提高了在大数据环境下数据处理的实时性，同时保证了高容错性和高可伸缩性，允许用户将Spark部署在大量硬件之上，形成集群。 Spark源码从 .x的 w行发展到现在的超过 w行，有多位大牛贡献了代码。整个Spark框架源码是一个巨大的工程。下面我们一起来看下spark的底层执行原理。 Spark运行流程具体 ...

2021-01-29 09:53 4 1399 推荐指数：

查看详情

HBase 底层原理详解（深度好文，建议收藏）

HBase简介 HBase 是一个分布式的、面向列的开源数据库。建立在 HDFS 之上。Hbase的名字的来源是 Hadoop database，即 Hadoop 数据库。HBase 的计算和存储能 ...

Flink 中极其重要的 Time 与 Window 详细解析(深度好文，建议收藏)

前言 Flink 是流式的、实时的计算引擎上面一句话就有两个概念，一个是流式，一个是实时。流式：就是数据源源不断的流进来，也就是数据没有边界，但是我们计算的时候必须在一个有边界的范围内进行 ...

Spark性能调优-RDD算子调优篇（深度好文，面试常问，建议收藏）

不需要的数据，进而减少对内存的占用，从而提升Spark作业的运行效率。本文首发于公众号：五分钟学 ...

Kafka底层原理剖析（近万字建议收藏）

Kafka 简介 Apache Kafka 是一个分布式发布-订阅消息系统。是大数据领域消息队列中唯一的王者。最初由 linkedin 公司使用 scala 语言开发，在2010年贡献给了Apach ...

Kafka底层原理剖析（近万字建议收藏）

PriorityBlockingQueue深度解析(好文)

本文引自：https://www.cnblogs.com/Elliott-Su-Faith-change-our-life/p/7472265.html Java中PriorityQueue通 ...

面试常问的HashMap底层实现原理详解，建议收藏

一、快速入门示例：有一定基础的小伙伴们可以选择性的跳过该步骤 HashMap是Java程序员使用频率最高的用于映射键值对(key和value)处理的数据类型。随着JDK版本的跟新，JDK1.8对HashMap底层的实现进行了优化，列入引入红黑树的数据结构和扩容的优化等。本文结合JDK1.7 ...

SpringDataJpa入门案例及查询详细解析（深度好文）

SpringDataJpaSpring Data JPA 让我们解脱了DA0层的操作，基本上所有CRUD都可以依赖于它来实现，在实际的工作工程中，推荐使用Spring Data JPA+ORM（如 ...

原文：Spark底层原理详细解析(深度好文，建议收藏)

相关推荐

相关标签