花费 30 ms
Spark之SQL解析(源码阅读十)

  如何能更好的运用与监控sparkSQL?或许我们改更深层次的了解它深层次的原理是什么。之前总结的已经写了传统数据库与Spark的sql解析之间的差别。那么我们下来直切主题~   如今的Spark ...

Sun Nov 27 22:55:00 CST 2016 0 3550
大数据全体系年终总结

  到年底了,想着总结下所有知识点好了~今年应用的知识点还是很多的~    Hadoop生态圈:   1、文件存储当然是选择Hadoop的分布式文件系统HDFS,当然因为硬件的告诉发展,已经出现 ...

Sun Dec 11 23:54:00 CST 2016 0 2985
Spark Netty与Jetty (源码阅读十一)

  spark呢,对Netty API又做了一层封装,那么Netty是什么呢~是个鬼。它基于NIO的服务端客户端框架,具体不再说了,下面开始。   创建了一个线程工厂,生成的线程都给定一个前缀名。 ...

Fri Dec 09 07:42:00 CST 2016 0 2236
SparkConf加载与SparkContext创建(源码阅读一)

即日起开始spark源码阅读之旅,这个过程是相当痛苦的,也许有大量的看不懂,但是每天一个方法,一点点看,相信总归会有极大地提高的。那么下面开始: 创建sparkConf对象,那么究竟它干了什么了类, ...

Mon Nov 21 00:38:00 CST 2016 2 1806
Spark Shuffle数据处理过程与部分调优(源码阅读七)

  shuffle。。。相当重要,为什么咩,因为shuffle的性能优劣直接决定了整个计算引擎的性能和吞吐量。相比于Hadoop的MapReduce,可以看到Spark提供多种计算结果处理方式,对sh ...

Fri Nov 25 08:43:00 CST 2016 0 1406

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM