花费 22 ms
GemFire 入门篇1:GemFire 是什么?

一、GemFire是什么? 如果你了解Redis或memCached,那么恭喜,你很快就能理解GemFire是什么,没错,你可以把它理解为一个增强版的Red ...

Sat Jan 03 07:09:00 CST 2015 0 26846
Spark SQL 小文件问题处理

在生产中,无论是通过SQL语句或者Scala/Java等代码的方式使用Spark SQL处理数据,在Spark SQL写数据时,往往会遇到生成的小文件过多的问题,而管理这些大量的小文件,是一件非常头疼 ...

Thu Dec 17 17:27:00 CST 2020 0 1066
Impala基于内存的SQL引擎的详细介绍

一、简介 1、概述 Impala是Cloudera公司推出,提供对HDFS、Hbase数据的高性能、低延迟的交互式SQL查询功能。 •基于Hive使用内存计算,兼顾数据仓库、具有实时 ...

Fri Aug 16 19:37:00 CST 2019 0 1016
自适应查询执行:在运行时提升Spark SQL执行性能

前言 Catalyst是Spark SQL核心优化器,早期主要基于规则的优化器RBO,后期又引入基于代价进行优化的CBO。但是在这些版本中,Spark SQL执行计划一旦确定就不会改变。由于缺乏或者 ...

Mon Dec 21 17:22:00 CST 2020 0 661
Bitmap之位图采样和内存计算详解

原文首发于微信公众号:躬行之(jzman-blog) Android 开发中经常考虑的一个问题就是 OOM(Out Of Memory),也就是内存溢出,一方面大量加载图片时有可能出现 O ...

Thu Apr 09 08:31:00 CST 2020 0 773
聊聊Spark的分区、并行度 —— 前奏篇

通过之前的文章【Spark RDD详解】,大家应该了解到Spark会通过DAG将一个Spark job中用到的所有RDD划分为不同的stage,每个stage内部都会有很多子任务处理数据,而每个sta ...

Tue Nov 17 16:59:00 CST 2020 0 459

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM