原文:看CarbonData如何用四招助力Apache Spark

摘要:CarbonData 在 Apache Spark 和存储系统之间起到中介服务的作用,为 Spark 提供的 个重要功能。 本文分享自华为云社区 Make Apache Spark better with CarbonData ,原文作者:大数据修行者 。 Spark 无疑是一个强大的处理引擎和一个用于更快处理的分布式集群计算框架。不幸的是,Spark在一些方面也存在不足。如果我们将 Ap ...

2021-06-30 16:09 0 188 推荐指数:

查看详情

Apache Kyuubi 助力 CDH 解锁 Spark SQL

Apache Kyuubi(Incubating)(下文简称Kyuubi)是⼀个构建在Spark SQL之上的企业级JDBC网关,兼容HiveServer2通信协议,提供高可用、多租户能力。Kyuubi 具有可扩展的架构设计,社区正在努力使其能够支持更多通信协议(如 RESTful、 MySQL ...

Fri Nov 19 00:50:00 CST 2021 0 1749
记一次Apache Carbondata PR的经历

前言 前段时间有幸接触到Apache Carbondata,试用过程中发现了一个小小的问题,并且又很快的定位到了问题。然后在社区群里反映了下,负责人问愿不愿意提个JIRA,PR,然后我在没有任何开源项目PR过的情况下竟然欣然答应了。(可能跟ZB心有关吧o(╥﹏╥)o)然后来说 ...

Mon Dec 17 19:38:00 CST 2018 0 848
深度对比Apache CarbonData、Hudi和Open Delta三大开源数据湖方案

摘要:今天我们就来解构数据湖的核心需求,同时深度对比Apache CarbonData、Hudi和Open Delta三大解决方案,帮助用户更好地针对自身场景来做数据湖方案选型。 背景 我们已经看到,人们更热衷于高效可靠的解决方案,拥有为数据湖提供应对突变和事务处理的能力。在数据湖中 ...

Thu Oct 29 23:23:00 CST 2020 1 2065
Spark入门(二)--如何用Idea运行我们的Spark项目

用Idea搭建我们的Spark环境 用IDEA搭建我们的环境有很多好处,其中最大的好处,就是我们甚至可以在工程当中直接运行、调试我们的代码,在控制台输出我们的结果。或者可以逐行跟踪代码,了解spark运行的机制。因此我们选择了idea,当然Idea不是首选,当然也可以用其他工具 ...

Sat Jan 11 04:05:00 CST 2020 0 3749
何用Jupyter Notebook打开Spark

  电脑已经装了anaconda python,然后下载了spark2.1.0。因为版本太新,所以网上和书上的一些内容已经不再适用。比如关于如何使用IPython和Jupyter,教程给出的方法是用如下语句打开Spark即可进入IPython或者IPython Notebook ...

Thu Jan 05 07:18:00 CST 2017 0 1673
Spark学习】Apache Spark配置

Spark版本:1.1.1 本文系从官方文档翻译而来,转载请尊重译者的工作,注明以下链接: http://www.cnblogs.com/zhangningbo/p/4137969.html Spark配置 Spark属性 动态加载Spark属性 查看 ...

Wed Dec 03 01:03:00 CST 2014 0 3212
什么是.NET for Apache Spark

什么是.NET for Apache Spark? 分享一个.NET平台开源免费跨平台的大数据分析框架.NET for Apache Spark for Apache Spark 今天早上六点半左右微信群里就看到张队发的关于.NET Spark ...

Mon Jun 03 21:27:00 CST 2019 1 645
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM