花费 9 ms
越来越火的图数据库究竟是什么?

随着社交、电商、金融、零售、物联网等行业的快速发展,现实社会织起了了一张庞大而复杂的关系网,传统数据库很难处理关系运算。大数据行业需要处理的数据之间的关系随数据量呈几何级数增长,亟需一种支持海量 ...

2019-02-22 02:33 7 46455
hive beeline详解

Hive客户端工具后续将使用Beeline 替代HiveCLI ,并且后续版本也会废弃掉HiveCLI 客户端工具,Beeline是 Hive 0.11版本引入的新命令行客户端工具,它是基于SQLLi ...

2019-07-21 02:56 0 17493
Windows上安装运行Hadoop

0.自己编译安装步骤在这里,有英文版本链接:《英文传送门》。 自己编译尝试后不成功,换为下面使用别人编译好的版本的方法。参考博客:《初学hadoop,windows下安装》 1.下载JD ...

2018-05-26 07:36 4 32979
YARN架构设计详解

一、YARN基本服务组件 YARN是Hadoop 2.0中的资源管理系统,它的基本设计思想是将MRv1中的JobTracker拆分成了两个独立的服务:一个全局的资源管理器Reso ...

2017-04-20 19:53 0 33903
Presto实战

一、Presto简介 1、PRESTO是什么? Presto是一个开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节。 Presto的设计和编写完全是为了解决像Facebook ...

2017-11-19 06:08 0 20394
通过IDEA搭建scala开发环境开发spark应用程序

一、idea社区版安装scala插件 因为idea默认不支持scala开发环境,所以当需要使用idea搭建scala开发环境时,首先需要安装scala插件,具体安装办法如下。 1、打开idea,点击c ...

2017-11-20 02:56 0 19311
hive分区表insert into vs insert overwrite

数据库分区的主要目的是为了在特定的SQL操作中减少数据读写的总量以缩减响应时间,主要包括两种分区形式:水平分区与垂直分区。水平分区是对表进行行分区。而垂直分区是对列进行分区,一般是通过对表的垂直划分来 ...

2019-08-19 01:53 0 6351

 
粤ICP备18138465号  © 2018-2020 CODEPRJ.COM