花费 40 ms
越来越火的图数据库究竟是什么?

随着社交、电商、金融、零售、物联网等行业的快速发展,现实社会织起了了一张庞大而复杂的关系网,传统数据库很难处理关系运算。大数据行业需要处理的数据之间的关系随数据量呈几何级数增长,亟需一种支持海量 ...

Fri Feb 22 02:33:00 CST 2019 7 46455
hive beeline详解

Hive客户端工具后续将使用Beeline 替代HiveCLI ,并且后续版本也会废弃掉HiveCLI 客户端工具,Beeline是 Hive 0.11版本引入的新命令行客户端工具,它是基于SQLLi ...

Sun Jul 21 02:56:00 CST 2019 0 17493
Windows上安装运行Hadoop

0.自己编译安装步骤在这里,有英文版本链接:《英文传送门》。 自己编译尝试后不成功,换为下面使用别人编译好的版本的方法。参考博客:《初学hadoop,windows下安装》 1.下载JD ...

Sat May 26 07:36:00 CST 2018 4 32979
YARN架构设计详解

一、YARN基本服务组件 YARN是Hadoop 2.0中的资源管理系统,它的基本设计思想是将MRv1中的JobTracker拆分成了两个独立的服务:一个全局的资源管理器Reso ...

Thu Apr 20 19:53:00 CST 2017 0 33903
利用 Docker 搭建单机的 Cloudera CDH 以及使用实践

想用 CDH 大礼包,于是先在 Mac 上和 Centos7.4 上分别搞个了单机的测试用。其实操作的流和使用到的命令差不多就一并说了: 首先前往官方下载包: https://www.cloude ...

Wed Nov 07 02:38:00 CST 2018 6 13489
Presto实战

一、Presto简介 1、PRESTO是什么? Presto是一个开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节。 Presto的设计和编写完全是为了解决像Facebook ...

Sun Nov 19 06:08:00 CST 2017 0 20394
通过IDEA搭建scala开发环境开发spark应用程序

一、idea社区版安装scala插件 因为idea默认不支持scala开发环境,所以当需要使用idea搭建scala开发环境时,首先需要安装scala插件,具体安装办法如下。 1、打开idea,点击c ...

Mon Nov 20 02:56:00 CST 2017 0 19311
hive分区表insert into vs insert overwrite

数据库分区的主要目的是为了在特定的SQL操作中减少数据读写的总量以缩减响应时间,主要包括两种分区形式:水平分区与垂直分区。水平分区是对表进行行分区。而垂直分区是对列进行分区,一般是通过对表的垂直划分来 ...

Mon Aug 19 01:53:00 CST 2019 0 6351

 
粤ICP备18138465号  © 2018-2024 CODEPRJ.COM