花費 32 ms
越來越火的圖數據庫究竟是什么?

隨着社交、電商、金融、零售、物聯網等行業的快速發展,現實社會織起了了一張龐大而復雜的關系網,傳統數據庫很難處理關系運算。大數據行業需要處理的數據之間的關系隨數據量呈幾何級數增長,亟需一種支持海量 ...

Fri Feb 22 02:33:00 CST 2019 7 46455
hive beeline詳解

Hive客戶端工具后續將使用Beeline 替代HiveCLI ,並且后續版本也會廢棄掉HiveCLI 客戶端工具,Beeline是 Hive 0.11版本引入的新命令行客戶端工具,它是基於SQLLi ...

Sun Jul 21 02:56:00 CST 2019 0 17493
Windows上安裝運行Hadoop

0.自己編譯安裝步驟在這里,有英文版本鏈接:《英文傳送門》。 自己編譯嘗試后不成功,換為下面使用別人編譯好的版本的方法。參考博客:《初學hadoop,windows下安裝》 1.下載JD ...

Sat May 26 07:36:00 CST 2018 4 32979
YARN架構設計詳解

一、YARN基本服務組件 YARN是Hadoop 2.0中的資源管理系統,它的基本設計思想是將MRv1中的JobTracker拆分成了兩個獨立的服務:一個全局的資源管理器Reso ...

Thu Apr 20 19:53:00 CST 2017 0 33903
利用 Docker 搭建單機的 Cloudera CDH 以及使用實踐

想用 CDH 大禮包,於是先在 Mac 上和 Centos7.4 上分別搞個了單機的測試用。其實操作的流和使用到的命令差不多就一並說了: 首先前往官方下載包: https://www.cloude ...

Wed Nov 07 02:38:00 CST 2018 6 13489
Presto實戰

一、Presto簡介 1、PRESTO是什么? Presto是一個開源的分布式SQL查詢引擎,適用於交互式分析查詢,數據量支持GB到PB字節。 Presto的設計和編寫完全是為了解決像Facebook ...

Sun Nov 19 06:08:00 CST 2017 0 20394
通過IDEA搭建scala開發環境開發spark應用程序

一、idea社區版安裝scala插件 因為idea默認不支持scala開發環境,所以當需要使用idea搭建scala開發環境時,首先需要安裝scala插件,具體安裝辦法如下。 1、打開idea,點擊c ...

Mon Nov 20 02:56:00 CST 2017 0 19311
hive分區表insert into vs insert overwrite

數據庫分區的主要目的是為了在特定的SQL操作中減少數據讀寫的總量以縮減響應時間,主要包括兩種分區形式:水平分區與垂直分區。水平分區是對表進行行分區。而垂直分區是對列進行分區,一般是通過對表的垂直划分來 ...

Mon Aug 19 01:53:00 CST 2019 0 6351

 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM