前言:老劉不敢說寫的有多好,但敢保證盡量用大白話把自己復習的知識點詳細解釋出來,拒絕資料上的生搬硬套,做到有自己的了解! 01 hive知識點(1) 第1點:數據倉庫的概念 由於hive它是基於hadoop的一個數據倉庫工具,老劉先講講數據倉庫的一些東西,再開始講hive ...
前言:老劉不敢說寫的有多好,但敢保證盡量用大白話把自己復習的內容詳細解釋出來,拒絕資料上的生搬硬套,做到有自己的了解 . hive知識點 第 點:hive分桶表 hive知識點主要偏實踐,很多人會認為基本命令不用記,但是萬丈高樓平地起,基本命令無論多基礎,都要好好練習,多實踐。 在hive中,分桶是相對分區進行更加細粒的划分。其中分區針對的是數據的存儲路徑,而分桶針對的是數據文件,老劉用兩張相關 ...
2020-12-11 16:31 1 360 推薦指數:
前言:老劉不敢說寫的有多好,但敢保證盡量用大白話把自己復習的知識點詳細解釋出來,拒絕資料上的生搬硬套,做到有自己的了解! 01 hive知識點(1) 第1點:數據倉庫的概念 由於hive它是基於hadoop的一個數據倉庫工具,老劉先講講數據倉庫的一些東西,再開始講hive ...
老劉今天復習HBase知識發現很多資料都沒有把概念說清楚,有很多專業名詞一筆帶過沒有解釋。比如這個框架高性能、高可用,那什么是高性能高可用?怎么實現的高性能高可用?沒說! 如果面試官聽了你說的,會有什么反應?我的感覺就是你說的東西都是別人的,沒有自己的理解。所以老劉才會寫用大白話講大數據 ...
今天,上海尚學堂大數據培訓班畢業的一位學生去參加易普軟件公司面試,應聘的職位是大數據開發。面試官問了他10個問題,主要集中在Hbase、Spark、Hive和MapReduce上,基礎概念、特點、應用場景等問得多。看來,還是非常注重基礎的牢固。整個大數據開發技術,這幾個技術知識點占了很大 ...
第一章 可視化定義: 利用人眼的感知能力對數據進行交互的可視表達以增強認知的技術,稱為可視化。 數據可視化的主要作用包括數據記錄和表達,數據操作和數據分析三個方面,這也是可視化技術支持計算機輔助數據認知的三個基本階段。 可視化定義: 利用人眼 ...
1、大數據概述:復習習題集上的例題即可 大數據的特征: 1:數據量大(volume) 非結構化數據的超大規模增長導致數據集合的規模不斷擴大,數據單位已經從GB級到TB級再到PB級,甚至開始以EB和ZB來計數。 2:類型繁多(variety) 大數據的類型不僅包括網絡日志、音頻、視頻 ...
在上一節中,我們簡單闡述了Java的一些基礎知識,比如多態,接口的實現等。 然后,演示了ArrayList的幾個基本方法。 ArrayList是一個集合框架,它的底層其實就是一個數組,這一點,官方文檔已經說得很清楚了。 作為一個容器,ArrayList有添加元素,刪除元素,以及獲取元素的方法 ...
對Java程序開發而言,ArrayList 的使用頻率是非常高的,尤其在進行 JavaWeb 開發的時候,ArrayList 和 HashMap 這兩個類,相信你一定不會陌生,因為天天都在用嘛。 本系列對 ArrayList 做一個解析,同時把Java基礎知識個串連進去。一開始我會對如何使用 ...
前言 如果在文中用詞或者理解方面出現問題,歡迎指出。此文旨在提及而不深究,但會盡量效率地把知識點都拋出來 一、JVM的基本介紹 JVM 是 Java Virtual Machine 的縮寫,它是一個虛構出來的計算機,一種規范。通過在實際的計算機上仿真模擬各類計算機功能實現··· 好 ...