Hive的操作與傳統關系型數據庫SQL操作十分類似。
Hive主要支持以下幾類操作:
DDL
1、DDL:數據定義語句,包括CREATE、ALTER、SHOW、DESCRIBE、DROP等。
詳細點,就是
Hive支持大量SQL數據定義語言(Data Definition Language,DDL)中的現有功能,包括以下各種語句:
CREATE DATABASE/SCHEMA,TABLE,VIEW,FUNCTION,INDEX
DROP DATABASE/SCHEMA,TABLE,VIEW,INDEX
TRUNCATE TABLE
ALTER DATABASE/SCHEMA,TABLE,VIEW
MSCK REPAIR TABLE (or ALTER TABLE RECOVER PARTITIONS)
SHOW DATABASES/SCHEMAS,TABLES,TBLPROPERTIES,PARTITIONS,FUNCTIONS,INDEX[ES]
DESCRIBE DATABASE,table_name,view_name
具體,見
Hive的數據類型和DDL見 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL
DML
2、DML:數據操作語句,包括LOAD DATA,INSERT(將查詢結果寫入Hive表或文件系統中)。
注意,Hive的設計中,沒有考慮UPDATE操作。
詳細點,就是
Hive支持大量SQL數據定義語言(Data Manipulation Language,DML)中的現有功能,包括以下各種語句:
使用where條件過濾表的行
使用列或子查詢的select表達式
使用等值連接,連接多張表
合並表的所有行或子查詢
針對多個“分組”的列進行聚合計算
將查詢結果存入另一張表
導出表中的內容到本地目錄或HDFS目錄中
Hive支持的原生數據類型
數值類型
TINYINT (1字節有符號整型)
SMALLINT(2字節有符號整型)
INT(4字節有符號整型)
BIGINT(8字節有符號整型)
FLOAT(4字節單精度浮點數)
DOUBLE(8字節雙精度浮點數)
DECIMAL(用戶定義精度和尺寸)
日期/時間類型
TIMESTAMP(傳統的UNIX時間戳,精度到納秒)
DATE(使用YYYY-MM-DD格式的日期,沒有時刻信息)
字符串類型
STRING(不指定長度)
VARCHAR(1~65535個字符)
CHAR(1~225個字符,固定長度,不足255長度會在末尾補齊空格)
其他類型
BOOLEAN
BINARY
Hive支持的符合數據類型
Struct:不同類型數據的集合
Array:相同類型的集合
Map:鍵值對數據類型的集合
QUERY
3、QUERY:數據查詢語句,主要是SELECT語句。