[一起學Hive]之八-使用Hive命令行


Hive提供的幾種用戶交互接口中,最常用的就是命令行接口。本文簡單介紹一下Hive命令行接口(Hive Command Line)及Hive交互Shell(Hive Interactive Shell)的一些使用。

七、使用Hive命令行

7.1 Hive Command Line

輸入$HIVE_HOME/bin/hive –H 或者 –help可以顯示幫助選項:

 

-d,–define <key=value> 定義一個變量值,這個變量可以在Hive交互Shell中引用,后面會介紹用法,比如:-d A=B
–database <databasename> 進入Hive交互Shell時候指定數據庫,默認進入default數據庫
-e <quoted-query-string> 命令行執行一段SQL語句
-f <filename> filename文件中保存HQL語句,執行其中的語句
-H,–help 顯示幫助信息
-h <hostname> 連接遠程Hive Server,后續介紹
–hiveconf <property=value> 在命令行中設置Hive的運行時配置參數,優先級高於hive-site.xml,但低於Hive交互Shell中使用Set命令設置。
–hivevar <key=value> 同—define
-i <filename> 進入Hive交互Shell時候先執行filename中的HQL語句
-p <port> 連接遠程Hive Server的端口號
-S,–silent 靜默模式,指定后不顯示執行進度信息,最后只顯示結果
-v,–verbose 冗余模式,額外打印出執行的HQL語句

 

這里特別介紹一下以下幾個選項:

  • -d,–define <key=value>

執行$HIVE_HOME/bin/hive -d k1=v1 –database lxw1234

表示,定義了一個變量k1,值為v1,執行了數據庫為lxw1234

進入Hive交互Shell之后,可以使用${k1}來引用該變量,比如:

hive> select ‘${k1}’ from t_lxw1234 limit 1;

OK

v1

這里將k1的值v1打印出來。

  • –hiveconf <property=value>

可以使用該選項設定Hive的運行參數配置,相當於在Hive交互Shell中使用set命令進行設置,比如:

執行$HIVE_HOME/bin/hive –hiveconf mapred.reduce.tasks=20

進入交互Shell之后,運行的所有查詢都會設置20個reduce task。

除非又用set mapred.reduce.tasks=N;進行另外設定。

  • –hivevar <key=value>

用法同-d和—define

 

7.2 Hive交互Shell

Hive交互Shell指執行$HIVE_HOME/bin/hive之后,進入的有hive>提示符的交互式命令行,在這里可以執行查詢語句,設置參數等等,所有的命令必須以分號結束,具體有以下命令和選項:

  • quit

退出交互Shell

  • exit

退出交互Shell

  • reset

重置所有的Hive運行時配置參數,比如,之前使用set命令設置了reduce數量,使用reset之后,重置成hive-site.xml中的配置。

  • set <key>=<value>

設置Hive運行時配置參數,優先級最高,相同key,后面的設置會覆蓋前面的設置。

  • set –v

打印出所有Hive的配置參數和Hadoop的配置參數。

  • add命令

包括 add FILE[S] <filepath> <filepath>* 、 add JAR[S] <filepath> <filepath>* 、add ARCHIVE[S] <filepath> <filepath>*

向DistributeCache中添加一個或過個文件、jar包、或者歸檔,添加之后,可以在Map和Reduce task中使用。

比如,自定義一個udf函數,打成jar包,在創建函數之前,必須使用add jar命令,將該jar包添加,否則會報錯找不到類。

 

  • list 命令

包括 list FILE[S] 、list JAR[S]  、list ARCHIVE[S]

列出當前DistributeCache中的文件、jar包或者歸檔。

  • delete 命令

包括 delete FILE[S] <filepath>* 、delete JAR[S] <filepath>*  、 delete ARCHIVE[S] <filepath>*

從DistributeCache中刪除文件

  • ! <command>

在交互Shell中執行Linux操作系統命令並打印出結果,不常用

比如:

hive> !pwd;

/home/lxw1234

  • dfs <dfs command>

在交互Shell中執行hadoop fs 命令,不常用

比如,統計hdfs文件系統中/tmp/目錄的總大小:

hive> dfs -du -s /tmp/;

54656194751 /tmp

  • <query string>

最常用的,執行HQL語句,以分號結尾;

  • source FILE <filepath>

在交互Shell中執行一個腳本,不常用。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM