Hadoop-2.0命令手冊

本文轉載自查看原文 2014-03-26 16:00 15359 hadoop

1. FS Shell

1.1 簡介

調用文件系統(FS)Shell命令應使用 bin/hadoop fs <args>的形式。所有的的FS shell命令使用URI路徑作為參數。URI格式是scheme://authority/path。對HDFS文件系統，scheme是hdfs，對本地文件系統，scheme是file。其中scheme和authority參數都是可選的，如果未加指定，就會使用配置中指定的默認scheme。一個HDFS文件或目錄比如/parent/child可以表示成hdfs://namenode:namenodeport/parent/child，或者更簡單的/parent/child（假設你配置文件中的默認值是namenode:namenodeport）。大多數FS Shell命令的行為和對應的Unix Shell命令類似，不同之處會在下面介紹各命令使用詳情時指出。出錯信息會輸出到stderr，其他信息輸出到stdout。

1.2 常用命令使用

1) cat

使用方法：hadoop fs -cat URI [URI …]

將路徑指定文件的內容輸出到stdout。

示例：

hadoop fs -cat hdfs://host1:port1/file1 hdfs://host2:port2/file2

hadoop fs -cat file:///file3 /user/hadoop/file4

返回值：

成功返回0，失敗返回-1。

2) chgrp

使用方法：hadoop fs -chgrp [-R]

改變文件所屬的組。使用-R將使改變在目錄結構下遞歸進行。命令的使用者必須是文件的所有者或者超級用戶。更多的信息請參見HDFS權限用戶指南。

3) chmod

使用方法：hadoop fs -chmod [-R] <MODE[,MODE]... | OCTALMODE> URI [URI …]

改變文件的權限。使用-R將使改變在目錄結構下遞歸進行。命令的使用者必須是文件的所有者或者超級用戶。更多的信息請參見HDFS權限用戶指南。

4) chown

使用方法：hadoop fs -chown [-R] [OWNER][:[GROUP]] URI [URI ]

改變文件的擁有者。使用-R將使改變在目錄結構下遞歸進行。命令的使用者必須是超級用戶。更多的信息請參見HDFS權限用戶指南。

5) copyFromLocal

使用方法：hadoop fs -copyFromLocal <localsrc> URI

除了限定源路徑是一個本地文件外，和put命令相似。

6) copyToLocal

使用方法：hadoop fs -copyToLocal [-ignorecrc] [-crc] URI <localdst>

除了限定目標路徑是一個本地文件外，和get命令類似。

7) cp

使用方法：hadoop fs -cp URI [URI …] <dest>

將文件從源路徑復制到目標路徑。這個命令允許有多個源路徑，此時目標路徑必須是一個目錄。

示例：

hadoop fs -cp /user/hadoop/file1 /user/hadoop/file2

hadoop fs -cp /user/hadoop/file1 /user/hadoop/file2 /user/hadoop/dir

返回值：

成功返回0，失敗返回-1。

8) du

使用方法：hadoop fs -du URI [URI …]

顯示目錄中所有文件的大小，或者當只指定一個文件時，顯示此文件的大小。

示例：

hadoop fs -du /user/hadoop/dir1 /user/hadoop/file1 hdfs://host:port/user/hadoop/dir1

返回值：

成功返回0，失敗返回-1。

9) dus

使用方法：hadoop fs -dus <args>

顯示文件的大小。

10) expunge

使用方法：hadoop fs -expunge

清空回收站。請參考HDFS設計文檔以獲取更多關於回收站特性的信息。

11) get

使用方法：hadoop fs -get [-ignorecrc] [-crc] <src> <localdst>

復制文件到本地文件系統。可用-ignorecrc選項復制CRC校驗失敗的文件。使用-crc選項復制文件以及CRC信息。

示例：

hadoop fs -get /user/hadoop/file localfile

hadoop fs -get hdfs://host:port/user/hadoop/file localfile

返回值：

成功返回0，失敗返回-1。

12) getmerge

使用方法：hadoop fs -getmerge <src> <localdst> [addnl]

接受一個源目錄和一個目標文件作為輸入，並且將源目錄中所有的文件連接成本地目標文件。addnl是可選的，用於指定在每個文件結尾添加一個換行符。

13) ls

使用方法：hadoop fs -ls <args>

如果是文件，則按照如下格式返回文件信息：

文件名 <副本數> 文件大小修改日期修改時間權限用戶ID 組ID

如果是目錄，則返回它直接子文件的一個列表，就像在Unix中一樣。目錄返回列表的信息如下：

目錄名 <dir> 修改日期修改時間權限用戶ID 組ID

示例：

hadoop fs -ls /user/hadoop/file1 /user/hadoop/file2 hdfs://host:port/user/hadoop/dir1 /nonexistentfile

返回值：

成功返回0，失敗返回-1。

14) lsr

使用方法：hadoop fs -lsr <args>

ls命令的遞歸版本。類似於Unix中的ls -R。

15) mkdir

使用方法：hadoop fs -mkdir <paths>

接受路徑指定的uri作為參數，創建這些目錄。其行為類似於Unix的mkdir -p，它會創建路徑中的各級父目錄。

示例：

hadoop fs -mkdir /user/hadoop/dir1 /user/hadoop/dir2

hadoop fs -mkdir hdfs://host1:port1/user/hadoop/dir hdfs://host2:port2/user/hadoop/dir

返回值：

成功返回0，失敗返回-1。

16) movefromLocal

使用方法：dfs -moveFromLocal <src> <dst>

輸出一個”not implemented“信息。

17) mv

使用方法：hadoop fs -mv URI [URI …] <dest>

將文件從源路徑移動到目標路徑。這個命令允許有多個源路徑，此時目標路徑必須是一個目錄。不允許在不同的文件系統間移動文件。

示例：

hadoop fs -mv /user/hadoop/file1 /user/hadoop/file2

hadoop fs -mv hdfs://host:port/file1 hdfs://host:port/file2 hdfs://host:port/file3 hdfs://host:port/dir1

返回值：

成功返回0，失敗返回-1。

18) put

使用方法：hadoop fs -put <localsrc> ... <dst>

從本地文件系統中復制單個或多個源路徑到目標文件系統。也支持從標准輸入中讀取輸入寫入目標文件系統。

hadoop fs -put localfile /user/hadoop/hadoopfile

hadoop fs -put localfile1 localfile2 /user/hadoop/hadoopdir

hadoop fs -put localfile hdfs://host:port/hadoop/hadoopfile

hadoop fs -put - hdfs://host:port/hadoop/hadoopfile

從標准輸入中讀取輸入。

返回值：

成功返回0，失敗返回-1。

19) rm

使用方法：hadoop fs -rm URI [URI …]

刪除指定的文件。只刪除非空目錄和文件。請參考rmr命令了解遞歸刪除。

示例：

hadoop fs -rm hdfs://host:port/file /user/hadoop/emptydir

返回值：

成功返回0，失敗返回-1。

20) rmr

使用方法：hadoop fs -rmr URI [URI …]

delete的遞歸版本。

示例：

hadoop fs -rmr /user/hadoop/dir

hadoop fs -rmr hdfs://host:port/user/hadoop/dir

返回值：

成功返回0，失敗返回-1。

21) setrep

使用方法：hadoop fs -setrep [-R] <path>

改變一個文件的副本系數。-R選項用於遞歸改變目錄下所有文件的副本系數。

示例：

hadoop fs -setrep -w 3 -R /user/hadoop/dir1

返回值：

成功返回0，失敗返回-1。

22) stat

使用方法：hadoop fs -stat URI [URI …]

返回指定路徑的統計信息。

示例：

hadoop fs -stat path

返回值：

成功返回0，失敗返回-1。

23) tail

使用方法：hadoop fs -tail [-f] URI

將文件尾部1K字節的內容輸出到stdout。支持-f選項，行為和Unix中一致。

示例：

hadoop fs -tail pathname

返回值：

成功返回0，失敗返回-1。

24) test

使用方法：hadoop fs -test -[ezd] URI

選項：

-e 檢查文件是否存在。如果存在則返回0。

-z 檢查文件是否是0字節。如果是則返回0。

-d 如果路徑是個目錄，則返回1，否則返回0。

示例：

hadoop fs -test -e filename

25) text

使用方法：hadoop fs -text <src>

將源文件輸出為文本格式。允許的格式是zip和TextRecordInputStream。

26) touchz

使用方法：hadoop fs -touchz URI [URI …]

創建一個0字節的空文件。

示例：

hadoop -touchz pathname

返回值：

成功返回0，失敗返回-1

2. jar

運行jar文件。用戶可以把他們的Map Reduce代碼捆綁到jar文件中，使用這個命令執行。

用法：hadoop jar <jar> [mainClass] args...

例如我們提交wordcount mapreduce的時候：

hadoop jar hadoop-examples.jar wordcount input output

3. archive

bin/hadoop archive

創建一個hadoop檔案文件。參考 Hadoop Archives.

用法：hadoop archive -archiveName NAME <src>* <dest>

-archiveName NAME 要創建的檔案的名字。

src文件系統的路徑名，和通常含正則表達的一樣。

4. distcp

bin/hadoop distcp

遞歸地拷貝文件或目錄。參考DistCp指南以獲取等多信息。

用法：hadoop distcp <srcurl> <desturl>

srcurl 源Url

desturl目標Url

daemonlog

獲取或設置每個守護進程的日志級別。

用法：hadoop daemonlog -getlevel <host:port> <name>

用法：hadoop daemonlog -setlevel <host:port> <name> <level>

-getlevel <host:port> <name> 打印運行在<host:port>的守護進程的日志級別。這個命令內部會連接http://<host:port>/logLevel?log=<name>

-setlevel <host:port> <name> <level> 設置運行在<host:port>的守護進程的日志級別。這個命令內部會連接http://<host:port>/logLevel?log=<name>

5. bin/hdfs shell

dfs run a filesystem command on the file systems supported in Hadoop.

namenode -format format the DFS filesystem

secondarynamenode run the DFS secondary namenode

namenode run the DFS namenode

zkfc run the ZK Failover Controller daemon

datanode run a DFS datanode

dfsadmin run a DFS admin client

haadmin run a DFS HA admin client

fsck run a DFS filesystem checking utility

balancer run a cluster balancing utility

jmxget get JMX exported values from NameNode or DataNode.

oiv apply the offline fsimage viewer to an fsimage

oev apply the offline edits viewer to an edits file

fetchdt fetch a delegation token from the NameNode

getconf get config values from configuration

groups get the groups which users belong to

1) balancer

運行集群平衡工具。管理員可以簡單的按Ctrl-C來停止平衡過程。參考Rebalancer了解更多。

用法：hadoop balancer [-threshold <threshold>]

-threshold <threshold> 磁盤容量的百分比。這會覆蓋缺省的閥值。

2) datanode

運行一個HDFS的datanode。

用法：hadoop datanode [-rollback]

-rollback 將datanode回滾到前一個版本。這需要在停止datanode，分發老的hadoop版本之后使用。

3) dfsadmin

bin/hdfs dfsadmin

Usage: java DFSAdmin

Note: Administrative commands can only be run as the HDFS superuser.

[-report]

[-safemode enter | leave | get | wait]

[-saveNamespace]

[-restoreFailedStorage true|false|check]

[-refreshNodes]

[-finalizeUpgrade]

[-upgradeProgress status | details | force]

[-metasave filename]

[-refreshServiceAcl]

[-refreshUserToGroupsMappings]

[-refreshSuperUserGroupsConfiguration]

[-printTopology]

[-refreshNamenodes datanodehost:port]

[-deleteBlockPool datanode-host:port blockpoolId [force]]

[-setQuota <quota> <dirname>...<dirname>]

[-clrQuota <dirname>...<dirname>]

[-setSpaceQuota <quota> <dirname>...<dirname>]

[-clrSpaceQuota <dirname>...<dirname>]

[-setBalancerBandwidth <bandwidth in bytes per second>]

[-fetchImage <local directory>]

[-help [cmd]]

參數說明：

-report報告文件系統的基本信息和統計信息。

-safemode enter | leave | get | wait 安全模式維護命令。安全模式是Namenode的一個狀態，這種狀態下，Namenode

1. 不接受對名字空間的更改(只讀)

2. 不復制或刪除塊

Namenode會在啟動時自動進入安全模式，當配置的塊最小百分比數滿足最小的副本數條件時，會自動離開安全模式。安全模式可以手動進入，但是這樣的話也必須手動關閉安全模式。

-refreshNodes 重新讀取hosts和exclude文件，更新允許連到Namenode的或那些需要退出或入編的Datanode的集合。

-finalizeUpgrade 終結HDFS的升級操作。Datanode刪除前一個版本的工作目錄，之后Namenode也這樣做。這個操作完結整個升級過程。

-upgradeProgress status | details | force 請求當前系統的升級狀態，狀態的細節，或者強制升級操作進行。

-metasave filename 保存Namenode的主要數據結構到hadoop.log.dir屬性指定的目錄下的<filename>文件。對於下面的每一項，<filename>中都會一行內容與之對應

1. Namenode收到的Datanode的心跳信號

2. 等待被復制的塊

3. 正在被復制的塊

4. 等待被刪除的塊

-setQuota <quota> <dirname>...<dirname>為每個目錄 <dirname>設定配額<quota>。目錄配額是一個長整型整數，強制限定了目錄樹下的名字個數。

命令會在這個目錄上工作良好，以下情況會報錯：

1. N不是一個正整數，或者

2. 用戶不是管理員，或者

3. 這個目錄不存在或是文件，或者

4. 目錄會馬上超出新設定的配額。

-clrQuota <dirname>...<dirname>為每一個目錄<dirname>清除配額設定。

命令會在這個目錄上工作良好，以下情況會報錯：

1. 這個目錄不存在或是文件，或者

2. 用戶不是管理員。

如果目錄原來沒有配額不會報錯。

-help [cmd]顯示給定命令的幫助信息，如果沒有給定命令，則顯示所有命令的幫助信息。

4) namenode

運行namenode。有關升級，回滾，升級終結的更多信息請參考升級和回滾。

-format格式化namenode。它啟動namenode，格式化namenode，之后關閉namenode。

-upgrade 分發新版本的hadoop后，namenode應以upgrade選項啟動。

-rollback 將namenode回滾到前一版本。這個選項要在停止集群，分發老的hadoop版本后使用。

-finalize finalize會刪除文件系統的前一狀態。最近的升級會被持久化，rollback選項將再不可用，升級終結操作之后，它會停掉namenode。

-importCheckpoint 從檢查點目錄裝載鏡像並保存到當前檢查點目錄，檢查點目錄由fs.checkpoint.dir指定。

http://my.oschina.net/u/120230/blog/102680

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 hadoop入門手冊4：Hadoop【2.7.1】初級入門之命令：文件系統shell1 Hadoop 3.1.1 安裝部署手冊常用Git命令手冊 Linux命令速查手冊 rsync（六）命令中文手冊 CMD命令速查手冊 Linux shell 命令手冊 Linux shc 命令手冊 Hadoop 3.1.1+Spark 2.4 安裝部署手冊安裝中文man手冊（Linux命令手冊）