閱讀目錄
本文版權歸mephisto和博客園共有,歡迎轉載,但須保留此段聲明,並給出原文鏈接,謝謝合作。
文章是哥(mephisto)寫的,SourceLink
序
上一篇,我們從發展歷程,架構,MapReduce等方面對比了Hadoop1.x與Hadoop2.x,特別是這這幾年,2.x的發展已經可以適合很多的應用場景了。前面我們通過Eclipse插件來進行文件的上傳,刪除等,下面我們熟悉下Hadoop命令,從而更能直接,強力的對Hadoop進行操作。
下面,我們就開始對Hadoop命令進行粗略的解析。本文有些地方是自己翻譯的,翻譯的不好望見諒。本章節內容較多,還是分為上中下三部分。
概述
一:概述
所有的hadoop命令均由bin/hadoop腳本引發。不指定參數運行hadoop腳本會打印所有命令的描述。
用法:hadoop [--config confdir] [COMMAND] [GENERIC_OPTIONS] [COMMAND_OPTIONS]
Hadoop有一個選項解析框架用於解析一般的選項和運行類。
命令選項 描述 --config confdir 覆蓋缺省配置目錄。缺省是${HADOOP_HOME}/conf。 --loglevel loglevel 覆蓋日志級別. 有效的日志級別是 FATAL, ERROR, WARN, INFO, DEBUG, and TRACE. 默認是 INFO. GENERIC_OPTIONS 多個命令都支持的通用選項。 COMMAND_OPTIONS 各種各樣的命令和它們的選項會在下面提到。 HDFS and YARN 在其他文檔有講解。 二:常規選項
很多子命令 通過配置選項來改變他們的行為。
GENERIC_OPTION 描述 -archives <comma separated list of archives> 指定要在計算機一個逗號分隔的檔案。僅適用於job。 -conf <configuration file> 指定應用程序的配置文件。 -D <property>=<value> 為指定property指定值value。 -files <comma separated list of files> 指定要拷貝到map reduce集群的文件的逗號分隔的列表。 只適用於job。 -jt <local> or <resourcemanager:port> 指定job tracker。只適用於job 。 -libjars <comma seperated list of jars> 指定要包含到classpath中的jar文件的逗號分隔的列表。 只適用於job.
Hadoop Common Commands
一:介紹
所有這些命令都是從Hadoop的shell命令執行。他們被分成用戶命令和管理命令。
User Commands
一:介紹
用於Hadoop集群用戶命令。
二:archive
創建一個hadoop檔案文件。參考 Hadoop Archives Guide.
用法:hadoop archive -archiveName name -p <parent> [-r <replication factor>] <src>* <dest>
-archiveName 你想創造檔案的名字.
-p 制定父路徑,制定了后,后面的src dest都是相對路徑
src 文件系統的路徑名,和通常含正則表達的一樣。
dest 保存檔案文件的目標目錄。
三:checknative
這個命令檢查Hadoop本地代碼的可用性。 See #NativeLibraries.html for more information. 默認情況下,此命令只檢查libhadoop的可用性。
用法: hadoop checknative [-a] [-h]
COMMAND_OPTION Description -a Check all libraries are available. -h print help 四:classpath
打印Hadoop jar和所需的libs的class路徑。
用法: hadoop classpath [--glob |--jar <path> |-h |--help]
COMMAND_OPTION Description --glob expand wildcards --jar path write classpath as manifest in jar named path -h, --help print help 五:credential
用於管理 credentials, passwords and secrets
用法: hadoop credential <subcommand> [options]
COMMAND_OPTION Description create alias [-provider provider-path] Prompts the user for a credential to be stored as the given alias. The hadoop.security.credential.provider.path within the core-site.xml file will be used unless a -provider is indicated. delete alias [-provider provider-path] [-f] Deletes the credential with the provided alias. The hadoop.security.credential.provider.path within the core-site.xml file will be used unless a -provider is indicated. The command asks for confirmation unless -f is specified list [-provider provider-path] Lists all of the credential aliases The hadoop.security.credential.provider.path within the core-site.xml file will be used unless a -provider is indicated. 六:distcp
遞歸復制文件或目錄. More information can be found at Hadoop DistCp Guide.
七:fs
這個命令在 File System Shell Guide描述. 在HDFS使用中,hdfs,dfs是相同的。
八:jar
執行一個jar文件。使用yarn jar來運行Yarn app來代替。
使用: hadoop jar <jar> [mainClass] args...
九:key
通過KeyProvider來管理keys。
十:trace
查看和修改Hadoop tracing 設置。 See the Tracing Guide.
十一:version
打印版本
用法:hadoop version
十二:CLASSNAME
腳本可用於調調用任何類
用法:hadoop CLASSNAME
Administration Commands
一:介紹
用於管理Hadoop cluster
二:daemonlog
獲取/設置在后台Log的級別
用法:hadoop daemonlog -getlevel <host:httpport> <classname>
hadoop daemonlog -setlevel <host:httpport> <classname> <level>例如: $ bin/hadoop daemonlog -setlevel 127.0.0.1:50070 org.apache.hadoop.hdfs.server.namenode.NameNode DEBUG
File System Shell
一:介紹
調用文件系統(FS)Shell命令應使用 bin/hadoop fs <args>的形式。 所有的的FS shell命令使用URI路徑作為參數。URI格式是scheme://authority/path。對HDFS文件系統,scheme是hdfs,對本地文件系統,scheme是file。其中scheme和authority參數都是可選的,如果未加指定,就會使用配置中指定的默認scheme。一個HDFS文件或目錄比如/parent/child可以表示成hdfs://namenode:namenodeport/parent/child,或者更簡單的/parent/child(假設你配置文件中的默認值是namenode:namenodeport)。大多數FS Shell命令的行為和對應的Unix Shell命令類似,不同之處會在下面介紹各命令使用詳情時指出。出錯信息會輸出到stderr,其他信息輸出到stdout。
二:appendToFile
附加單個或多個src從本地文件系統到目標文件系統,另外從stdin讀取輸入並追加到目標文件系統。
用法: hadoop fs -appendToFile <localsrc> ... <dst>
三:cat
將路徑指定文件的內容輸出到stdout。
用法: hadoop fs -cat URI [URI ...]
四:checksum
返回文件的校驗信息。
用法: hadoop fs -checksum URI
五:chgrp
改變文件所屬的組。使用-R將使改變在目錄結構下遞歸進行。命令的使用者必須是文件的所有者或者超級用戶
用法: hadoop fs -chgrp [-R] GROUP URI [URI ...]
六:chmod
改變文件的權限。使用-R將使改變在目錄結構下遞歸進行。命令的使用者必須是文件的所有者或者超級用戶
用法: hadoop fs -chmod [-R] <MODE[,MODE]... | OCTALMODE> URI [URI ...]
七:chown
改變文件的擁有者。使用-R將使改變在目錄結構下遞歸進行。命令的使用者必須是超級用戶
用法:hadoop fs -chown [-R] [OWNER][:[GROUP]] URI [URI ]
八:copyFromLocal
除了限定源路徑是一個本地文件外,和put命令相似。
用法:hadoop fs -copyFromLocal <localsrc> URI
九:copyToLocal
除了限定目標路徑是一個本地文件外,和get命令類似。
用法: hadoop fs -copyToLocal [-ignorecrc] [-crc] URI <localdst>
十:count
計算在匹配指定文件模式的路徑下的目錄、文件和字節數
用法: hadoop fs -count [-q] [-h] [-v] <paths>
十一:cp
將文件從源路徑復制到目標路徑。這個命令允許有多個源路徑,此時目標路徑必須是一個目錄。
用法: hadoop fs -cp [-f] [-p | -p[topax]] URI [URI ...] <dest>
十二:createSnapshot
See HDFS Snapshots Guide.
十三:deleteSnapshot
See HDFS Snapshots Guide.
十四:df
顯示free空間。
用法: hadoop fs -df [-h] URI [URI ...]
十五:du
顯示目錄中所有文件的大小,或者當只指定一個文件時,顯示此文件的大小
用法: hadoop fs -dus <args>
十六:expunge
清空回收站。請參考HDFS Architecture Guide以獲取更多關於回收站特性的信息。
用法: hadoop fs -expunge
十七:find
查找與指定表達式匹配的所有文件,並將選定的操作應用於它們。如果沒有指定路徑,則默認為當前工作目錄。如果沒有指定表達式,則默認為打印。
用法: hadoop fs -find <path> ... <expression> ...
十八:get
復制文件到本地文件系統。可用-ignorecrc選項復制CRC校驗失敗的文件。使用-crc選項復制文件以及CRC信息。
用法: hadoop fs -getfacl [-R] <path>
十九:getfacl
顯示訪問控制列表(ACL)的文件和目錄。如果一個目錄中有一個默認的ACL,然后getfacl也顯示默認的ACL。
用法: hadoop fs -getfacl [-R] <path>
二十:getfattr
顯示文件或目錄的擴展屬性名和值(如果有的話)
用法: hadoop fs -getfattr [-R] -n name | -d [-e en] <path>
二十一:getmerge
接受一個源目錄和一個目標文件作為輸入,並且將源目錄中所有的文件連接成本地目標文件。addnl是可選的,用於指定在每個文件結尾添加一個換行符。
用法: hadoop fs -getmerge <src> <localdst> [addnl]
二十二:help
返回使用輸出
用法: hadoop fs -help
二十三:ls
如果是文件,則按照如下格式返回文件信息:
文件名 <副本數> 文件大小 修改日期 修改時間 權限 用戶ID 組ID
如果是目錄,則返回它直接子文件的一個列表,就像在Unix中一樣。目錄返回列表的信息如下:
目錄名 <dir> 修改日期 修改時間 權限 用戶ID 組ID用法: hadoop fs -ls [-d] [-h] [-R] [-t] [-S] [-r] [-u] <args>
二十四:lsr
ls命令的遞歸版本。類似於Unix中的ls -R。
用法: hadoop fs -lsr <args>
二十五:mkdir
接受路徑指定的uri作為參數,創建這些目錄。其行為類似於Unix的mkdir -p,它會創建路徑中的各級父目錄。
用法: hadoop fs -mkdir [-p] <paths>
二十六:moveFromLocal
類似put的用法,在copy后除了source localsrc都刪除。
用法: hadoop fs -moveFromLocal <localsrc> <dst>
二十七:moveToLocal
輸出一個”not implemented“信息。
用法: hadoop fs -moveToLocal [-crc] <src> <dst>
二十八:mv
將文件從源路徑移動到目標路徑。這個命令允許有多個源路徑,此時目標路徑必須是一個目錄。不允許在不同的文件系統間移動文件。
用法: hadoop fs -mv URI [URI ...] <dest>
二十九:put
從本地文件系統中復制單個或多個源路徑到目標文件系統。也支持從標准輸入中讀取輸入寫入目標文件系統。
用法: hadoop fs -put <localsrc> ... <dst>
三十:renameSnapshot
See HDFS Snapshots Guide.
三十一:rm
刪除指定的文件。只刪除非空目錄和文件。請參考rmr命令了解遞歸刪除。
用法: hadoop fs -rm [-f] [-r |-R] [-skipTrash] URI [URI ...]
三十二:rmdir
刪除一個文件夾
用法: hadoop fs -rmdir [--ignore-fail-on-non-empty] URI [URI ...]
三十三:rmr
delete的遞歸版本。
用法: hadoop fs -rmr [-skipTrash] URI [URI ...]
三十四:setfacl
設置訪問控制列表(ACL)的文件和目錄
用法: hadoop fs -setfacl [-R] [-b |-k -m |-x <acl_spec> <path>] |[--set <acl_spec> <path>]
三十五:setfattr
設置一個文件或目錄的擴展屬性名和值
用法: hadoop fs -setfattr -n name [-v value] | -x name <path>
三十六:setrep
改變一個文件的副本系數。-R選項用於遞歸改變目錄下所有文件的副本系數。
用法: hadoop fs -setrep [-R] [-w] <numReplicas> <path>
三十七: stat
返回指定路徑的統計信息。
用法: hadoop fs -stat [format] <path> ...
三十八:tail
將文件尾部1K字節的內容輸出到stdout。支持-f選項,行為和Unix中一致。
用法: hadoop fs -tail [-f] URI
三十九:test
選項:
-e 檢查文件是否存在。如果存在則返回0。
-z 檢查文件是否是0字節。如果是則返回0。
-d 如果路徑是個目錄,則返回1,否則返回0。用法: hadoop fs -test -[defsz] URI
四十:text
將源文件輸出為文本格式。允許的格式是zip和TextRecordInputStream。
用法: hadoop fs -text <src>
四十一:touchz
創建一個0字節的空文件。
用法: hadoop fs -touchz URI [URI ...]
四十二:truncate
截斷指定文件模式指定的長度匹配的所有文件。
用法: hadoop fs -truncate [-w] <length> <paths>
四十三:usage
返回單個命令的幫助。
用法: hadoop fs -usage command
--------------------------------------------------------------------
到此,本章節的內容講述完畢。
引用
Apache hadoop commands:http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/CommandsManual.html
Apache File System Shell:http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/FileSystemShell.html
Apache 1.04 中文:http://hadoop.apache.org/docs/r1.0.4/cn/commands_manual.html
系列索引
本文版權歸mephisto和博客園共有,歡迎轉載,但須保留此段聲明,並給出原文鏈接,謝謝合作。
文章是哥(mephisto)寫的,SourceLink
