原文:用shell獲得hadoop中mapreduce任務運行結果的狀態

在近期的工作中,我需要用腳本來運行mapreduce,並且要判斷運行的結果,根據結果來做下一步的動作。 開始我想到shell中獲得上一條命令運行結果的方法,即判斷 的值 但是有時候即便mapreduce運行失敗了,也還是會進入判斷結構中。 后來查閱了相關資料,得知hadoop中可以使用yarn的命令,來獲得job的狀態,包括job名稱 完成百分比 當前狀態等參數,其實就和yarn的web界面查看到 ...

2016-07-27 16:53 0 4077 推薦指數:

查看詳情

hadoopmapreduce任務從本地提交到hadoop集群上運行

MapReduce任務有三種運行方式: 1、windows(linux)本地調試運行,需要本地hadoop環境支持 2、本地編譯成jar包,手動發送到hadoop集群上用hadoop jar或者yarn jar方式運行。 3、本地編譯環境在IDE里直接提交到集群上運行,實際上這種方式 ...

Sun Feb 03 05:04:00 CST 2019 0 1690
Java開發的mapreduce如何在hadoop運行

最近在學習hadoop,安裝的版本是hadoop2.7.3。 思考着如何把編寫好的mapreduce內容部署到hadoop運行這個程序,下面記錄了這部分實踐內容。上面代碼打包 hadoop-test.jar,打包方式任選。 上傳包到部署有hadoop的機器上,本例 ...

Wed Jul 26 18:55:00 CST 2017 0 2095
Hadoop(六)MapReduce的入門與運行原理

MapReduce入門 1.1 MapReduce定義 Mapreduce是一個分布式運算程序的編程框架,是用戶開發“基於hadoop的數據分析應用”的核心框架; Mapreduce核心功能是將用戶編寫的業務邏輯代碼和自帶默認組件整合成一個完整的分布式運算程序,並發運行在一個hadoop ...

Sun May 27 03:40:00 CST 2018 0 2421
[Hadoop]MapReduce的InputSplit

在查看數據塊的如何處理之前,我們需要更仔細地了解Hadoop如何存儲數據。在Hadoop,文件由一個一個的記錄組成,最終由mapper任務一個一個的處理。 例如,示例數據集包含有關1987至2008年間美國境內已完成航班的信息。如果要下載數據集可以打開如下網址: http ...

Thu Dec 21 05:32:00 CST 2017 0 1142
Hadoop(4)MapReduce 任務的推測(speculative)執行

Straggle(掉隊者)是指那些跑的很慢但最終會成功完成的任務。一個掉隊的Map任務會阻止Reduce任務開始執行。 Hadoop不能自動糾正掉隊任務,但是可以識別那些跑的比較慢的任務,然后它會產生另一個等效的任務作為備份,並使用首先完成的那個任務的結果,此時另外一個任務則會被要求停止執行 ...

Wed Aug 15 23:19:00 CST 2018 0 878
HadoopMapReduce筆記(二):MapReduce容錯,任務失敗處理

典型問題:Hadoop如何判斷一個任務失敗?失敗了怎么做? 分析:實際情況下,用戶代碼存在軟件錯誤、進程崩潰、機器故障等都會導致失敗。Hadoop判斷的失敗有不同級別類型,針對不同級別的失敗有不同的處理對策,這就是MapReduce的容錯機制。下面是幾個不同級別失敗的分類: 一、任務失敗 ...

Tue Sep 23 20:30:00 CST 2014 0 3593
Hadoop 2.6 MapReduce運行原理詳解

  市面上的hadoop權威指南一類的都是老版本的書籍了,索性學習並翻譯了下最新版的Hadoop:The Definitive Guide, 4th Edition與大家共同學習。   我們通過提交jar包,進行MapReduce處理,那么整個運行過程分為五個環節:   1、向client端 ...

Sun Jun 05 08:48:00 CST 2016 1 8047
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM