問題描述:
hadoop在虛擬機中的linux系統下
在本地通過eclipse編寫代碼把本地文件上傳至hadoop平台的指定目錄
代碼如下:
@Test public void upload() throws IOException { Configuration conf = new Configuration(); conf.set("fs.defaultFS", "hdfs://lujie01:9000/"); FileSystem fs = FileSystem.get(conf); Path path = new Path("hdfs://lujie01:9000/aa/lulu.txt"); FSDataOutputStream outputStream = fs.create(path); FileInputStream inputStream = new FileInputStream("D:/lulu.txt"); IOUtils.copy(inputStream, outputStream); }
文件上傳有更加簡單的方法:
直接使用FileSystem的copyFromLocalFile方法
fs.copyFromLocalFile(new Path("D:/lulu.txt"), new Path("hdfs://lujie01:9000/aa/lulu.txt"));
在沒有設定用戶或者更改hadoop下/aa文件夾的權限之前,本機的用戶身份無法通過hadoop的認證,導致無法上傳
錯誤如下:
解決方法一:
把/aa文件夾的權限設為任何用戶都可讀可寫可操作
再次執行測試程序,正常運行,通過客戶端可以查看aa中的文件lulu.txt。表示已上傳成功,注意這里的owner是lujie,電腦本地的用戶名
解決方法二:
在Run Configuration中設置Arguments,把用戶名改為Linux系統的用戶名hadoop
解決方法三:
直接在代碼中指定用戶為hadoop
FileSystem fs = FileSystem.get(new URI("hdfs://lujie01:9000/"),conf,"hadoop");
@Test public void upload() throws IOException, InterruptedException, URISyntaxException { Configuration conf = new Configuration(); conf.set("fs.defaultFS", "hdfs://lujie01:9000/"); FileSystem fs = FileSystem.get(new URI("hdfs://lujie01:9000/"),conf,"hadoop"); Path path = new Path("hdfs://lujie01:9000/aa/lulu1.txt"); FSDataOutputStream outputStream = fs.create(path); FileInputStream inputStream = new FileInputStream("D:/lulu.txt"); IOUtils.copy(inputStream, outputStream); }
上傳成功后,在客戶端查看