出現這個問題, 我首先去找了一下幾個問題:
1.文件是否是utf-8
2.上傳到Linux中的hadoop, 在Linux下去查看是否亂碼
3.上面都沒有問題, 就去檢查eclipse,將項目工程改成了utf-8, 發現不行
4.看了一下的介紹, 將eclipse的系統設置改成了uft-8, 就可以了
eclipse中UTF-8設置
1.windows->Preferences 打開"首選項"對話框;
2.然后,general->Workspace,右側Text file encoding,選擇Other,改變為UTF-8。
3.Web->打開,把CSS、HTML、JSP、JavaScript、 XML等設置為UTF-8。
或在這里更改,general->Content Types,右側Context Types樹,點開Text,選擇Java Source File,在下面的Default encoding輸入框中輸入UTF-8,點Update,則設置Java文件編碼為UTF-8。其他如果需要更改,方法一樣。
4.java->Installed JREs.
移除原來Eclipse自帶的Jdk6.0,從新配置Jdk 1.6.0_06(Add:在C盤,Programe里的Java文件下。C:\Program Files\Java)
另外,
myeclipse中UTF-8設置
同樣,
1Window 選項下---preferences選項;
2打開preferences->General->workspace,設置UTF-8;
3同樣是preferences->MyEclipse->Files and Editors ->CSS、HTML、JSP、JavaScript、XML等設置UTF-8。
4同樣是preferences->java->Installed JREs:移除原來的MyEclipse自帶的Jdk6.0,從新配置Jdk1.6.0_06(Add:在C盤,Programe里的Java文件下)。
修改原因:
如果要使插件開發應用能有更好的國際化支持,能夠最大程度的支持中 文輸出,則最好使 Java文件使用 UTF-8編碼。然而,Eclipse工作空 間(workspace)的缺省字符編碼是操作系統缺省的編碼,簡體中文操作系統 (Windows XP、Windows
2000簡體中文)的缺省編碼是GB18030,在此工作空間中建立的工程編碼是GB18030,工程中建立的java文件也是GB18030。如果要使 新建立工程、java文件直接使UTF-8則需要做上面的工作,不容忽略。