引言
Hive 中的默認分隔符是 ^A (\001) ,這是一種特殊的分隔符,使用的是 ASCII 編碼的值,鍵盤是打不出來的
查看 Hive 默認分隔符文件
Linux 上的文件
- 以 \001 作為分隔符時,下載后用 notePad++ 打開時看到的 SOH
- 以 \002 作為分隔符時,下載后用notePad++打開時看到的 STX,
- 以 \003 作為分隔符時,下載后用notePad++打開時看到的 ETX;
"\001" “\002” "\003"分隔是程序代碼中進行解析需要的。
所以,notePad++ 打開后顯示的分隔符正常
如何編寫 Hive 默認分隔符文件
- 方法一:notePad++ 字符面板
從 ASCII 輸入面板中選擇需要輸入的字符即可
- 方法二:字符替換
通過字符替換輸入八進制的 ASCII 碼,可以實現輸入特殊字符