
版權聲明:本文為博主原創文章,未經博主允許不得轉載。
SerDe
SerDe 是 Serialize/Deserilize 的簡稱,目的是用於序列化和反序列化。序列化的格式包括:
- 分隔符(tab、逗號、CTRL-A)
- Thrift 協議
反序列化(內存內):
- Java Integer/String/ArrayList/HashMap
- Hadoop Writable 類
- 用戶自定義類
查看表結構方法有兩種:
- desc tableName
- desc formatted tableName
修改表中的序列化分隔符:
- hive> alter table store set SERDEPROPERTIES('field.delim'='\t');
參考資料:
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDDL-AlterTableProperties