首先,中文字符集為 '^[\\4e00-\\u9fa5]$'
1.如果直接在Hive命令行中使用, 則直接使用 ‘^[\\u4e00-\\u9fa5]$’ 進行匹配
2.如果在終端調用,則需叫上轉義符,如
hive -e "select '中國' rlike ‘^[\\\u4e00-\\\u9fa5]$’"
3.在scala和java中使用 同1;
val regex = new Regex("[\\u4e00-\\u9fa5]") val a = regex.findFirstMatchIn("中國") println(a)