首先,中文字符集为 '^[\\4e00-\\u9fa5]$'
1.如果直接在Hive命令行中使用, 则直接使用 ‘^[\\u4e00-\\u9fa5]$’ 进行匹配
2.如果在终端调用,则需叫上转义符,如
hive -e "select '中国' rlike ‘^[\\\u4e00-\\\u9fa5]$’"
3.在scala和java中使用 同1;
val regex = new Regex("[\\u4e00-\\u9fa5]") val a = regex.findFirstMatchIn("中国") println(a)