關於Hive正則匹配中文字符串的問題


首先,中文字符集為 '^[\\4e00-\\u9fa5]$'

1.如果直接在Hive命令行中使用, 則直接使用 ‘^[\\u4e00-\\u9fa5]$’ 進行匹配

 

2.如果在終端調用,則需叫上轉義符,如

hive -e "select '中國'  rlike ‘^[\\\u4e00-\\\u9fa5]$’"

 

3.在scala和java中使用 同1;

val regex = new Regex("[\\u4e00-\\u9fa5]")
val a = regex.findFirstMatchIn("中國")
println(a)

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM