hive 正則表達式 匹配中文


例如:要取出收件人 *的

select regexp_extract('收件人為小明的15622150839','收件人為([\\u4E00-\\u9FFF]+)的',1 ) from tmp.t_gg  limit 1;
select regexp_extract('收件人為小明的15622150839','收件人為([啊-龥]+)的',0 ) from tmp.t_gg  limit 1;

select regexp_extract('收件人為小明的15622150839','收件人為([\\u4E00-\\u9FA5]+)的',1 ) from tmp.t_gg  limit 1;

如果要取出手機號碼

select regexp_extract('你好,李先生你的電話是15622150839','電話是([0-9])+',0 ) from tmp.t_gg  limit 1;

regexp_extract函數

 

語法:    regexp_extract(string subject,  string pattern,  int index)

返回值: string

說明:  將字符串subject按照pattern正則表達式的規則拆分,返回index指定的字符。

第一參數:   要處理的字段

第二參數:    需要匹配的正則表達式

第三個參數:

  • 0是顯示與之匹配的整個字符串
  • 1 是顯示第一個括號里面的
  • 2 是顯示第二個括號里面的字段

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM