這篇文章主要介紹了通過正則表達式准確匹配出字符串中存在的中文漢字,同時還有匹配雙字節字符的正則,需要的朋友可以參考下
\w匹配的僅僅是中文,數字,字母,但是對於特殊需求來講,僅匹配中文時常會用到
匹配中文字符的正則表達式: [\u4e00-\u9fa5]
或許你也需要匹配雙字節字符,中文也是雙字節的字符
匹配雙字節字符(包括漢字在內):[^\x00-\xff]
以下圖為例:我想要的僅僅只是某一標題下的文章的來源,但是下面的正則就匹配到了多少分鍾前,多少小時前這顯然不是我想要的,這種情況下我就需要只取這個正則塊中所有的中文漢字
下圖既是通過匹配中文字符的正則表達式獲得結果: