C# 正則表達式 —— 中文/英文空格（全角/半角空格）處理

本文轉載自查看原文 2021-07-28 13:20 141 日常小結

1. 匹配中文（全角）空格

Regex.IsMatch("　", "\u3000");

\u3000是全角空格的16進制Unicode編碼。

2. 匹配英文（半角）空格

Regex.IsMatch(" ", "\u0020")

\u0020是半角空格的16進制Unicode編碼。

3. 去除中文字符之間的英文（半角）空格

string text = "<p>　測 試 test1. 一下</p>";
var result = Regex.Replace(text, "(?<=[\u4e00-\u9fa5])(\u0020)(?=[\u4e00-\u9fa5])", string.Empty);
Console.WriteLine(result);
//結果是：<p>　測試 test1. 一下</p>

(?=[\u4e00-\u9fa5]) 表示“正向預搜索”一個中文字符，判斷\u0020的右側是否為中文字符。

(?<=[\u4e00-\u9fa5]) 表示“反向預搜索”一個中文字符，判斷\u0020的左側是否為中文字符。

4. 在中文字符與英文字符之間增加空格

string text = "<p>　test測試test1. 一hello下</p>";            
text = Regex.Replace(text, @"(?<=[\u4e00-\u9fa5])([a-zA-Z])(?=[a-zA-Z])", " $1");
text = Regex.Replace(text, @"(?<=[a-zA-Z])([a-zA-Z])(?=[\u4e00-\u9fa5])", "$1 ");
Console.WriteLine(text);
//輸出結果：<p>　test 測試 test1. 一 hello 下</p>

第一個正則表達式是針對“左中文，右英文”的情況。

第二個正則表達式是針對“左英文，右中文”的情況。

有關中文的正則表達式

1、判斷字符串是否為連續的中文字符(不包含英文及其他任何符號和數字)：
Regex.IsMatch("中文","^[\u4e00-\u9fa5]+$")；
2、判斷字符串是否為中文字符串(僅不包含英文但可以包含其他符號及數字)：
！Regex.IsMatch("中文",@"[a-zA-Z]")；

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 正則表達式--只能中文，英文，數字以及/ \\ * 空格 C# 正則表達式匹配中文和字母 C#正則表達式 PHP把空格、換行符、中文逗號等替換成英文逗號的正則表達式 js各類正則表達式(中文、字母、數字、全角) 判斷是否英文字母或數字的C#正則表達式正則表達式匹配【全角字符】正則表達式第五篇：C# 正則表達式 [c#] 用正則表達式和js輕松處理json文本 C# IP正則表達式