正則表達式總結,正則表達式匹配不包含某個字符串


1、匹配a標簽及其url:

Regex regA = new Regex(@"<a[\s]+[^<>]*href=(?:""|')([^<>""']+)(?:""|')[^<>]*>([^<>]+)</a>", RegexOptions.IgnoreCase);

說明:在上面的正則表達式中,

用來匹配href屬性前面和后面的各種屬性:

[^<>]*

用來匹配href屬性引號中間的url:

([^<>""']+)

用來匹配a標簽之間的內容:

([^<>]+)

 

2、匹配img標簽及其url:

 Regex regImg = new Regex(@"<img[\s]+[^<>]*src=(?:""|')([^<>""']+(?:\.jpg|\.jpeg|\.png|\.gif))(?:""|')[^<>]*>", RegexOptions.IgnoreCase);

 

3、匹配標簽及標簽中間的內容:

reg = new Regex(@"<dl class=""ksDl"">(?:(?!</dl>)[\s\S])*</dl>", RegexOptions.IgnoreCase);

或:

reg = new Regex(@"<dl class=""ksDl"">(?:(?!class=""ksDl"")[\s\S])*</dl>", RegexOptions.IgnoreCase);

 說明:當html字符串如下時,可以匹配到兩處,

<dl class="ksDl"><div>測試</div></dl>
<dl class="ksDl"><div>測試</div></dl>

如果正則表達式這樣寫:

reg = new Regex(@"<dl class=""ksDl"">[\s\S]*</dl>", RegexOptions.IgnoreCase);

則只能匹配一處。請注意下面這部分的作用,它在匹配中間內容的時候排除了</dl>

(?:(?!</dl>)[\s\S])*

 

4、匹配<#if == and an== and == an9 and i9 == "9i" and 99p==>中的==、an==、== an9、i9 == "9i"和99p==

Regex reg = new Regex(@"([\s]+(?:and){0,1}(?:(?!and)[^\s])*[\s]*==[\s]*(?:(?!and)[^\s>])*[\s]*)", RegexOptions.IgnoreCase);

說明:

(?:(?!and)[^\s])*

表示匹配的字符串不包含and且不包含空白字符

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM