常用正則表達式—郵箱(Email)


常用正則表達式—郵箱(Email)

 本文針對有一點正則基礎的同學,如果你對正則一無所知,請移步“正則表達式30分鍾入門教程”學習。

 要驗證一個字符串是否為郵箱的話,首先要了解郵箱賬號的格式。我嘗試過在網上找出一個標准的格式,但是很遺憾我沒有找到。我也嘗試使用RFC標准來判斷郵箱的格式,但是也沒有結果。網上些博客說不應該使用RFC標准來驗證郵箱是否合法,有興趣的可以看看“is this email valid?”和“Don’t RFC-Validate Email Addresses”。據了解【參考】,現在用中文命名的郵箱也合法了,比如“楊元慶@聯想.中國”。

 雖然沒有統一的郵箱賬號格式,但是所有郵箱都符合“名稱@域名”的規律。對於名稱和域名的字符限制,我們可以根據項目的情況定義一個,比如只允許有英文、數字、下划線等組成。下面舉例實現一些驗證郵箱格式的正則表達式。 

實例1、只允許英文字母、數字、下划線、英文句號、以及中划線組成

舉例:zhangsan-001@gmail.com 
分析郵件名稱部分:

  • 26個大小寫英文字母表示為a-zA-Z
  • 數字表示為0-9
  • 下划線表示為_
  • 中划線表示為-
  • 由於名稱是由若干個字母、數字、下划線和中划線組成,所以需要用到+表示多次出現

 根據以上條件得出郵件名稱表達式:[a-zA-Z0-9_-]+ 


分析域名部分:

 一般域名的規律為“[N級域名][三級域名.]二級域名.頂級域名”,比如“qq.com”、“www.qq.com”、“mp.weixin.qq.com”、“12-34.com.cn”,分析可得域名類似“** .**  .** .**”組成。

  • “**”部分可以表示為[a-zA-Z0-9_-]+
  • “.**”部分可以表示為\.[a-zA-Z0-9_-]+
  • 多個“.**”可以表示為(\.[a-zA-Z0-9_-]+)+

 綜上所述,域名部分可以表示為[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+

最終表達式: 
 由於郵箱的基本格式為“名稱@域名”,需要使用“^”匹配郵箱的開始部分,用“$”匹配郵箱結束部分以保證郵箱前后不能有其他字符,所以最終郵箱的正則表達式為: 
  ^[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+$

 

實例2、名稱允許漢字、字母、數字,域名只允許英文域名

舉例:楊元慶001Abc@lenovo.com.cn

分析郵件名稱部分:

  • 漢字在正則表示為[\u4e00-\u9fa5]
  • 字母和數字表示為A-Za-z0-9 
     通過分析得出郵件名稱部分表達式為[A-Za-z0-9\u4e00-\u9fa5]+

分析郵件域名部分

 郵件部分可以參考實例1中的分析域名部分。 
 得出域名部分的表達式為[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+

最終表達式: 
 我們用@符號將郵箱的名稱和域名拼接起來,因此完整的郵箱表達式為 
  ^[A-Za-z0-9\u4e00-\u9fa5]+@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+$

 

 

轉自http://blog.csdn.net/make164492212/article/details/51656638


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM