最近需要對HTTP請求合法性做一些校驗,在網上查找了一些關於URL合法性的正則表達式。
在github上的有個關於weburl匹配的gist:
https://gist.github.com/dperini/729294
下面是測試結果。
https://mathiasbynens.be/demo/url-regex
其中效果最好的,只誤判了一個樣例。
diegoperini
_^(?:(?:https?|ftp)://)(?:\S+(?::\S*)?@)?(?:(?!10(?:\.\d{1,3}){3})(?!127(?:\.\d{1,3}){3})(?!169\.254(?:\.\d{1,3}){2})(?!192\.168(?:\.\d{1,3}){2})(?!172\.(?:1[6-9]|2\d|3[0-1])(?:\.\d{1,3}){2})(?:[1-9]\d?|1\d\d|2[01]\d|22[0-3])(?:\.(?:1?\d{1,2}|2[0-4]\d|25[0-5])){2}(?:\.(?:[1-9]\d?|1\d\d|2[0-4]\d|25[0-4]))|(?:(?:[a-z\x{00a1}-\x{ffff}0-9]+-?)*[a-z\x{00a1}-\x{ffff}0-9]+)(?:\.(?:[a-z\x{00a1}-\x{ffff}0-9]+-?)*[a-z\x{00a1}-\x{ffff}0-9]+)*(?:\.(?:[a-z\x{00a1}-\x{ffff}]{2,})))(?::\d{2,5})?(?:/[^\s]*)?$_iuS
PS,這個正則不支持ipv6地址,不同環境下應用似乎需要進行一下修改
另外,推薦一個在線正則匹配的鏈接https://regex101.com/。
功能比較全,支持多種風格的正則匹配,自動標識無法解析的正則部分。