关于正则效率问题(正则导致程序卡死)


前言:

  在Java中,正则的使用需要谨慎,好的正则可以方便我们的代码,但是不好的正则,可能成为黑客攻击的漏洞。类似本例子的正则,黑客可以组织不同的匹配字符,使得校验不过,耗尽服务器资源(资源耗尽攻击)。详见正则的状态机原理。

1.说明:2018/8/17:
    校验输入字符串是否合规,允许:100000000000^145^1^1000.00| 100000000000^145^1^1000.00| ....
    如此序列(100000000000^145^1^1000.00|)必须满足1-18个,19个则失败。
    写正则:reg = ^(\\d{12}\\^\\d{3}\\^[123456]{1}\\^\\d+[\\.\\d+]*\\|){1,18}$
代码:
String regex = "^(\\d{12}\\^\\d{3}\\^[123456]{1}\\^\\d+[\\.\\d+]*\\|){1,18}$";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(prove);
if (!matcher.matches()) {
      return false;
}
return true;

  

2.问题:
    在测试案例中含有18个序列,正常通过。在案例增加到19个序列时,程序卡死。
3.分析:
    正则循环次数过多!导致资源耗尽或死循环。
4.解决方法:
    减少正则校验的循环次数,改为程序循环!,直接传递切割好的数组,再对数组进行循环。
代码:
String[] proves = accountProve.split("\\|");        
 if (proves.length > 18 || proves.length < 1) {
      return false;
  }
 for (String prove : proves) {
     String regex = "^(\\d{12}\\^\\d{3}\\^[123456]{1}\\^\\d+[\\.\\d+]*)$";
     Pattern pattern = Pattern.compile(regex);
     Matcher matcher = pattern.matcher(prove);
     if (!matcher.matches()) {
         return false;
      }
 }
return true;
      

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM