在上段文字中提取税额的金额:
//创建正则模版 String REGEX="(税额|税款)\\d+.?\\d+(元|万元|万)?"; //绑定模版 Pattern p=Pattern.compile(REGEX); //content为文本 Matcher m=p.matcher(content); //文本中可能有多个税额,用循环提出每个税额 while(m.find()){ money = content.substring(m.start(),m.end()); }
正则表达式的含义:
(税额|税款):以税额或税款开头,
\d+:出现一次或多次数字,
.?:出现一次或0次小数点
(元|万元|万)?:以元/万元/万结尾,也可能是纯数字,后面没有单位,所以加?