在工作的項目當中,經運營人員的反饋,發現提供服務的指定屬性字段的值為空,導致搜索引擎無法正常搜索到正確的結果。
原始的字符串提取程序為:
// 只取對應符號分割的第一部分
name.split("_|\\(|(")[0].trim();
因此對於"(*)*"之類的字符串,則會提取為相應的空值,所以做了如下優化,提取成對括號中的內容及括號外的內容:
// 提取成對括號內的字符串 public static String extractBracketInnerStr(String str) { if(!str.contains("(") || !str.contains(")")){ return ""; } List<String> result = Lists.newArrayList(); int m = 0, n = 0, count = 0; for(int i = 0; i < str.length(); i++){ if(str.charAt(i) == '('){ if(count == 0) m = i; count ++; } if(str.charAt(i) == ')'){ count--; if (count == 0) { n = i; result.add(str.substring(m+1,n).trim()); } } } // 檢驗括號是否配對 if(count != 0){ return ""; } return StringUtils.join(" ",result); } // 提取成對括號外的字符串 public static String extractBracketOuterStr(String str) { if(!str.contains("(") || !str.contains(")")){ return str; } List<String> result = Lists.newArrayList(); int m = 0,n = 0, count = 0; for(int i = 0; i < str.length(); i++){ if(str.charAt(i) == '('){ if(count == 0) { m = i; result.add(str.substring(n,m).trim()); } count ++; } if(str.charAt(i) == ')'){ count--; if (count == 0) { n = i+1; } } } if(n < str.length()){ result.add(str.substring(n)); } // 檢驗括號是否配對 if(count != 0){ return str; } return StringUtils.join(" ",result); }