這兩天突然想到了臟字過濾 就結合網上找到的資料自己寫了一個,臟字數量700+(效率不是很高 測試在110多KB的情況下比replace快 3-4倍)
測試結果圖 單位:秒

代碼
System.Text.StringBuilder sb = new System.Text.StringBuilder(text.Length);
string filterText = "需要過濾的臟字 以|分開";//臟字 可根據自己的方式用分隔符
string[] filterData = filterText.Split('|');
foreach (var item in filterData)
{
char value = item[0];
if (dicList.ContainsKey(value))
dicList[value].Add(item);
else
dicList.Add(value, new List<string>() { item });
}
int count = text.Length;
for (int i = 0; i < count; i++)
{
char word = text[i];
if (dicList.ContainsKey(word))//如果在字典表中存在這個key
{
int num = 0;//是否找到匹配的關鍵字 1找到0未找到
var data = dicList[word].OrderBy(g => g.Length);//把該key的字典集合按 字符數排序(方便下面從少往多截取字符串查找)
foreach (var wordbook in data)
{
if (i + wordbook.Length <= count)//如果需截取的字符串的索引小於總長度 則執行截取
{
string result = text.Substring(i, wordbook.Length);//根據關鍵字長度往后截取相同的字符數進行比較
if (result == wordbook)
{
num = 1;
sb.Append(GetString(result));
i = i + wordbook.Length - 1;//比較成功 同時改變i的索引
break;
}
}
}
if (num == 0)
sb.Append(word);
}
else
sb.Append(word);
}
return sb.ToString();
}
/// <summary>
/// 替換星號
/// </summary>
/// <param name="value"></param>
/// <returns></returns>
private static string GetString(string value)
{
string starNum = string.Empty;
for (int i = 0; i < value.Length; i++)
{
starNum += "*";
}
return starNum;
}
還有待優化的地方
各位有更好的方法 還請分享指點一下 說明原理
