最近老大給了一個需求,是要寫一個姓名的模糊查詢。
問題很簡單,難度在於這張表有將近500W條數據。
如果要做中文的模糊查詢,效率簡直慘不忍睹。
網上查了一下資料,發現全文索引挺符合我的需要的。
結果,使用下來。其實並不太符合我的要求。
全文索引的最小單位是詞,如果不是在 in boolean mode 下是沒辦法 查詢的
其次,全文索引只支持 半模糊查詢,我所謂的半模糊就是 xx like 'xx%'
如果使用全模糊查詢,建完索引之后,用 like 或者用 regexp 在常用關鍵詞的時候 確實快很多。
可以控制在0.1左右
不過低頻詞還是很慢 需要10S
所以,基於這種情況,可能還是做分表比較好
或者修改需求 做半模糊查詢。
下面是參考的資料
MySQL中的全文檢索(1)
