使用索引是數據庫性能優化的必備技能之一。在MySQL數據庫中,有四種索引:聚集索引(主鍵索引)、普通索引、唯一索引以及我們這里將要介紹的全文索引(FULLTEXT INDEX)。
全文索引(也稱全文檢索)是目前搜索引擎使用的一種關鍵技術。它能夠利用「分詞技術「等多種算法智能分析出文本文字中關鍵字詞的頻率及重要性,然后按照一定的算法規則智能地篩選出我們想要的搜索結果。在這里,我們就不追根究底其底層實現原理了,現在我們來看看在MySQL中如何創建並使用全文索引。
在MySQL中,創建全文索引相對比較簡單。例如,我們有一個文章表(article
),其中有主鍵ID(id
)、文章標題(title
)、文章內容(content
)三個字段。現在我們希望能夠在title
和content
兩個列上創建全文索引,article
表及全文索引的創建SQL語句如下:
- --創建article表
- CREATE TABLE article (
- id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY,
- title VARCHAR(200),
- content TEXT,
- FULLTEXT (title, content) --在title和content列上創建全文索引
- );
上面就是在創建表的同時建立全文索引的SQL示例。此外,如果我們想要給已經存在的表的指定字段創建全文索引,同樣以article
表為例,我們可以使用如下SQL語句進行創建:
- --給現有的article表的title和content字段創建全文索引
- --索引名稱為fulltext_article
- ALTER TABLE article
- ADD FULLTEXT INDEX fulltext_article (title, content)
在MySQL中創建全文索引之后,現在就該了解如何使用了。眾所周知,在數據庫中進行模糊查詢是使用LIKE
關鍵字進行查詢,例如:
SELECT * FROM article WHERE content LIKE '%查詢字符串%'
那么,我們使用全文索引也是這樣用的嗎?當然不是,我們必須使用特有的語法才能使用全文索引進行查詢。例如,我們想要在article
表的title
和content
列中全文檢索指定的查詢字符串,可以如下編寫SQL語句:
SELECT * FROM article WHERE MATCH(title, content) AGAINST('查詢字符串')
強烈注意:MySQL自帶的全文索引只能用於數據庫引擎為MyISAM的數據表,如果是其他數據引擎,則全文索引不會生效。此外,MySQL自帶的全文索引只能對英文進行全文檢索,目前無法對中文進行全文檢索。如果需要對包含中文在內的文本數據進行全文檢索,我們需要采用Sphinx(斯芬克斯)/Coreseek技術來處理中文。本站將會在后續文章中對Sphinx以及Coreseek進行介紹。
備注1:目前,使用MySQL自帶的全文索引時,如果查詢字符串的長度過短將無法得到期望的搜索結果。MySQL全文索引所能找到的詞的默認最小長度為4個字符。另外,如果查詢的字符串包含停止詞,那么該停止詞將會被忽略。
備注2:如果可能,請盡量先創建表並插入所有數據后再創建全文索引,而不要在創建表時就直接創建全文索引,因為前者比后者的全文索引效率要高。
本文出自:http://www.365mini.com/page/mysql-create-fulltext-index.htm
推薦:http://www.cnblogs.com/tommy-huang/p/4483684.html