MySQL全文索引應(yīng)用簡(jiǎn)明教程
本文從以下幾個(gè)方面介紹下MySQL全文索引的基礎(chǔ)知識(shí):
- MySQL全文索引的幾個(gè)注意事項(xiàng)
- 全文索引的語(yǔ)法
- 幾種搜索類(lèi)型的簡(jiǎn)介
- 幾種搜索類(lèi)型的實(shí)例
全文索引的幾個(gè)注意事項(xiàng)
- 搜索必須在類(lèi)型為fulltext的索引列上,match中指定的列必須在fulltext中指定過(guò)
- 僅能應(yīng)用在表引擎為MyIsam類(lèi)型的表中(MySQL 5.6以后也可以用在Innodb表引擎中了)
- 僅能再char、varchar、text類(lèi)型的列上面創(chuàng)建全文索引
- 像普通索引一樣,可以在定義表時(shí)指定,也可以在創(chuàng)建表后添加或者修改
- 對(duì)于一個(gè)大數(shù)量級(jí)記錄插入,向沒(méi)有索引的表中插入數(shù)據(jù)后創(chuàng)建索引比向有索引的數(shù)據(jù)表中插入的過(guò)程要快很多
- 搜索字符串必須是一個(gè)常量字符串,不能是表的列名
- 在搜索記錄的選擇性超過(guò)50%的時(shí)候,認(rèn)為沒(méi)有匹配(只在自然搜索中限制)
全文索引搜索語(yǔ)法
MATCH (列名1, 列名2,…) AGAINST (搜索字符串 [搜索修飾符])
其中在match里面指定的列名1、2等,就是在建立全文索引中指定的列名, 后面的搜索修飾符說(shuō)明如下:
search_modifier: { IN NATURAL LANGUAGE MODE | IN NATURAL LANGUAGE MODE WITH QUERY EXPANSION | IN BOOLEAN MODE | WITH QUERY EXPANSION }
幾種搜索類(lèi)型的簡(jiǎn)介
上面的搜索修飾符,實(shí)際上說(shuō)明了3種全文搜索類(lèi)型
IN NATURAL LANGUAGE MODE
簡(jiǎn)介:默認(rèn)的搜索形式(不加任何搜索修飾符或者修飾符為 IN NATURAL LANGUAGE MODE 的情況)
特點(diǎn):
- 對(duì)于搜索字符串中的字符都解析為正常的字符,沒(méi)有特殊意義
- 對(duì)屏蔽字符列表中的字符串進(jìn)行過(guò)濾
- 當(dāng)記錄的選擇性超過(guò)50%的時(shí)候,通常被認(rèn)為是不匹配。
- 返回記錄按照記錄的相關(guān)性進(jìn)行排序顯示
IN BOOLEAN MODE
簡(jiǎn)介:布爾模式搜索(搜索修飾符為IN BOOLEAN MODE的情況)
特點(diǎn):
- 會(huì)按照一定的規(guī)則解析搜索字符串中的特殊字符的含義,進(jìn)行一些邏輯意義的規(guī)則。如:某個(gè)單詞必須出現(xiàn),或者不能出現(xiàn)等。
- 這種類(lèi)型的搜索返回的記錄是不按照相關(guān)性進(jìn)行排序的
WITH QUERY EXPANSION
簡(jiǎn)介:一種稍微復(fù)雜的搜索形式,實(shí)際上是進(jìn)行了2次自然搜索,可以返回記錄直接簡(jiǎn)介性關(guān)系的記錄,修飾詞IN NATURAL LANGUAGE MODE WITH QUERY EXPANSION 或者WITH QUERY EXPANSION modifier
特點(diǎn):這種類(lèi)型的搜素,實(shí)際上提供了一種間接的搜索功能,比如:我搜索某個(gè)詞,而且返回的第一行中卻不包含搜索詞中的任意字符串??梢愿鶕?jù)第一次搜索結(jié)果的記錄詞進(jìn)行第二次匹配,從而可能找到一些間接關(guān)系的匹配記錄。
幾種搜索類(lèi)型的實(shí)例介紹
IN NATURAL LANGUAGE MODE模式下的應(yīng)用:
還是應(yīng)用在product表,其中在name字段我們建立了全文索引,因?yàn)槲倚枰鶕?jù)關(guān)鍵詞在name列匹配出相關(guān)記錄
Sql語(yǔ)句如下:
SELECT * FROM product WHERE match(name) against(‘a(chǎn)uto')
時(shí)間還不錯(cuò),在將近87w的記錄中命中了1w多條,耗時(shí)1.15秒,效果還是不錯(cuò)
注意:在默認(rèn)的情況下已經(jīng)是根據(jù)相關(guān)性從高到低返回記錄了
我們可以SELECT match(name) against(‘a(chǎn)uto') FROM product 查看記錄的相關(guān)性值,值都在0和1之間, 0代表記錄不匹配
重要的幾個(gè)特性:
1. 哪些詞會(huì)被忽略
搜索詞太短 默認(rèn)全文索引認(rèn)為4個(gè)以上字符的單詞是有效詞,我們可以在配置中修改ft_min_word_len進(jìn)行配置
屏蔽詞表中的詞 默認(rèn)的全文索引將一些常用詞屏蔽掉,因?yàn)檫@些詞太常見(jiàn)了,沒(méi)有任何語(yǔ)義作用,所以搜索過(guò)程中是忽略不計(jì)的。當(dāng)然這個(gè)列表也是可以配置的。
2. 如何進(jìn)行分詞的
全文索引認(rèn)為一個(gè)連續(xù)的有效字符(正則中\(zhòng)w匹配的字符集)是一個(gè)單詞,也可以包含一個(gè)“'”, 但是連續(xù)的兩個(gè)'會(huì)被認(rèn)為是一個(gè)分隔符。其他的分隔符如:空格、逗號(hào)、句點(diǎn)等
IN BOOLEAN MODE 模式下的應(yīng)用:
在布爾匹配模式中,我們可以添加一些特殊的符號(hào),增加一些搜索過(guò)程的邏輯功能。如官方網(wǎng)站中提供的實(shí)例(搜索含有mysql字符串 且 不含Yousql的語(yǔ)句):
SELECT * FROM articles WHERE MATCH (title,body) -> AGAINST (‘+MySQL -YourSQL' IN BOOLEAN MODE);
可見(jiàn),我們對(duì)搜索的控制又多了一些,看起來(lái)“高大上”了些。
實(shí)際上,上面的操作隱含了幾個(gè)意思:
加號(hào):相當(dāng)于and
減號(hào):相當(dāng)于not
沒(méi)有:相當(dāng)于or
下面看下布爾類(lèi)型搜索的幾個(gè)重要特性:
1. 沒(méi)有50%記錄選擇性的限制,即使搜索結(jié)果記錄超過(guò)總數(shù)的50%也同樣返回結(jié)果
2. 不會(huì)自動(dòng)的按記錄的相關(guān)性進(jìn)行降序排序
3. 可以直接應(yīng)用在沒(méi)有創(chuàng)建fulltext的全文索引上,但是這樣會(huì)查詢的非常慢,所以說(shuō)還是別用了。
4. 支持最小、最大單詞長(zhǎng)度
5. 應(yīng)用屏蔽詞列表
布爾搜索支持的操作符:
n 加號(hào) +:指示修飾的單詞必須出現(xiàn)在記錄中
n 減號(hào) -:指示修飾的單詞必須不能出現(xiàn)在記錄中
n 沒(méi)有任何操作符:?jiǎn)卧~可有可無(wú),但是包含該詞的記錄相關(guān)性高
n 雙引號(hào) “ : 將一個(gè)詞組作為一個(gè)匹配。如:”one word” 匹配one word在一起的單詞
下面是官方的一些實(shí)例:
至少包含一個(gè)詞的記錄 ‘a(chǎn)pple banana' 必須包含著兩個(gè)詞 ‘+apple +juice' 必須包含apple,包含macintosh的記錄相關(guān)性高,也可以不包含 ‘+apple macintosh' 必須包含apple且不能喊有macintosh ‘+apple -macintosh' 查找apple開(kāi)頭單詞的記錄 ‘a(chǎn)pple*' 完整匹配some words單詞 ‘”some words”‘
了解了基本的mysql全文索引知識(shí),覺(jué)得它的全文索引比like當(dāng)然是強(qiáng)了很多。但是面對(duì)高級(jí)的搜索還是略顯簡(jiǎn)陋,且性能問(wèn)題也是擔(dān)憂。
本人只是作為入門(mén)了解,也是對(duì)官網(wǎng)一些基本知識(shí)的翻譯。
相關(guān)文章
MySQL Daemon failed to start錯(cuò)誤解決辦法
這篇文章主要介紹了MySQL Daemon failed to start錯(cuò)誤解決辦法的相關(guān)資料,需要的朋友可以參考下2017-01-01MYSQL數(shù)據(jù)庫(kù)導(dǎo)入數(shù)據(jù)時(shí)出現(xiàn)亂碼的解決辦法
我是用的最后一種方法,前面三種解決MYSQL導(dǎo)入數(shù)據(jù)亂碼的方法沒(méi)試過(guò),東莞SEO推薦大家直接使用第四種方法處理MYSQL導(dǎo)入中文數(shù)據(jù)時(shí)的亂碼問(wèn)題。2011-01-01MySQL中存儲(chǔ)的數(shù)據(jù)查詢的時(shí)候如何區(qū)分大小寫(xiě)
這篇文章主要介紹了MySQL中存儲(chǔ)的數(shù)據(jù)查詢的時(shí)候如何區(qū)分大小寫(xiě)問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-04-04MySQL觸發(fā)器的使用和inserted和deleted表介紹
這篇文章主要介紹了MySQL觸發(fā)器的使用和inserted和deleted表,觸發(fā)器,就是一種特殊的存儲(chǔ)過(guò)程,觸發(fā)器和存儲(chǔ)過(guò)程一樣是一個(gè)能夠完成特定功能和存儲(chǔ)在數(shù)據(jù)庫(kù)服務(wù)器上的SQL片段,感興趣想要詳細(xì)了解可以參考下文2023-05-05Django連接本地mysql數(shù)據(jù)庫(kù)(pycharm)的步驟
這篇文章主要介紹了Django連接本地mysql數(shù)據(jù)庫(kù)(pycharm)的步驟,本文分步驟給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-09-09