MySQL實(shí)現(xiàn)分詞搜索(FULLTEXT)的方法
FULLTEXT
以前使用查找時都是以 %關(guān)鍵字% 進(jìn)行模糊查詢結(jié)果的,這種查詢方式有一些缺點(diǎn),比如不能查詢多個列必須手動添加條件以實(shí)現(xiàn),效率不高等
現(xiàn)在有一種新的查找方式可以解決以上問題,就是使用全文索引進(jìn)行查找
注意:并非所有存儲引擎都支持全文搜索功能。在MySQL 5.6或更高版本中,只有MyISAM和InnoDB存儲引擎支持全文搜索。
全文搜索的簡單使用
建表添加FULLTEXT索引
使用該技術(shù)非常簡單,首先需要有一張表,我建立了一張圖書表并插入了兩條數(shù)據(jù)
CREATE TABLE `book` ( `id` int(11) NOT NULL AUTO_INCREMENT, `book_name` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL, `author` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL, `publisher` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL, PRIMARY KEY (`id`) USING BTREE, FULLTEXT INDEX `bookname_author_publisher_fulltext`(`book_name`, `author`, `publisher`) WITH PARSER `ngram` ) ENGINE = InnoDB AUTO_INCREMENT = 3 CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Dynamic; SET FOREIGN_KEY_CHECKS = 1;
接下來添加索引
添加FULLTEXT索引的語法是
CREATE FULLTEXT INDEX index_name ON table_name(idx_column_name,…)
但是由于我們需要分詞搜索,MySQL本身不支持中文分詞,所以在使用全文索引時需要引入Ngram解析器使得支持中文分詞搜索(MySQL版本大于5.6),只需要在創(chuàng)建索引時在語句后面添加WITH PARSER NGRAM 即可
例如,創(chuàng)建了一個支持以書名,作者和出版社為搜索條件的全文索引語法如下
create FULLTEXT index bookname_author_publisher on book(book_name,author,publisher) WITH PARSER ngram
嘗試搜索
現(xiàn)在,我們已經(jīng)創(chuàng)建好了索引,它支持以書名,作者和出版社的內(nèi)容進(jìn)行搜索,我們嘗試搜索下包含三國
的數(shù)據(jù)
select * from book where MATCH(book_name,author,publisher) against(‘三國’)
結(jié)果:
可以看到,包含三國
的數(shù)據(jù)有兩條,分別是書名為三國演義和作者為張三國的數(shù)據(jù),已經(jīng)成功實(shí)現(xiàn)分詞搜索了
需要說明的是,該Ngram解析器默認(rèn)的分詞長度(ngram_token_size)是2,也就是說,默認(rèn)是以2個字符進(jìn)行分詞的,如果你只搜索1個字符的話是不會有任何結(jié)果的,但是這個值可以自定義。
- 查看分詞長度 SHOW VARIABLES LIKE ‘ngram_token_size’;
- 修改分詞長度 在MySQL的配置文件中(.ini)找到[mysqld]字樣的地方,在下方添加ngram_token_size=1即可修改為支持1個字符起搜索(范圍1~10)
關(guān)于MySQL的配置文件的位置,如果你是壓縮包安裝的應(yīng)該直接就能找到,如果是通過安裝程序安裝的話可以從服務(wù)中找到你的MySQL服務(wù),然后點(diǎn)擊屬性就可以看到位置了
結(jié)束
以上就是關(guān)于MySQL實(shí)現(xiàn)分詞搜索的簡單過程了,詳細(xì)語法可以通過該網(wǎng)址進(jìn)行學(xué)習(xí)
需要補(bǔ)充的是,我在學(xué)習(xí)時看到使用該索引進(jìn)行全文搜索時,會應(yīng)用50%閾值(50%閾值意味著如果一個單詞出現(xiàn)在超過50%的行中,MySQL將在搜索結(jié)果中忽略它。),但是實(shí)際測試下來并沒有忽略掉。
1.布爾全文搜索模式進(jìn)行搜索時,不會應(yīng)用50%閾值
2.按理說使用自然語言搜索進(jìn)行全文搜索時會應(yīng)用50%閾值,可是我實(shí)際測試并沒有忽略(innoDB),后來看到一句話
MyISAM全文搜索會忽略至少在一半以上數(shù)據(jù)行中出現(xiàn)的單詞(也即所謂的50%閾值),InnoDB無此限制。而在布爾全文搜索中MyISAM的50%閾值不生效。(來自https://www.likecs.com/show-374225.html?sc=8500)
這一塊暫時不清楚什么情況,后續(xù)測試再更新吧
到此這篇關(guān)于MySQL實(shí)現(xiàn)分詞搜索(FULLTEXT)的文章就介紹到這了,更多相關(guān)MySQL分詞搜索內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
解決mysql不能插入中文Incorrect string value
首先我的配置文件的設(shè)置的默認(rèn)字符集是utf8即2009-05-05IDEA無法連接mysql數(shù)據(jù)庫的6種解決方法大全
這篇文章主要介紹了IDEA無法連接mysql數(shù)據(jù)庫的6種解決方法大全,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-11-11一文詳解如何在MySQL中創(chuàng)建函數(shù)
這篇文章主要為大家介紹了一文詳解如何在MySQL中創(chuàng)建函數(shù),有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-05-05MySQL中CONCAT()函數(shù)拼接出現(xiàn)NULL的問題解決
本文主要介紹了MySQL中CONCAT()函數(shù)拼接出現(xiàn)NULL的問題解決,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-03-03Windows下MySQL日志基本的查看以及導(dǎo)入導(dǎo)出用法教程
這篇文章主要介紹了Windows下MySQL日志基本的查看以及導(dǎo)入導(dǎo)出用法教程,需要的朋友可以參考下2015-11-11MySQL實(shí)現(xiàn)顯示百分比顯示和前百分之幾的方法
這篇文章主要介紹了MySQL中如何顯示百分比和顯示前百分之幾的,文中的示例代碼講解詳細(xì),對我們學(xué)習(xí)MySQL有一定的幫助,感興趣的小伙伴可以了解一下2021-12-12pycharm2017實(shí)現(xiàn)python3.6與mysql的連接
這篇文章主要為大家詳細(xì)介紹了PyCharm連接MySQL數(shù)據(jù)庫的方法,具有一定的參考價值,感興趣的小伙伴們可以參考一下2019-03-03