欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

MySQL實(shí)現(xiàn)分詞搜索(FULLTEXT)的方法

 更新時間:2022年10月17日 09:29:54   作者:Sykking之歌  
這篇文章主要介紹了MySQL實(shí)現(xiàn)分詞搜索(FULLTEXT)的方法,包括全文搜索的簡單使用,建表添加FULLTEXT索引使用該技術(shù)非常簡單,首先需要有一張表,我建立了一張圖書表并插入了兩條數(shù)據(jù),需要的朋友可以參考下

FULLTEXT

以前使用查找時都是以 %關(guān)鍵字% 進(jìn)行模糊查詢結(jié)果的,這種查詢方式有一些缺點(diǎn),比如不能查詢多個列必須手動添加條件以實(shí)現(xiàn),效率不高等
現(xiàn)在有一種新的查找方式可以解決以上問題,就是使用全文索引進(jìn)行查找
注意:并非所有存儲引擎都支持全文搜索功能。在MySQL 5.6或更高版本中,只有MyISAM和InnoDB存儲引擎支持全文搜索。

全文搜索的簡單使用

建表添加FULLTEXT索引

使用該技術(shù)非常簡單,首先需要有一張表,我建立了一張圖書表并插入了兩條數(shù)據(jù)

CREATE TABLE `book`  (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `book_name` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,
  `author` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,
  `publisher` varchar(255) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,
  PRIMARY KEY (`id`) USING BTREE,
  FULLTEXT INDEX `bookname_author_publisher_fulltext`(`book_name`, `author`, `publisher`) WITH PARSER `ngram`
) ENGINE = InnoDB AUTO_INCREMENT = 3 CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Dynamic;

SET FOREIGN_KEY_CHECKS = 1;

在這里插入圖片描述

接下來添加索引

添加FULLTEXT索引的語法是

CREATE FULLTEXT INDEX index_name ON table_name(idx_column_name,…)

但是由于我們需要分詞搜索,MySQL本身不支持中文分詞,所以在使用全文索引時需要引入Ngram解析器使得支持中文分詞搜索(MySQL版本大于5.6),只需要在創(chuàng)建索引時在語句后面添加WITH PARSER NGRAM 即可
例如,創(chuàng)建了一個支持以書名,作者和出版社為搜索條件的全文索引語法如下
create FULLTEXT index bookname_author_publisher on book(book_name,author,publisher) WITH PARSER ngram

嘗試搜索

現(xiàn)在,我們已經(jīng)創(chuàng)建好了索引,它支持以書名,作者和出版社的內(nèi)容進(jìn)行搜索,我們嘗試搜索下包含三國的數(shù)據(jù)
select * from book where MATCH(book_name,author,publisher) against(‘三國’)
結(jié)果:

在這里插入圖片描述

可以看到,包含三國的數(shù)據(jù)有兩條,分別是書名為三國演義和作者為張三國的數(shù)據(jù),已經(jīng)成功實(shí)現(xiàn)分詞搜索了
需要說明的是,該Ngram解析器默認(rèn)的分詞長度(ngram_token_size)是2,也就是說,默認(rèn)是以2個字符進(jìn)行分詞的,如果你只搜索1個字符的話是不會有任何結(jié)果的,但是這個值可以自定義。

  • 查看分詞長度 SHOW VARIABLES LIKE ‘ngram_token_size’;
  • 修改分詞長度 在MySQL的配置文件中(.ini)找到[mysqld]字樣的地方,在下方添加ngram_token_size=1即可修改為支持1個字符起搜索(范圍1~10)

關(guān)于MySQL的配置文件的位置,如果你是壓縮包安裝的應(yīng)該直接就能找到,如果是通過安裝程序安裝的話可以從服務(wù)中找到你的MySQL服務(wù),然后點(diǎn)擊屬性就可以看到位置了

在這里插入圖片描述

結(jié)束

以上就是關(guān)于MySQL實(shí)現(xiàn)分詞搜索的簡單過程了,詳細(xì)語法可以通過該網(wǎng)址進(jìn)行學(xué)習(xí)
需要補(bǔ)充的是,我在學(xué)習(xí)時看到使用該索引進(jìn)行全文搜索時,會應(yīng)用50%閾值(50%閾值意味著如果一個單詞出現(xiàn)在超過50%的行中,MySQL將在搜索結(jié)果中忽略它。),但是實(shí)際測試下來并沒有忽略掉。
1.布爾全文搜索模式進(jìn)行搜索時,不會應(yīng)用50%閾值
2.按理說使用自然語言搜索進(jìn)行全文搜索時會應(yīng)用50%閾值,可是我實(shí)際測試并沒有忽略(innoDB),后來看到一句話

這里是引用

MyISAM全文搜索會忽略至少在一半以上數(shù)據(jù)行中出現(xiàn)的單詞(也即所謂的50%閾值),InnoDB無此限制。而在布爾全文搜索中MyISAM的50%閾值不生效。(來自https://www.likecs.com/show-374225.html?sc=8500)

這一塊暫時不清楚什么情況,后續(xù)測試再更新吧

到此這篇關(guān)于MySQL實(shí)現(xiàn)分詞搜索(FULLTEXT)的文章就介紹到這了,更多相關(guān)MySQL分詞搜索內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評論