Mysql全文搜索match against的用法
1.使用Mysql全文檢索fulltext的先決條件
表的類型必須是MyISAM
建立全文檢索的字段類型必須是char,varchar,text
2.建立全文檢索先期配置
由于Mysql的默認(rèn)配置是索引的詞的長(zhǎng)度是4,所以要支持中文單字的話,首先更改這個(gè).
*Unix用戶要修改my.cnf,一般此文件在/etc/my.cnf,如果沒(méi)有找到,先查找一下find / -name 'my.cnf'
在 [mysqld] 位置內(nèi)加入:
ft_min_word_len = 2
其它屬性還有
ft_wordlist_charset = gbk
ft_wordlist_file = /home/soft/mysql/share/mysql/wordlist-gbk.txt
ft_stopword_file = /home/soft/mysql/share/mysql/stopwords-gbk.txt
稍微解釋一下:
ft_wordlist_charset 表示詞典的字符集, 目前支持良好的有(UTF-8, gbk, gb2312, big5)
ft_wordlist_file 是詞表文件, 每行包括一個(gè)詞及其詞頻(用若干制表符或空格分開,消岐專用)
ft_stopword_file 表示過(guò)濾掉不索引的詞表, 一行一個(gè).
ft_min_word_len 加入索引的詞的最小長(zhǎng)度, 缺省是 4, 為了支持中文單字故改為 2
3.建立全文檢索
在建表中用FullText關(guān)鍵字標(biāo)識(shí)字段,已存在的表用 ALTER TABLE (或 CREATE INDEX) 創(chuàng)建索引
CREATE fulltext INDEX index_name ON table_name(colum_name);
4.使用全文檢索
在SELECT的WHERE字句中用MATCH函數(shù),索引的關(guān)鍵詞用AGAINST標(biāo)識(shí),IN BOOLEAN MODE是只有含有關(guān)鍵字就行,不用在乎位置,是不是起啟位置.
SELECT * FROM articles WHERE MATCH (tags) AGAINST ('旅游' IN BOOLEAN MODE);
5.詳細(xì)的說(shuō)明請(qǐng)參數(shù)Mysql官方網(wǎng)站
http://dev.mysql.com/doc/refman/5.1/zh/functions.html#fulltext-search
這是Mysql 5.1的,不過(guò)4.X也可以做為參考,基本一置.我用的就是Mysql 4.1.
MySQL支持全文索引(Full-Text) 已經(jīng)很久了,目前,fulltext是一種只適用于MyISAM表的一個(gè)索引類型,而且對(duì)定義索引列的數(shù)據(jù)類型也有限制,只能是以下三種的組合char、 varchar、text。fulltext可以在創(chuàng)建表的同時(shí)就一起定義好,或者在表創(chuàng)建完成之后,通過(guò)語(yǔ)句alter table或create index來(lái)追加索引,總之先后的效果是一樣的,但是兩者的效率卻是存在很大差異的,大量的實(shí)驗(yàn)證明,對(duì)于大數(shù)量的表來(lái)說(shuō),先加載數(shù)據(jù)再來(lái)定義全文索引的 速度要遠(yuǎn)遠(yuǎn)優(yōu)于在一個(gè)已經(jīng)定義好全文索引的表里面插入大量數(shù)據(jù)的速度。一定會(huì)問(wèn):這是問(wèn)什么呢?其實(shí),道理很簡(jiǎn)單,前者只需要一次性對(duì)你的索引列表進(jìn)行操 作,排序比較都是在內(nèi)存中完成,然后寫入硬盤;后者則要一條一條去硬盤中讀取索引表然后再進(jìn)行比較最后寫入,自然這樣速度就會(huì)很慢。MySQL是 通過(guò)match()和against()這兩個(gè)函數(shù)來(lái)實(shí)現(xiàn)它的全文索引查詢的功能。match()中的字段名稱要和fulltext中定義的字段一致,如 果采用boolean模式搜索,也允許只包括fulltext中的某個(gè)字段,不需要全部列出。against()中定義的是所要搜索的字符串以及要求數(shù)據(jù) 庫(kù)通過(guò)哪種模式去執(zhí)行全文索引的搜索查詢。下面通過(guò)一個(gè)例子分別介紹一下fulltext所支持的3中搜索模式。
MySQL全文索引與中文分詞總結(jié)及一般的關(guān)鍵詞搜索流程
http://www.tzlink.com/info/show.php?aid=4532
mysql 全文檢索 中文分詞
http://hi.baidu.com/agg230/blog/item/33d3d50eada260e337d1225b.html
支持中文的MySQL 5.1+ 全文檢索分詞插件
http://hi.baidu.com/start_and_end/blog/item/6d6ab918b7d3800334fa412e.html
家用一下搜索引擎就會(huì)發(fā)現(xiàn),分詞的情況只是出現(xiàn)在當(dāng)整詞命中為0的情況下。
而具體怎樣分詞,大家可以參考一下baidu搜索試驗(yàn)結(jié)果:
·如果搜“徐祖寧寧”,結(jié)果為“徐祖”+“寧寧”。(搜人名的情況下,它可能有一個(gè)百家姓詞典,自動(dòng)將姓后第一個(gè)字歸前)
·搜“徐寧愿”,結(jié)果為“徐寧愿”。(說(shuō)明“寧愿”歸“徐”所有。同上。因?yàn)樾焓切?。?
·搜“徐祖寧愿”,結(jié)果為“徐祖”+“寧愿”。(因?yàn)椤皩幵浮笔窃~,故“徐”只帶“祖”。)
·搜“徐祖寧高”,結(jié)果為“徐祖寧”。(因?yàn)椤皩幐摺辈皇顷P(guān)鍵字,所以“寧”歸前詞所有。而“高”可能因?yàn)槭菃巫?,為提高前詞搜索效率故被省略。)
相關(guān)文章
快速解決mysql導(dǎo)數(shù)據(jù)時(shí),格式不對(duì)、導(dǎo)入慢、丟數(shù)據(jù)的問(wèn)題
這篇文章主要介紹了快速解決mysql導(dǎo)數(shù)據(jù)時(shí),格式不對(duì)、導(dǎo)入慢、丟數(shù)據(jù)的問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-07-07教你解決往mysql數(shù)據(jù)庫(kù)中存入漢字報(bào)錯(cuò)的方法
這篇文章主要介紹了Mysql基礎(chǔ)之教你解決往數(shù)據(jù)庫(kù)中存入漢字報(bào)錯(cuò)的方法,文中有非常詳細(xì)的代碼示例,對(duì)正在學(xué)習(xí)mysql的小伙伴們有非常好的幫助,需要的朋友可以參考下2021-05-05win10 安裝 mysql 5.7 msi版的教程圖文詳解
這篇文章主要介紹了win10 安裝 mysql 5.7 msi版的教程,本文通過(guò)圖文并茂的形式給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-05-05