欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Java優(yōu)化模糊搜索體驗的方法詳解

 更新時間:2025年04月27日 09:55:28   作者:mzlogin  
在小數(shù)據(jù)量場景下,如何優(yōu)化模糊搜索體驗呢,本文分享一個簡單實用的方案,雖然有點笨拙,但效果還的不錯的,希望對大家有一定的幫助

場景

假設有一張表 t_course,數(shù)據(jù)量在三到四位數(shù),字段 name 需要支持模糊搜索。用普通的 LIKE 語句,比如:

SELECT id, name FROM t_course WHERE name LIKE '%2025數(shù)學高一下%';

結果卻查不到 2025年高一數(shù)學下學期。這就很尷尬了,用戶體驗直接拉胯。

方案探索

1. MySQL 全文索引

首先想到 MySQL 的全文索引,但要支持中文分詞得改 ngram_token_size 配置,還得重啟數(shù)據(jù)庫。為了不動生產(chǎn)環(huán)境配置,果斷放棄。

2. Elasticsearch

接著想到 Elasticsearch,但對這么簡單的場景來說,未免有點“殺雞用牛刀”。于是繼續(xù)尋找更輕量的方案。

3. 自定義分詞 + MySQL INSTR

最后想到一個“土辦法”:先對用戶輸入進行分詞,再用 MySQL 的 INSTR 函數(shù)匹配。簡單粗暴,但很實用。

實現(xiàn)

分詞工具

一開始用了 jcseg 分詞庫,寫了個工具類:

public class JcSegUtils {
    private static final SegmenterConfig CONFIG = new SegmenterConfig(true);
    private static final ADictionary DIC = DictionaryFactory.createSingletonDictionary(CONFIG);

    public static List<String> segment(String text) throws IOException {
        ISegment seg = ISegment.NLP.factory.create(CONFIG, DIC);
        seg.reset(new StringReader(text));
        IWord word;
        List<String> result = new ArrayList<>();
        while ((word = seg.next()) != null) {
            String wordText = word.getValue();
            if (StringUtils.isNotBlank(wordText)) {
                result.add(wordText);
            }
        }
        return result;
    }
}

本地測試一切正常,但部署到測試環(huán)境后,分詞結果卻變了!比如:

  • 本地:[2025, 數(shù)學, 高一, 下]
  • 測試環(huán)境:[2025, 數(shù), 學, 高, 1, 下]

原因是 jcseg 在 jar 包中加載默認配置和詞庫時出問題了。網(wǎng)上的解決方案大多是外置詞庫,但我懶得折騰,決定自己擼個簡易分詞工具。

簡易分詞工具

最終實現(xiàn)如下:

public class WordSegmentationUtils {
    private static final List<String> DICT;
    private static final String COURSE_SEARCH_KEYWORD_LIST = "數(shù)學,物理,化學,生物,地理,歷史,政治,英語,語文,高中,高一,高二,高三";

    static {
        DICT = new ArrayList<>();
        for (int i = 2018; i <= 2099; i++) {
            DICT.add(String.valueOf(i));
        }
        DICT.addAll(Arrays.asList(COURSE_SEARCH_KEYWORD_LIST.split(",")));
    }

    public static List<String> segment(String text) {
        if (StringUtils.isBlank(text)) {
            return new ArrayList<>();
        }
        List<String> segments = new ArrayList<>();
        segments.add(text);
        for (String word : DICT) {
            segments = segment(segments, word);
        }
        return segments;
    }

    private static List<String> segment(List<String> segments, String word) {
        List<String> newSegments = new ArrayList<>();
        for (String segment : segments) {
            if (segment.contains(word)) {
                newSegments.add(word);
                String[] split = segment.split(word);
                for (String s : split) {
                    if (StringUtils.isNotBlank(s)) {
                        newSegments.add(s.trim());
                    }
                }
            } else {
                newSegments.add(segment);
            }
        }
        return newSegments;
    }
}

這個工具基于一個簡單的詞典 DICT,按詞典中的詞對輸入文本進行分割。比如:

  • 輸入:2025數(shù)學高一下
  • 輸出:[2025, 數(shù)學, 高一, 下]

效果驗證

現(xiàn)在,無論用戶輸入以下哪種形式,都能成功匹配到 2025年高一數(shù)學下學期

  • 2025高一數(shù)學下
  • 2025 高一 數(shù)學
  • 數(shù)學高一2025

小結

這個方案雖然簡單,但在小數(shù)據(jù)量場景下,性能和體驗都能滿足需求,且實現(xiàn)成本低。如果遇到特殊情況,可以通過動態(tài)更新詞典來解決。

當然,這種“土辦法”并不適合復雜場景。如果需求升級,可以再考慮 MySQL 全文索引或 Elasticsearch。

到此這篇關于Java優(yōu)化模糊搜索體驗的方法詳解的文章就介紹到這了,更多相關Java優(yōu)化模糊搜索內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • 情人節(jié)寫給女朋友Java Swing代碼程序

    情人節(jié)寫給女朋友Java Swing代碼程序

    這篇文章主要為大家分享了情人節(jié)寫給女朋友的java小程序,具有一定的參考價值,感興趣的小伙伴們可以參考一下,祝大家每天都是情人節(jié)
    2018-02-02
  • Spring注解之@Lazy注解使用解析

    Spring注解之@Lazy注解使用解析

    這篇文章主要介紹了Spring注解之@Lazy注解使用解析,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2019-09-09
  • 關于ApplicationContext的三個常用實現(xiàn)類

    關于ApplicationContext的三個常用實現(xiàn)類

    這篇文章主要介紹了關于ApplicationContext的三個常用實現(xiàn)類,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
    2024-06-06
  • 基于SpringMVC實現(xiàn)網(wǎng)頁登錄攔截

    基于SpringMVC實現(xiàn)網(wǎng)頁登錄攔截

    SpringMVC的處理器攔截器類似于Servlet開發(fā)中的過濾器Filter,用于對處理器進行預處理和后處理。因此,本文將為大家介紹如何通過SpringMVC實現(xiàn)網(wǎng)頁登錄攔截功能,需要的小伙伴可以了解一下
    2021-12-12
  • Mybatis?Lombok使用方法與復雜查詢介紹

    Mybatis?Lombok使用方法與復雜查詢介紹

    Lombok是一種Java實用工具,可用來幫助開發(fā)人員消除Java的冗長,尤其是對于簡單的Java對象(POJO),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習吧
    2022-10-10
  • Java知識梳理之泛型用法詳解

    Java知識梳理之泛型用法詳解

    從JDK?5.0以后,Java引入了“參數(shù)化類型(Parameterized?type)”的概念,允許我們在創(chuàng)建集合時再指定集合元素的類型。本文就來和大家深入聊聊Java泛型的使用
    2022-08-08
  • IDEA的Mybatis Generator駝峰配置問題

    IDEA的Mybatis Generator駝峰配置問題

    這篇文章主要介紹了IDEA的Mybatis Generator駝峰配置問題,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2020-11-11
  • Java8新特性:lambda表達式總結

    Java8新特性:lambda表達式總結

    這篇文章主要介紹了Java8新特性:lambda表達式總結,本文總結了多種語法格式和使用方法,包含了函數(shù)式接口和內(nèi)置的四大核心函數(shù)式接口的用法實例,需要的朋友可以參考下
    2021-06-06
  • SpringBoot?Validation快速實現(xiàn)數(shù)據(jù)校驗的示例代碼

    SpringBoot?Validation快速實現(xiàn)數(shù)據(jù)校驗的示例代碼

    在實際開發(fā)中,肯定會經(jīng)常遇到對參數(shù)字段進行校驗的場景,通常我們只能寫大量的if else來完成校驗工作,而如果使用SpringBoot Validation則可以輕松的通過注解來完成,接下來小編給大家介紹下利用SpringBoot?Validation快速實現(xiàn)數(shù)據(jù)校驗的示例代碼,需要的朋友參考下吧
    2022-06-06
  • Java實現(xiàn)滑動驗證碼(前端部分)

    Java實現(xiàn)滑動驗證碼(前端部分)

    這篇文章主要為大家介紹了如何用Java語言實現(xiàn)滑動驗證碼的生成(前端部分),文中的示例代碼講解詳細,具有一定的學習價值,感興趣的小伙伴可以跟隨小編學習一下
    2022-10-10

最新評論