快捷導(dǎo)航

基于ElasticSearch Analyzer的使用規(guī)則詳解

更新時間：2021年07月12日 10:23:17 作者：wanson2015

這篇文章主要介紹了基于ElasticSearch Analyzer的使用規(guī)則，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教

analyzer的使用規(guī)則

查詢只能查找倒排索引表中真實存在的項，所以保證文檔在索引時與查詢字符串在搜索時應(yīng)用相同的分析過程非常重要，這樣查詢的項才能夠匹配倒排索引中的項。

盡管是在說文檔，不過分析器可以由每個字段決定。每個字段都可以有不同的分析器，既可以通過配置為字段指定分析器，也可以使用更高層的類型（type）、索引（index）或節(jié)點（node）的默認配置。在索引時，一個字段值是根據(jù)配置或默認分析器分析的。

例如為 my_index 新增一個字段：

PUT /my_index/_mapping/my_type
{
    "my_type": {
        "properties": {
            "english_title": {
                "type":     "string",
                "analyzer": "english"
            }
        }
    }
}

現(xiàn)在我們就可以通過使用 analyze API 來分析單詞 Foxes ，進而比較 english_title 字段和 title 字段在索引時的分析結(jié)果：

GET /my_index/_analyze
{
"field": "my_type.title",
"text": "Foxes"
}
 
GET /my_index/_analyze
{
"field": "my_type.english_title",
"text": "Foxes"
}

字段 title ，使用默認的 standard 標準分析器，返回詞項 foxes 。
字段 english_title ，使用 english 英語分析器，返回詞項 fox 。

這意味著，如果使用底層 term 查詢精確項 fox 時， english_title 字段會匹配但 title 字段不會。

如同 match 查詢這樣的高層查詢知道字段映射的關(guān)系，能為每個被查詢的字段應(yīng)用正確的分析器。可以使用 validate-query API 查看這個行為：

GET /my_index/my_type/_validate/query?explain
{
    "query": {
        "bool": {
            "should": [
                { "match": { "title":         "Foxes"}},
                { "match": { "english_title": "Foxes"}}
            ]
        }
    }
}

返回語句的 explanation 結(jié)果：

(title:foxes english_title:fox)

match 查詢?yōu)槊總€字段使用合適的分析器，以保證它在尋找每個項時都為該字段使用正確的格式。

默認分析器

雖然我們可以在字段層級指定分析器，但是如果該層級沒有指定任何的分析器，那么我們?nèi)绾文艽_定這個字段使用的是哪個分析器呢？

分析器可以從三個層面進行定義：按字段（per-field）、按索引（per-index）或全局缺?。╣lobal default）。Elasticsearch 會按照以下順序依次處理，直到它找到能夠使用的分析器。索引時的順序如下：

字段映射里定義的 analyzer ，否則
索引設(shè)置中名為 default 的分析器，默認為
standard 標準分析器

在搜索時，順序有些許不同：

查詢自己定義的 analyzer ，否則
字段映射里定義的 analyzer ，否則
索引設(shè)置中名為 default 的分析器，默認為
standard 標準分析器

有時，在索引時和搜索時使用不同的分析器是合理的。我們可能要想為同義詞建索引（例如，所有 quick 出現(xiàn)的地方，同時也為 fast 、 rapid 和 speedy 創(chuàng)建索引）。但在搜索時，我們不需要搜索所有的同義詞，取而代之的是尋找用戶輸入的單詞是否是 quick 、 fast 、 rapid 或 speedy 。

為了區(qū)分，Elasticsearch 也支持一個可選的 search_analyzer 映射，它僅會應(yīng)用于搜索時（ analyzer 還用于索引時）。還有一個等價的 default_search 映射，用以指定索引層的默認配置。

如果考慮到這些額外參數(shù)，一個搜索時的完整順序會是下面這樣：