欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

elasticsearch中的mapping簡介(最新整理)

 更新時間:2025年06月11日 10:13:07   作者:lvhong84  
Mapping 也稱之為映射,定義了 ES 的索引結(jié)構(gòu)、字段類型、分詞器等屬性,是索引必不可少的組成部分,這篇文章主要介紹了elasticsearch中的mapping簡介,需要的朋友可以參考下

概述

映射的基本概念

Mapping 也稱之為映射,定義了 ES 的索引結(jié)構(gòu)、字段類型、分詞器等屬性,是索引必不可少的組成部分。

ES 中的 mapping 有點類似與DB中“表結(jié)構(gòu)”的概念,在 MySQL 中,表結(jié)構(gòu)里包含了字段名稱,字段的類型還有索引信息等。在 Mapping 里也包含了一些屬性,比如字段名稱、類型、字段使用的分詞器、是否評分、是否創(chuàng)建索引等屬性。

最近項目準(zhǔn)備用到elasticsearch, 首先需要搞清楚elasticsearch的一些概念,在網(wǎng)上發(fā)現(xiàn)這篇文章不錯,以通俗易懂的語言講明白了mapping的概念。

默認(rèn)mapping

elasticsearch(以下簡稱ES)是沒有模式(schema)的,當(dāng)我們執(zhí)行以下命令:

curl -XPUT http://localhost:9200/test/item/1 -d '{"name":"zach", "description": "A Pretty cool guy."}'

ES能非常聰明的識別出"name"和"description"字段的類型是string, ES默認(rèn)會創(chuàng)建以下的mapping。

mappings: {
    item: {
        properties: {
            description: {
                type: string
            }
            name: {
                type: string
            }
        }
    }
}

什么是mapping

ES的mapping非常類似于靜態(tài)語言中的數(shù)據(jù)類型:聲明一個變量為int類型的變量, 以后這個變量都只能存儲int類型的數(shù)據(jù)。同樣的, 一個number類型的mapping字段只能存儲number類型的數(shù)據(jù)。

同語言的數(shù)據(jù)類型相比,mapping還有一些其他的含義,mapping不僅告訴ES一個field中是什么類型的值, 它還告訴ES如何索引數(shù)據(jù)以及數(shù)據(jù)是否能被搜索到。

當(dāng)你的查詢沒有返回相應(yīng)的數(shù)據(jù), 你的mapping很有可能有問題。當(dāng)你拿不準(zhǔn)的時候, 直接檢查你的mapping。

剖析mapping

一個mapping由一個或多個analyzer組成, 一個analyzer又由一個或多個filter組成的。當(dāng)ES索引文檔的時候,它把字段中的內(nèi)容傳遞給相應(yīng)的analyzer,analyzer再傳遞給各自的filters。

filter的功能很容易理解:一個filter就是一個轉(zhuǎn)換數(shù)據(jù)的方法, 輸入一個字符串,這個方法返回另一個字符串,比如一個將字符串轉(zhuǎn)為小寫的方法就是一個filter很好的例子。

一個analyzer由一組順序排列的filter組成,執(zhí)行分析的過程就是按順序一個filter一個filter依次調(diào)用, ES存儲和索引最后得到的結(jié)果。

總結(jié)來說, mapping的作用就是執(zhí)行一系列的指令將輸入的數(shù)據(jù)轉(zhuǎn)成可搜索的索引項。

默認(rèn)analyzer

回到我們的例子, ES猜測description字段是string類型,于是默認(rèn)創(chuàng)建一個string類型的mapping,它使用默認(rèn)的全局analyzer, 默認(rèn)的analyzer是標(biāo)準(zhǔn)analyzer, 這個標(biāo)準(zhǔn)analyzer有三個filter:token filter, lowercase filter和stop token filter。

我們可以在做查詢的時候鍵入_analyze關(guān)鍵字查看分析的過程。使用以下指令查看description字段的轉(zhuǎn)換過程:

curl -X GET "http://localhost:9200/test/_analyze?analyzer=standard&pretty=true" -d "A Pretty cool guy."
{
  "tokens" : [ {
    "token" : "pretty",
    "start_offset" : 2,
    "end_offset" : 8,
    "type" : "<ALPHANUM>",
    "position" : 2
  }, {
    "token" : "cool",
    "start_offset" : 9,
    "end_offset" : 13,
    "type" : "<ALPHANUM>",
    "position" : 3
  }, {
    "token" : "guy",
    "start_offset" : 14,
    "end_offset" : 17,
    "type" : "<ALPHANUM>",
    "position" : 4
  } ]

可以看到, 我們的description字段的值轉(zhuǎn)換成了[pretty], [cool], [guy], 在轉(zhuǎn)換過程中大寫的A, 標(biāo)點符號都被filter過濾掉了, Pretty也轉(zhuǎn)成了全小寫的pretty, 這里比較重要的是, 即使ES存儲數(shù)據(jù)的時候仍然存儲的是完整的數(shù)據(jù), 但是可以搜索到這條數(shù)據(jù)的關(guān)鍵字只剩下這三個單詞了, 其他的都是拋棄掉了。

看看以單詞a來搜索的結(jié)果:

$ curl -X GET "http://localhost:9200/test/_search?pretty=true" -d '{
    "query" : {
        "text" : { "description": "a" }
    }
}'
 
{
  "took" : 29,
  "timed_out" : false,
  "_shards" : {
    "total" : 5,
    "successful" : 5,
    "failed" : 0
  },
  "hits" : {
    "total" : 0,
    "max_score" : null,
    "hits" : [ ]
  }
}

text類型的搜索在查詢過程中使用了和之前插入數(shù)據(jù)相同的分析/過濾系統(tǒng), 所以我們輸入"a",mapping不會有任何返回, 因為單詞“a”不會被ES存儲和索引。反過來,如果我們使用單詞"cool"進(jìn)行搜索:

curl -X GET "http://localhost:9200/test/_search?pretty=true" -d '{
    "query" : {
        "text" : { "description": "cool" }
    }
}'
{
  "took" : 29,
  "timed_out" : false,
  "_shards" : {
    "total" : 5,
    "successful" : 5,
    "failed" : 0
  },
  "hits" : {
    "total" : 1,
    "max_score" : 0.15342641,
    "hits" : [ {
      "_index" : "test",
      "_type" : "item",
      "_id" : "1",
      "_score" : 0.15342641, "_source" : {"name":"zach", "description": "A pretty cool guy"}
    } ]
  }
}

現(xiàn)在就能得到正確的結(jié)果,這是一個公認(rèn)的簡單例子, 但是它描述了ES是如何工作的, 不要把mapping想成是數(shù)據(jù)類型, 把它想象成是搜索數(shù)據(jù)的指令集合。如果你不想字符"a"被刪除, 你需要修改你的analyzer。

原文: http://euphonious-intuition.com/2012/07/an-introduction-to-mapping-in-elasticsearch/

到此這篇關(guān)于elasticsearch中的mapping簡介的文章就介紹到這了,更多相關(guān)elasticsearch mapping內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評論