elasticsearch中的mapping簡介(最新整理)
概述
映射的基本概念
Mapping 也稱之為映射,定義了 ES 的索引結(jié)構(gòu)、字段類型、分詞器等屬性,是索引必不可少的組成部分。
ES 中的 mapping 有點類似與DB中“表結(jié)構(gòu)”的概念,在 MySQL 中,表結(jié)構(gòu)里包含了字段名稱,字段的類型還有索引信息等。在 Mapping 里也包含了一些屬性,比如字段名稱、類型、字段使用的分詞器、是否評分、是否創(chuàng)建索引等屬性。
最近項目準(zhǔn)備用到elasticsearch, 首先需要搞清楚elasticsearch的一些概念,在網(wǎng)上發(fā)現(xiàn)這篇文章不錯,以通俗易懂的語言講明白了mapping的概念。
默認(rèn)mapping
elasticsearch(以下簡稱ES)是沒有模式(schema)的,當(dāng)我們執(zhí)行以下命令:
curl -XPUT http://localhost:9200/test/item/1 -d '{"name":"zach", "description": "A Pretty cool guy."}'ES能非常聰明的識別出"name"和"description"字段的類型是string, ES默認(rèn)會創(chuàng)建以下的mapping。
mappings: {
item: {
properties: {
description: {
type: string
}
name: {
type: string
}
}
}
}什么是mapping
ES的mapping非常類似于靜態(tài)語言中的數(shù)據(jù)類型:聲明一個變量為int類型的變量, 以后這個變量都只能存儲int類型的數(shù)據(jù)。同樣的, 一個number類型的mapping字段只能存儲number類型的數(shù)據(jù)。
同語言的數(shù)據(jù)類型相比,mapping還有一些其他的含義,mapping不僅告訴ES一個field中是什么類型的值, 它還告訴ES如何索引數(shù)據(jù)以及數(shù)據(jù)是否能被搜索到。
當(dāng)你的查詢沒有返回相應(yīng)的數(shù)據(jù), 你的mapping很有可能有問題。當(dāng)你拿不準(zhǔn)的時候, 直接檢查你的mapping。
剖析mapping
一個mapping由一個或多個analyzer組成, 一個analyzer又由一個或多個filter組成的。當(dāng)ES索引文檔的時候,它把字段中的內(nèi)容傳遞給相應(yīng)的analyzer,analyzer再傳遞給各自的filters。
filter的功能很容易理解:一個filter就是一個轉(zhuǎn)換數(shù)據(jù)的方法, 輸入一個字符串,這個方法返回另一個字符串,比如一個將字符串轉(zhuǎn)為小寫的方法就是一個filter很好的例子。
一個analyzer由一組順序排列的filter組成,執(zhí)行分析的過程就是按順序一個filter一個filter依次調(diào)用, ES存儲和索引最后得到的結(jié)果。
總結(jié)來說, mapping的作用就是執(zhí)行一系列的指令將輸入的數(shù)據(jù)轉(zhuǎn)成可搜索的索引項。
默認(rèn)analyzer
回到我們的例子, ES猜測description字段是string類型,于是默認(rèn)創(chuàng)建一個string類型的mapping,它使用默認(rèn)的全局analyzer, 默認(rèn)的analyzer是標(biāo)準(zhǔn)analyzer, 這個標(biāo)準(zhǔn)analyzer有三個filter:token filter, lowercase filter和stop token filter。
我們可以在做查詢的時候鍵入_analyze關(guān)鍵字查看分析的過程。使用以下指令查看description字段的轉(zhuǎn)換過程:
curl -X GET "http://localhost:9200/test/_analyze?analyzer=standard&pretty=true" -d "A Pretty cool guy."
{
"tokens" : [ {
"token" : "pretty",
"start_offset" : 2,
"end_offset" : 8,
"type" : "<ALPHANUM>",
"position" : 2
}, {
"token" : "cool",
"start_offset" : 9,
"end_offset" : 13,
"type" : "<ALPHANUM>",
"position" : 3
}, {
"token" : "guy",
"start_offset" : 14,
"end_offset" : 17,
"type" : "<ALPHANUM>",
"position" : 4
} ]可以看到, 我們的description字段的值轉(zhuǎn)換成了[pretty], [cool], [guy], 在轉(zhuǎn)換過程中大寫的A, 標(biāo)點符號都被filter過濾掉了, Pretty也轉(zhuǎn)成了全小寫的pretty, 這里比較重要的是, 即使ES存儲數(shù)據(jù)的時候仍然存儲的是完整的數(shù)據(jù), 但是可以搜索到這條數(shù)據(jù)的關(guān)鍵字只剩下這三個單詞了, 其他的都是拋棄掉了。
看看以單詞a來搜索的結(jié)果:
$ curl -X GET "http://localhost:9200/test/_search?pretty=true" -d '{
"query" : {
"text" : { "description": "a" }
}
}'
{
"took" : 29,
"timed_out" : false,
"_shards" : {
"total" : 5,
"successful" : 5,
"failed" : 0
},
"hits" : {
"total" : 0,
"max_score" : null,
"hits" : [ ]
}
}
text類型的搜索在查詢過程中使用了和之前插入數(shù)據(jù)相同的分析/過濾系統(tǒng), 所以我們輸入"a",mapping不會有任何返回, 因為單詞“a”不會被ES存儲和索引。反過來,如果我們使用單詞"cool"進(jìn)行搜索:
curl -X GET "http://localhost:9200/test/_search?pretty=true" -d '{
"query" : {
"text" : { "description": "cool" }
}
}'
{
"took" : 29,
"timed_out" : false,
"_shards" : {
"total" : 5,
"successful" : 5,
"failed" : 0
},
"hits" : {
"total" : 1,
"max_score" : 0.15342641,
"hits" : [ {
"_index" : "test",
"_type" : "item",
"_id" : "1",
"_score" : 0.15342641, "_source" : {"name":"zach", "description": "A pretty cool guy"}
} ]
}
}現(xiàn)在就能得到正確的結(jié)果,這是一個公認(rèn)的簡單例子, 但是它描述了ES是如何工作的, 不要把mapping想成是數(shù)據(jù)類型, 把它想象成是搜索數(shù)據(jù)的指令集合。如果你不想字符"a"被刪除, 你需要修改你的analyzer。
原文: http://euphonious-intuition.com/2012/07/an-introduction-to-mapping-in-elasticsearch/
到此這篇關(guān)于elasticsearch中的mapping簡介的文章就介紹到這了,更多相關(guān)elasticsearch mapping內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
每天練一練Java函數(shù)與算法Math函數(shù)總結(jié)與字符串轉(zhuǎn)換整數(shù)
這篇文章主要介紹了Java函數(shù)與算法Math函數(shù)總結(jié)與字符串轉(zhuǎn)換整數(shù),每天練一練,水平在不知不覺中提高,需要的朋友快過來看看吧2021-08-08
spring-core組件詳解——PropertyResolver屬性解決器
這篇文章主要介紹了spring-core組件詳解——PropertyResolver屬性解決器,需要的朋友可以參考下2016-05-05
Springboot + Mysql8實現(xiàn)讀寫分離功能
這篇文章主要介紹了Springboot + Mysql8實現(xiàn)讀寫分離功能,本文通過實例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價值,需要的朋友可以參考下2019-10-10
spring整合JMS實現(xiàn)同步收發(fā)消息(基于ActiveMQ的實現(xiàn))
本篇文章主要介紹了spring整合JMS實現(xiàn)同步收發(fā)消息(基于ActiveMQ的實現(xiàn)),具有一定的參考價值,感興趣的小伙伴們可以參考一下2017-10-10
springBoot Junit測試用例出現(xiàn)@Autowired不生效的解決
這篇文章主要介紹了springBoot Junit測試用例出現(xiàn)@Autowired不生效的解決,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2021-09-09

