Elasticsearch?計(jì)數(shù)分詞中的token使用實(shí)例
正文
在我們針對(duì) text 類型的字段進(jìn)行分詞時(shí),分詞器會(huì)把該字段分解為一個(gè)個(gè)的 token。如果你對(duì)分詞器還不是很理解的話,請(qǐng)參考我之前的文章 “Elasticsearch: analyzer”。在分詞時(shí),有一個(gè)叫做 token_count 的類型。該類型是 token 的計(jì)數(shù)器,也就是說,我們可以使用它來了解在索引字段時(shí)在字符串中生成的 token 數(shù)量。
我們下面用一個(gè)比較簡(jiǎn)單的例子來進(jìn)行展示。在我們的示例中,我們將索引一些書名,并且我們將過濾標(biāo)題中只有 2 個(gè) token 的書。
` PUT book_token_count_test { "mappings": { "properties": { "book_name": { "type": "text", "fields": { "size": { "type": "token_count", "analyzer": "standard" } } } } } } `
使用命令寫入文檔
我們使用如下的命令來寫入一下文檔:
POST book_token_count_test/_bulk {"index":{}} { "book_name": "Ulysses" } {"index":{}} { "book_name": "Don Quixote" } {"index":{}} { "book_name": "One Hundred Years of Solitude" }
搜索 token 文檔
我們使用如下的命令來搜索 token 數(shù)為 2 的文檔:
GET book_token_count_test/_search { "query": { "term": { "book_name.size": { "value": "2" } } } }
上面搜索的結(jié)果為:
` { "took": 273, "timed_out": false, "_shards": { "total": 1, "successful": 1, "skipped": 0, "failed": 0 }, "hits": { "total": { "value": 1, "relation": "eq" }, "max_score": 1, "hits": [ { "_index": "book_token_count_test", "_id": "cxczBoYB6OPboMnB7TQu", "_score": 1, "_source": { "book_name": "Don Quixote" } } ] } } `
我們可以使用 range 查詢來檢索 book_name 中包含 3 個(gè)以上 token 的文檔,我們只會(huì)得到標(biāo)題為 “One Hundred Years of Solitude” 的文檔。
GET book_token_count_test/_search { "query": { "range": { "book_name.size": { "gte": 3 } } } }
上面搜索的結(jié)果為:
` { "took": 1, "timed_out": false, "_shards": { "total": 1, "successful": 1, "skipped": 0, "failed": 0 }, "hits": { "total": { "value": 1, "relation": "eq" }, "max_score": 1, "hits": [ { "_index": "book_token_count_test", "_id": "dBczBoYB6OPboMnB7TQu", "_score": 1, "_source": { "book_name": "One Hundred Years of Solitude" } } ] } } `
以上就是Elasticsearch 計(jì)數(shù)分詞中的token使用實(shí)例的詳細(xì)內(nèi)容,更多關(guān)于Elasticsearch計(jì)數(shù)分詞token的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
基于jmeter實(shí)現(xiàn)跨線程組傳遞token過程圖解
這篇文章主要介紹了基于jmeter實(shí)現(xiàn)跨線程組傳遞token,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-04-04Springcloud中的region和zone的使用實(shí)例
這篇文章主要介紹了Springcloud中的region和zone的使用實(shí)例,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-10-10java讀取http請(qǐng)求中的body實(shí)例代碼
下面小編就為大家?guī)硪黄猨ava讀取http請(qǐng)求中的body實(shí)例代碼。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2016-09-09Java數(shù)據(jù)結(jié)構(gòu)順序表的詳細(xì)講解
大家好,今天給大家?guī)淼氖琼樞虮恚矣X得順序表還是有比較難理解的地方的,于是我就把這一塊的內(nèi)容全部整理到了一起,希望能夠給剛剛進(jìn)行學(xué)習(xí)數(shù)據(jù)結(jié)構(gòu)的人帶來一些幫助,或者是已經(jīng)學(xué)過這塊的朋友們帶來更深的理解,我們現(xiàn)在就開始吧2022-05-05Java字節(jié)碼增強(qiáng)技術(shù)知識(shí)點(diǎn)詳解
在本篇文章里小編給大家整理的是一篇關(guān)于Java字節(jié)碼增強(qiáng)技術(shù)知識(shí)點(diǎn)詳解內(nèi)容,有興趣的朋友可以跟著學(xué)習(xí)下。2021-08-08