Lucene實(shí)現(xiàn)多種高級(jí)搜索形式
布爾操作符
大多數(shù)的搜索引擎都會(huì)提供布爾操作符讓用戶可以組合查詢,典型的布爾操作符有 AND, OR, NOT。Lucene 支持 5種布爾操作符,分別是 AND, OR, NOT, 加(+), 減(-)。接下來(lái)我會(huì)講述每個(gè)操作符的用法。
OR: 如果你要搜索含有字符 A 或者 B 的文檔,那么就需要使用 OR操作符。需要記住的是,如果你只是簡(jiǎn)單的用空格將兩個(gè)關(guān)鍵詞分割開(kāi),其實(shí)在搜索的時(shí)候搜索引擎會(huì)自動(dòng)在兩個(gè)關(guān)鍵詞之間加上 OR操作符。例如,“Java OR Lucene” 和 “Java Lucene” 都是搜索含有 Java 或者含有 Lucene的文檔。
AND: 如果你需要搜索包含一個(gè)以上關(guān)鍵詞的文檔,那么就需要使用 AND 操作符。例如,“Java AND Lucene”返回所有既包含 Java 又包含 Lucene 的文檔。
NOT: Not 操作符使得包含緊跟在 NOT 后面的關(guān)鍵詞的文檔不會(huì)被返回。例如,如果你想搜索所有含有 Java 但不含有Lucene 的文檔,你可以使用查詢語(yǔ)句 “Java NOT Lucene”。但是你不能只對(duì)一個(gè)搜索詞使用這個(gè)操作符,比如,查詢語(yǔ)句“NOT Java” 不會(huì)返回任何結(jié)果。
加號(hào)(+): 這個(gè)操作符的作用和 AND 差不多,但它只對(duì)緊跟著它的一個(gè)搜索詞起作用。例如,如果你想搜索一定包含Java,但不一定包含 Lucene 的文檔,就可以使用查詢語(yǔ)句“+Java Lucene”。
減號(hào)(-): 這個(gè)操作符的功能和 NOT 一樣,查詢語(yǔ)句 “Java -Lucene” 返回所有包含 Java 但不包含Lucene 的文檔。
接下來(lái)我們看一下如何利用 Lucene 提供的 API 來(lái)實(shí)現(xiàn)布爾查詢。清單1 顯示了如果利用布爾操作符進(jìn)行查詢的過(guò)程。
清單1:使用布爾操作符
//Test boolean operator public void testOperator(String indexDirectory) throwsException{ Directory dir =FSDirectory.getDirectory(indexDirectory,false); IndexSearcher indexSearcher = new IndexSearcher(dir); String[] searchWords = {"Java AND Lucene", "Java NOT Lucene", "JavaOR Lucene", "+Java +Lucene", "+Java -Lucene"}; Analyzer language = new StandardAnalyzer(); Query query; for(int i = 0; i < searchWords.length; i++){ query = QueryParser.parse(searchWords[i], "title", language); Hits results = indexSearcher.search(query); System.out.println(results.length() + "search results for query " +searchWords[i]);}<p></p> <p></p>
域搜索(Field Search)
Lucene 支持域搜索,你可以指定一次查詢是在哪些域(Field)上進(jìn)行。例如,如果索引的文檔包含兩個(gè)域,Title 和Content,你就可以使用查詢 “Title: Lucene AND Content: Java” 來(lái)返回所有在 Title域上包含 Lucene 并且在 Content 域上包含 Java 的文檔。清單 2 顯示了如何利用 Lucene 的 API來(lái)實(shí)現(xiàn)域搜索。
清單2:實(shí)現(xiàn)域搜索
<p>//Test field search public void testFieldSearch(String indexDirectory) throwsException{ Directory dir =FSDirectory.getDirectory(indexDirectory,false); IndexSearcher indexSearcher = new IndexSearcher(dir); String searchWords = "title:Lucene AND content:Java"; Analyzer language = new StandardAnalyzer(); Query query = QueryParser.parse(searchWords, "title",language); Hits results = indexSearcher.search(query); System.out.println(results.length() + "search results for query " +searchWords);</p> <p></p>
通配符搜索(Wildcard Search)
Lucene支持兩種通配符:?jiǎn)柼?hào)(?)和星號(hào)(*)。你可以使用問(wèn)號(hào)(?)來(lái)進(jìn)行單字符的通配符查詢,或者利用星號(hào)(*)進(jìn)行多字符的通配符查詢。例如,如果你想搜索tiny 或者 tony,你就可以使用查詢語(yǔ)句 “t?ny”;如果你想查詢 Teach, Teacher 和Teaching,你就可以使用查詢語(yǔ)句 “Teach*”。清單3 顯示了通配符查詢的過(guò)程。
清單3:進(jìn)行通配符查詢
<p>//Test wildcard search public void testWildcardSearch(String indexDirectory)throwsException{ Directory dir =FSDirectory.getDirectory(indexDirectory,false); IndexSearcher indexSearcher = new IndexSearcher(dir); String[] searchWords = {"tex*", "tex?", "?ex*"}; Query query; for(int i = 0; i < searchWords.length; i++){ query = new WildcardQuery(new Term("title",searchWords[i])); Hits results = indexSearcher.search(query); System.out.println(results.length() + "search results for query " +searchWords[i]);}</p> <p></p>
模糊查詢
Lucene 提供的模糊查詢基于編輯距離算法(Edit distance algorithm)。你可以在搜索詞的尾部加上字符 ~來(lái)進(jìn)行模糊查詢。例如,查詢語(yǔ)句 “think~” 返回所有包含和 think 類(lèi)似的關(guān)鍵詞的文檔。清單 4 顯示了如果利用Lucene 的 API 進(jìn)行模糊查詢的代碼。
清單4:實(shí)現(xiàn)模糊查詢
<p>//Test fuzzy search public void testFuzzySearch(String indexDirectory)throwsException{ Directory dir =FSDirectory.getDirectory(indexDirectory,false); IndexSearcher indexSearcher = new IndexSearcher(dir); String[] searchWords = {"text", "funny"}; Query query; for(int i = 0; i < searchWords.length; i++){ query = new FuzzyQuery(new Term("title",searchWords[i])); Hits results = indexSearcher.search(query); System.out.println(results.length() + "search results for query " +searchWords[i]);}</p> <p></p>
范圍搜索(Range Search)
范圍搜索匹配某個(gè)域上的值在一定范圍的文檔。例如,查詢 “age:[18 TO 35]” 返回所有 age 域上的值在 18 到35 之間的文檔。清單5顯示了利用 Lucene 的 API 進(jìn)行返回搜索的過(guò)程。
清單5:測(cè)試范圍搜索
<p>//Test range search public void testRangeSearch(String indexDirectory)throwsException{ Directory dir =FSDirectory.getDirectory(indexDirectory,false); IndexSearcher indexSearcher = new IndexSearcher(dir); Term begin = new Term("birthDay","20000101"); Term end = newTerm("birthDay","20060606"); Query query = new RangeQuery(begin,end,true); Hits results = indexSearcher.search(query); System.out.println(results.length() + "search results isreturned"); }</p>
以上所述是小編給大家介紹的Lucene實(shí)現(xiàn)多種高級(jí)搜索形式,希望對(duì)大家有所幫助,如果大家有任何疑問(wèn)請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)腳本之家網(wǎng)站的支持!
- 使用Lucene實(shí)現(xiàn)一個(gè)簡(jiǎn)單的布爾搜索功能
- Lucene.Net實(shí)現(xiàn)搜索結(jié)果分類(lèi)統(tǒng)計(jì)功能(中小型網(wǎng)站)
- Java實(shí)現(xiàn)lucene搜索功能的方法(推薦)
- 基于Lucene的Java搜索服務(wù)器Elasticsearch安裝使用教程
- 使用Java的Lucene搜索工具對(duì)檢索結(jié)果進(jìn)行分組和分頁(yè)
- 使用Lucene.NET實(shí)現(xiàn)站內(nèi)搜索
- 基于ASP.NET的lucene.net全文搜索實(shí)現(xiàn)步驟
相關(guān)文章
Spring?MVC中的Controller進(jìn)行單元測(cè)試的實(shí)現(xiàn)
本文主要介紹了如何對(duì)Spring?MVC中的Controller進(jìn)行單元測(cè)試的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-02-02Spring6?的JdbcTemplate的JDBC模板類(lèi)的使用介紹(最新推薦)
JdbcTemplate?是Spring?提供的一個(gè)JDBC模板類(lèi),是對(duì)JDBC的封裝,簡(jiǎn)化JDBC代碼,當(dāng)然,你也可以不用,可以讓Spring集成其它的ORM框架,這篇文章主要介紹了Spring6?的JdbcTemplate的JDBC模板類(lèi)的詳細(xì)使用說(shuō)明,需要的朋友可以參考下2024-05-05零基礎(chǔ)寫(xiě)Java知乎爬蟲(chóng)之獲取知乎編輯推薦內(nèi)容
上篇文章我們拿百度首頁(yè)做了個(gè)小測(cè)試,今天我們來(lái)個(gè)復(fù)雜的,直接抓取知乎編輯推薦的內(nèi)容,小伙伴們可算松了口氣,終于進(jìn)入正題了,哈哈。2014-11-11詳解在spring boot中配置多個(gè)DispatcherServlet
本篇文章主要介紹了詳解在spring boot中配置多個(gè)DispatcherServlet,具有一定的參考價(jià)值,有興趣的可以了解一下。2017-03-03解決項(xiàng)目沒(méi)有build path的問(wèn)題
這篇文章主要介紹了解決項(xiàng)目沒(méi)有build path的問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-01-01