Elasticsearch集成Hadoop最佳實踐 帶目錄完整pdf[42MB]
42.1MB / 06-29
實戰(zhàn)Elasticsearch、Logstash、Kibana 完整版pdf[53MB]
53.9MB / 04-04
Elasticsearch頂尖高手系列:核心知識篇+高手進階篇 全套視頻教
1.0GB / 11-16
Elasticsearch技術(shù)解析與實戰(zhàn) (朱林) 完整掃描版[147MB]
147.3MB / 11-16
深入理解ElasticSearch PDF
46MB / 10-27
-
-
Zabbix v7.0使用手冊 中文版PDF 服務器 / 30MB
-
VMware vSphere 8.0.2全套中文手冊 官方PDF完整版 服務器 / 64.6MB
-
Nginx 安全配置指南技術(shù)手冊pdf版 服務器 / 488KB
-
DNS學習從入門到精通 完整PDF版 服務器 / 6.33MB
-
Windows Server 2016系統(tǒng)配置指南 完整pdf掃描版[155MB] 服務器 / 154.8MB
-
-
Windows Server 2016 Active Directory配置指南 中文PDF版 服務器 / 23.3MB
-
-
vSAN操作指南 中文PDF完整版 服務器 / 6.11MB
詳情介紹
《相關性搜索:利用Solr與Elasticsearch創(chuàng)建智能應用》揭開了相關性搜索的神秘面紗,告訴大家如何將 Elasticsearch與 Solr這樣的搜索引擎作為可編程的相關性框架,從而表達業(yè)務排名規(guī)則。從這《相關性搜索:利用Solr與Elasticsearch創(chuàng)建智能應用》中你可學會如何結(jié)合各種外部數(shù)據(jù)源、分類方法以及文本分析手段對相關性進行編程,以滿足用戶的個性化需求,將令人滿意的搜索結(jié)果呈現(xiàn)給用戶。此外,相關性搜索也需要一定的軟性技能《相關性搜索:利用Solr與Elasticsearch創(chuàng)建智能應用》還將告訴讀者怎樣與業(yè)務人員協(xié)作,為業(yè)務找到正確的相關性需求,從而在搜索產(chǎn)品的整個研發(fā)生命周期內(nèi),實現(xiàn)相關性改進的良性循環(huán)。 本書介紹了搜索引擎的基本原理,及相關性搜索的調(diào)試技術(shù),用大量實例的方式詳述了搜索引擎的諸多特性,以形成一整套針對相關性搜索的系統(tǒng)化方法,并倡導致力于提高搜索質(zhì)量的企業(yè)文化?!断嚓P性搜索:利用Solr與Elasticsearch創(chuàng)建智能應用》適用于想利用 Elasticsearch或 Solr嘗試構(gòu)建智能搜索應用的開發(fā)人員。
目錄
第1章 搜索的相關性問題
1.1 我們的目標:掌握相關性技術(shù)研發(fā)的技能
1.2 為什么搜索的相關性如此之難
1.2.1 什么是具備“相關性”的搜索結(jié)果
1.2.2 搜索:沒有銀彈
1.3 來自相關性研究的啟示
1.3.1 信息檢索
1.3.2 能否利用信息檢索解決相關性問題
1.4 如何解決相關性
1.5 不只是技術(shù):管理、協(xié)作與反饋
1.6 本章小結(jié)
第2章 搜索—幕后揭秘
2.1 搜索101
2.1.1 什么是搜索文檔
2.1.2 對內(nèi)容進行搜索
2.1.3 通過搜索來探索內(nèi)容
2.1.4 獲取進入搜索引擎的內(nèi)容
2.2 搜索引擎的數(shù)據(jù)結(jié)構(gòu)
2.2.1 倒排索引
2.2.2 倒排索引的其他內(nèi)容
2.3 對內(nèi)容進行索引:提取、充實、分析和索引
2.3.1 將內(nèi)容提取為文檔
2.3.2 充實文檔以清理、強化與合并數(shù)據(jù)
2.3.3 執(zhí)行分析
2.3.4 索引
2.4 文檔的搜索和獲取
2.4.1 布爾搜索: AND/OR/NOT
2.4.2 基于 Lucene搜索的布爾查詢(MUST/MUST_NOT/SHOULD)
2.4.3 位置和短語匹配
2.4.4 助力用戶瀏覽:過濾、切面和聚合
2.4.5 排序、結(jié)果排名,以及相關性
2.5 本章小結(jié)
第3章 調(diào)試我們的第一個相關性問題
3.1 Solr和Elasticsearch的應用:基于Elasticsearch的例子
3.2 最了不起的數(shù)據(jù)集:TMDB
3.3 用Python語言編寫的例子
3.4 第一個搜索應用
3.4.1 針對 TMDB Elasticsearch索引的第一次搜索
3.5 調(diào)試查詢匹配
3.5.1 檢查底層查詢策略
3.5.2 剖析查詢解析
3.5.3 調(diào)試分析,解決匹配問題
3.5.4 比較查詢條件和倒排索引
3.5.5 通過修改分析器來修正我們的匹配
3.6 調(diào)試排名
3.6.1 利用 Lucene的解釋功能來剖析相關性評價
3.6.2 向量空間模型、相關性解釋信息和我們
3.6.3 向量空間模型在實踐中的注意事項
3.6.4 通過對匹配的評價來度量相關性
3.6.5 用 TF×IDF計算權(quán)重
3.6.6 謊言、該死的謊言和相似度
3.6.7 決定搜索詞重要性的因素
3.6.8 解決 Space Jam和 alien的排名問題
3.7 問題解決了?工作永遠做不完!
3.8 本章小結(jié)
第4章 駕馭token
4.1 將token作為文檔特征
4.1.1 匹配的流程
4.1.2 token,不只是單詞
4.2 控制查準率和查全率
4.2.1 查準率和查全率的例子
4.2.2 查準率或查全率的分析
4.2.3 一味提高查全率
4.3 查準率和查全率—讓魚和熊掌兼得
4.3.1 評價單一字段中特征的強度
4.3.2 超越 TF × IDF的評價:多搜索詞與多字段
4.4 分析策略
4.4.1 處理分隔符
4.4.2 捕獲同義詞的語義
4.4.3 在搜索中為專指性建模
4.4.4 利用同義詞為專指性建模
4.4.5 利用路徑為專指性建模
4.4.6 對整個世界分詞
4.4.7 對整數(shù)分詞
4.4.8 對地理數(shù)據(jù)分詞
4.4.9 對歌曲分詞
4.5 本章小結(jié)
第5章 多字段搜索基礎
5.1 信號及信號建模
5.1.1 什么是信號
5.1.2 從源數(shù)據(jù)模型開始
5.1.3 實現(xiàn)信號
5.1.4 信號建模:為數(shù)據(jù)的相關性建模
5.2 TMDB—搜索,人類最后的邊疆
5.2.1 違反基本法則
5.2.2 讓嵌套文檔扁平化
5.3 在以字段為中心的搜索中給信號建模
5.3.1 從 best_.elds開始
5.3.2 控制搜索結(jié)果中的字段偏好
5.3.3 可以使用信號更精準的 best_.elds嗎
5.3.4 讓失敗者分享榮耀:為 best_.elds校準
5.3.5 利用 most_.elds統(tǒng)計多個信號
5.3.6 在 most_.elds中縮放信號
5.3.7 什么時候其他匹配才無關緊要
5.3.8 有關 most_.elds的結(jié)論是什么
5.4 本章小結(jié)
第6章 以詞為中心的搜索
6.1 什么是以詞為中心的搜索
6.2 我們?yōu)槭裁葱枰栽~為中心的搜索
6.2.1 獵尋“白化象”
6.2.2 在“星際迷航”的例子中尋找白化象問題
6.2.3 避免信號沖突
6.2.4 理解信號沖突的機理
6.3 完成第一個以詞為中心的搜索
6.3.1 使用以詞為中心的排名函數(shù)
6.3.2 運行以詞為中心的查詢解析器(深入底層)
6.3.3 理解字段同步
6.3.4 字段同步和信號建模
6.3.5 查詢解析器和信號沖突
6.3.6 對以詞為中心的搜索進行調(diào)優(yōu)
6.4 在以詞為中心的搜索中解決信號沖突
6.4.1 將字段合并成自定義全字段
6.4.2 利用 cross_.elds解決信號沖突
6.5 結(jié)合以字段為中心和以詞為中心的策略:魚與熊掌兼得
6.5.1 將“相似字段”分到一組
6.5.2 理解相似字段的局限
6.5.3 將貪婪的簡單搜索和保守的放大器結(jié)合起來
6.5.4 以詞為中心與以字段為中心,查準率與查全率
6.5.5 考慮過濾、放大,以及重新排名
6.6 本章小結(jié)
第7章 調(diào)整相關性函數(shù)
7.1 何謂評價調(diào)整
7.2 放大:通過突出結(jié)果來實現(xiàn)調(diào)整
7.2.1 放大:最后的邊疆
7.2.2 放大時—選擇加法運算還是乘法運算,布爾查詢還是函數(shù)查詢?
7.2.3 選擇第一扇門:利用布爾查詢進行加法放大
7.2.4 選擇第二扇門:利用數(shù)學運算進行排名的函數(shù)查詢
7.2.5 函數(shù)查詢實踐:簡單的乘法放大
7.2.6 放大處理的基礎:信號,處處是信號
7.3 過濾:通過排除的方法對結(jié)果進行調(diào)整
7.4 滿足業(yè)務需求的評價調(diào)整策略
7.4.1 搜索所有影片
7.4.2 對放大信號進行建模
7.4.3 構(gòu)造排名函數(shù):增加具有較高價值的層級
7.4.4 利用函數(shù)查詢對具有較高價值的層級進行評價
7.4.5 忽略 TF × IDF
7.4.6 捕捉綜合質(zhì)量指標
7.4.7 達成用戶的時效性目標
7.4.8 結(jié)合函數(shù)查詢
7.4.9 把一切聯(lián)系起來
7.5 本章小結(jié)
第8章 提供相關性反饋
8.1 搜索框中的相關性反饋
8.1.1 利用“即輸即搜”提供即時結(jié)果
8.1.2 利用“搜索補全”幫助用戶找到最佳查詢
8.1.3 利用搜索建議來修正輸入和拼寫錯誤
8.2 瀏覽期間的相關性反饋
8.2.1 構(gòu)建基于切面的瀏覽
8.2.2 提供面包線導航
8.2.3 選擇其他的結(jié)果排序方式
8.3 搜索結(jié)果清單中的相關性反饋
8.3.1 什么信息應該出現(xiàn)在搜索結(jié)果中
8.3.2 通過文本片段與高亮提供相關性反饋
8.3.3 對相似文檔分組
8.3.4 在用戶搜不到結(jié)果時給予幫助
8.4 本章小結(jié)
第9章 設計以相關性為核心的搜索應用
9.1 Yowl!一個絕佳的新起點
9.2 信息和需求的收集
9.2.1 理解用戶及其信息需求
9.2.2 理解業(yè)務需求
9.2.3 找出必要及可用的信息
9.3 搜索應用的設計
9.3.1 將用戶體驗可視化
9.3.2 定義字段和模型的信號
9.3.3 信號的組合與平衡
9.4 部署、監(jiān)控和改進
9.4.1 監(jiān)控
9.4.2 找出問題并解決它們
9.5 知道什么是恰到好處
9.6 本章小結(jié)
第10章 以相關性為核心的企業(yè)
10.1 反饋:以相關性為核心的企業(yè)所依賴的基石
10.2 為什么以用戶為中心的文化比數(shù)據(jù)驅(qū)動的文化更重要
10.3 無視相關性的天馬行空
10.4 相關性反饋的覺醒:領域?qū)<液蛯I(yè)用戶
10.5 相關性反饋的成長:內(nèi)容管理
10.5.1 內(nèi)容管理員的角色
10.5.2 與內(nèi)容管理員缺乏交流的風險
10.6 讓相關性更加流暢:工程師/內(nèi)容管理員的結(jié)對
10.7 讓相關性加速:測試驅(qū)動的相關性
10.7.1 理解測試驅(qū)動的相關性
10.7.2 使用帶用戶行為數(shù)據(jù)的測試驅(qū)動相關性
10.8 超越測試驅(qū)動的相關性:學習排序
10.9 本章小結(jié)
第11章 語義和個性化搜索
11.1 基于用戶概況的個性化搜索
11.1.1 收集用戶的概況信息
11.1.2 將概要信息與文檔索引緊密關聯(lián)
11.2 基于用戶行為的個性化搜索
11.2.1 引入?yún)f(xié)同過濾
11.2.2 使用共現(xiàn)計數(shù)的基本協(xié)同過濾算法
11.2.3 將用戶行為信息與文檔索引緊密關聯(lián)
11.3 構(gòu)建概念性搜索的基本方法
11.3.1 構(gòu)建概念性信號
11.3.2 利用同義詞對內(nèi)容進行擴充
11.4 利用機器學習來構(gòu)建概念性搜索
11.4.1 概念性搜索中短語的重要性
11.5 連接個性化搜索與概念性搜索
11.6 推薦是一種廣義的搜索
11.6.1 用推薦代替搜索
11.7 祝愿大家有一個美好的相關性搜索之旅
11.8 本章小結(jié)
附錄A 直接根據(jù)TMDB建立索引
附錄B Solr讀者指南
下載地址
人氣書籍
決戰(zhàn)Nginx系統(tǒng)卷:高性能Web服務器詳解與運維 PDF掃描版[94MB]
Tomcat權(quán)威指南(第2版) PDF掃描版
Hadoop實戰(zhàn)(第2版)陸嘉恒著 PDF掃描版
Nginx高性能Web服務器詳解 pdf掃描版[178MB]
精通Windows Server 2008 R2 PDF掃描版[157MB]
大規(guī)模Web服務開發(fā)技術(shù) PDF掃描版[14MB]
Hadoop應用開發(fā)技術(shù)詳解 pdf掃描版
深入剖析Tomcat (Paul Deck) pdf掃描版
Windows Server 2012 Hyper-V虛擬化管理實踐 PDF掃描版[223MB]
學習Nginx HTTP Server(中文版) PDF掃描版[23MB]
下載聲明
☉ 解壓密碼:www.dbjr.com.cn 就是本站主域名,希望大家看清楚,[ 分享碼的獲取方法 ]可以參考這篇文章
☉ 推薦使用 [ 迅雷 ] 下載,使用 [ WinRAR v5 ] 以上版本解壓本站軟件。
☉ 如果這個軟件總是不能下載的請在評論中留言,我們會盡快修復,謝謝!
☉ 下載本站資源,如果服務器暫不能下載請過一段時間重試!或者多試試幾個下載地址
☉ 如果遇到什么問題,請評論留言,我們定會解決問題,謝謝大家支持!
☉ 本站提供的一些商業(yè)軟件是供學習研究之用,如用于商業(yè)用途,請購買正版。
☉ 本站提供的相關性搜索:利用Solr與Elasticsearch創(chuàng)建智能應用 帶目錄完整pdf[129MB] 資源來源互聯(lián)網(wǎng),版權(quán)歸該下載資源的合法擁有者所有。