智能搜索和推薦系統:原理、算法與應用

劉宇 趙宏宇 劉書斌 孫明珠 著

  • 出版商: 機械工業
  • 出版日期: 2021-01-01
  • 售價: $474
  • 貴賓價: 9.5$450
  • 語言: 簡體中文
  • 頁數: 268
  • 裝訂: 平裝
  • ISBN: 7111670671
  • ISBN-13: 9787111670674
  • 相關分類: 推薦系統
  • 立即出貨 (庫存 < 3)

買這商品的人也買了...

相關主題

商品描述

本書是一部面向初學者的搜索和推薦系統實戰寶典。多位資深專家融合自己豐富的工程實踐經驗,一方面精準地介紹了搜索和推薦系統的理論基礎、工作原理和常見架構;一方面深入地講解了機器學習、深度學習、自然語言處理等AI技術在搜索和推薦系統中的應用場景、主要算法及其實現、工程實踐案例。
全書一共12章,分為四大部分。
第一部分(第 1~3 章) 搜索和推薦系統的基礎
首先介紹了概率統計與應用數學的基礎知識,然後介紹了搜索和推薦系統的常識,最後介紹了知識圖譜的基礎理論。
第二部分(第 4~6 章) 搜索系統的基本原理
首先講解了搜索系統的架構和原理,幫助讀者瞭解搜索系統的組成、工作原理以及知識圖譜在搜索系統中的應用;其次講解了搜索系統中涉及的基本模型、機器學習以及深度學習算法;最後講解了評價搜索系統的指標體系。
第三部分(第 7~9 章) 推薦系統的基本原理
首先講解了推薦系統的架構和原理;其次講解了推薦系統中涉及的線性模型、樹模型以及深度學習模型;最後講解了評價推薦系統的指標體系。
第四部分(第 10~12 章) 應用
首先介紹了三種常見的搜索引擎工具,包括 Lucene、Solr和Elasticsearch;其次講解了搜索系統和推薦系統的應用;最後介紹瞭如何充分結合AI與工程在工業界發揮作用。

作者簡介

劉宇
清華大學碩士,現就職於一家跨境電商公司,任技術總監,主要負責該公司搜索推薦業務以及廣告的相關技術開發。
目前工作的重點是算法在搜索系統、推薦系統、對話系統等具體業務場景下的實際應用。
對機器學習、深度學習、大數據應用與開發等頗有研究。
合著有《聊天機器人:入門、進階與實戰》一書。


趙宏宇
本科畢業於東北大學;研究生畢業於RIT,主修AI方向。現就職於獵聘網,主要負責獵聘網推薦排序相關的工作。


劉書斌
本科畢業於東北大學,現就職於美團,資深系統開發工程師。
曾在唯品會任職,主要負責搜索工程的架構設計與實現等相關工作,在ElasticSearch方面有豐富的工程實踐經驗。


孫明珠
碩士畢業於南京航空航天大學,現就職於獵聘網,擔任高級算法工程師,負責查詢理解、解析、擴展等NLP相關的工作。

目錄大綱

推薦序一
推薦序二
前言
第一部分 搜索和推薦系統的基礎
第1章 概率統計與應用數學基礎知識 2
1.1 概率論基礎 2
1.1.1 概率定義 2
1.1.2 隨機變量 5
1.1.3 基礎的概率分佈 5
1.1.4 期望、方差、標準差、協方差 8
1.2 線性代數基礎 10
1.2.1 矩陣 10
1.2.2 向量 10
1.2.3 張量 11
1.2.4 特徵向量和特徵值 12
1.2.5 奇異值分解 12
1.3 機器學習基礎 13
1.3.1 導數 13
1.3.2 梯度 14
1.3.3 最大似然估計 14
1.3.4 隨機過程與隱馬爾可夫模型 15
1.3.5 信息熵 16
1.4 本章小結 18
第2章 搜索系統和推薦系統常識 19
2.1 搜索系統 19
2.1.1 什麽是搜索引擎及搜索系統 19
2.1.2 搜索引擎的發展史 21
2.1.3 搜索引擎的分類 22
2.2 推薦系統 23
2.2.1 什麽是推薦系統 24
2.2.2 推薦系統的發展史 24
2.2.3 推薦系統應用場景 25
2.2.4 推薦系統的分類 26
2.3 搜索與推薦的區別 29
2.4 本章小結 30
第3章 知識圖譜相關理論 31
3.1 知識圖譜概述 31
3.1.1 什麽是知識圖譜 31
3.1.2 知識圖譜的價值 33
3.1.3 知識圖譜的架構 35
3.1.4 知識圖譜的表示與建模 36
3.2 信息抽取 39
3.2.1 實體識別 40
3.2.2 關系抽取 46
3.3 知識融合 50
3.3.1 實體對齊 50
3.3.2 實體消歧 51
3.4 知識加工 53
3.4.1 知識推理 53
3.4.2 質量評估 58
3.5 本章小結 58
第二部分 搜索系統的基本原理
第4章 搜索系統框架及原理 60
4.1 搜索系統的框架 60
4.1.1 基本框架 60
4.1.2 搜索引擎是如何工作的 62
4.2 數據收集及預處理 64
4.2.1 爬蟲 64
4.2.2 數據清洗 66
4.2.3 存儲空間及分佈式設計 68
4.3 文本分析 70
4.3.1 查詢處理 71
4.3.2 意圖理解 82
4.3.3 其他文本分析方法 85
4.4 基於知識圖譜的搜索系統 90
4.5 本章小結 92
第5章 搜索系統中的主要算法 93
5.1 信息檢索基本模型 93
5.1.1 布爾模型 93
5.1.2 向量空間模型 94
5.1.3 概率檢索模型 96
5.1.4 其他模型 100
5.2 搜索和機器學習 102
5.2.1 排序學習 102
5.2.2 排序學習示例 107
5.3 搜索和深度學習 116
5.3.1 DNN模型 116
5.3.2 DSSM模型 118
5.3.3 Transformer 120
5.4 本章小結 126
第6章 搜索系統評價 127
6.1 搜索系統評價的意義 127
6.2 搜索系統的評價體系 127
6.2.1 效率評價 128
6.2.2 效果評價 130
6.3 本章小結 136
第三部分 推薦系統的基本原理
第7章 推薦系統框架及原理 138
7.1 推薦系統的框架及運行 138
7.1.1 基本框架 139
7.1.2 組件及功能 140
7.1.3 推薦引擎是如何工作的 141
7.1.4 推薦系統的經典問題 142
7.2 推薦系統的冷啟動 145
7.3 推薦系統的召回策略 150
7.3.1 基於行為相似的召回 150
7.3.2 基於內容相似的召回 153
7.4 推薦系統排序 160
7.4.1 特徵選擇的方法 160
7.4.2 推薦系統的排序過程 164
7.5 基於知識圖譜的推薦系統 166
7.6 本章小結 168
第8章 推薦系統的主要算法 169
8.1 矩陣分解 169
8.1.1 奇異值分解 170
8.1.2 交替最小二乘 171
8.1.3 貝葉斯個性化排序 172
8.2 線性模型 174
8.2.1 FM模型 175
8.2.2 FFM模型 176
8.3 樹模型 177
8.3.1 決策樹模型 177
8.3.2 集成算法模型 183
8.4 深度學習模型 191
8.4.1 Wide & Deep模型 191
8.4.2 Deep FM模型 197
8.5 本章小結 199
第9章 推薦系統的評價 200
9.1 推薦評估的目的 200
9.2 推薦系統的評價指標 200
9.2.1 RMSE和R方 204
9.2.2 MAP和MRR 204
9.2.3 其他相關指標 205
9.3 推薦系統的評估實驗方法 206
9.3.1 離線評估 206
9.3.2 在線評估 209
9.3.3 主觀評估 213
9.4 本章小結 217
第四部分 應用
第10章 搜索引擎工具 220
10.1 Lucene簡介 220
10.1.1 Lucene的由來及現狀 220
10.1.2 Lucene創建索引過程分析 223
10.1.3 Lucene的搜索過程解析 224
10.2 Solr簡介 226
10.2.1 Solr特性 228
10.2.2 Solr的核心概念 228
10.2.3 Solr的核心功能 228
10.3 Elasticsearch簡介 230
10.3.1 Elasticsearch的核心概念 230
10.3.2 Elasticsearch的核心功能 231
10.4 搜索引擎工具對比 232
10.5 本章小結 233
第11章 搜索應用實戰:基於電商的搜索開發 234
11.1 電商搜索系統的架構設計 234
11.2 ES在搜索系統中的應用 236
11.3 NLP在搜索系統中的應用 237
11.4 商品數據排序算法研究 240
11.5 搜索排序的評價及優化 241
11.6 深度學習在搜索系統中的應用 243
11.7 電商搜索系統中的SEM 243
11.8 本章小結 246
第12章 推薦應用實戰:基於廣告平臺的推薦 247
12.1 推薦系統的架構設計 247
12.2 推薦系統的召回和冷啟動 249
12.3 ES在推薦系統中的應用 251
12.4 推薦系統中NLP的應用 252
12.5 推薦系統中粗排和精排 253
12.6 推薦系統的評價和優化 254
12.7 深度學習在推薦系統應用 255
12.8 本章小結 257