從零構建知識圖譜 : 技術、方法與案例

邵浩,張凱,李方圓 等

  • 出版商: 機械工業
  • 出版日期: 2021-08-01
  • 售價: $594
  • 貴賓價: 9.5$564
  • 語言: 簡體中文
  • 頁數: 346
  • 裝訂: 平裝
  • ISBN: 7111686837
  • ISBN-13: 9787111686835
  • 相關分類: Text-mining
  • 立即出貨 (庫存 < 4)

買這商品的人也買了...

相關主題

商品描述

這是一本能讓讀者快速從零開始構建工業級知識圖譜的著作。
作者是知識圖譜和自然語言處理領域的專家,本書得到了OpenKG聯合創始人王昊奮、清華大學教授李涓子、
東南大學教授漆桂林、美團知識圖譜團隊負責人張富崢、文因互聯創始人鮑捷等學界和業界知識圖譜扛旗人的一致好評和推薦。

本書不僅詳細講解了知識圖譜的技術原理和構建工具,
而且還循序漸進地講解了知識圖譜的構建方法、步驟和行業應用。
配有大量實戰案例,並且開放了源代碼,確保讀者能學會並落地。

全書一共8章:

第1章介紹了知識圖譜的概念、模式、應用場景和技術架構;

第2章圍繞知識圖譜的技術體系,詳細闡述了知識的表示與建模、
抽取與挖掘、存儲與融合,以及檢索與推理;

第3章通過具體的實例介紹了各種知識圖譜工具的使用;

第4章和第5章從工業實踐的角度講解了從0到1構建通用知識圖譜和領域知識圖譜的步驟和方法,並配備詳細的代碼解讀;

第6~7章講解了知識圖譜的具體應用和一個綜合性的知識圖譜案例——問答系統,進一步指導讀者實踐;

第8章對知識圖譜的未來發展進行了總結和展望。

作者簡介

邵浩

資深人工智能技術專家,vivo技術總監。
曾任狗尾草智能科技AI研究院院長,帶領團隊打造了虛擬生命產品的交互引擎。
上海市靜安區首屆優秀人才,上海市人才發展基金獲得者,杭州市高層次人才。
中國中文信息學會青年工作委員會委員,語言與知識計算專委會委員,
中國計算機學會語音對話與聽覺專委會委員,自然語言處理專委會委員。

日本國立九州大學工學博士,亞利桑那州立大學訪問學者,
曾任上海對外經貿大學副教授,碩士生導師。
共發表論文 50餘篇,專利十餘項,
在國內率先出版了聊天機器人和預訓練語言模型相關的著作,主持多項國*級和省部級課題。


張凱

資深AI算法工程師,主要研究方向包括知識圖譜、對話系統、
推薦系統、機器翻譯等,擁有多年算法落地經驗。
主導構建了開放通用知識圖譜七律,參與了《知識圖譜評測標準》和《知識圖譜白皮書》的編寫。
聊天機器人專業書籍作者之一。


李方圓

資深AI算法工程師,主要研究方向包括機器翻譯、知識圖譜和問答系統,
具有多年實戰項目經驗,現任vivo機器翻譯團隊負責人,主導從零構建機器翻譯能力。


張雲柯

資深AI算法工程師,中文信息學會會員,碩士畢業於加拿大Queen’s University,曾任職於奇虎360。
主要研究方向包括自然語言處理與知識圖譜,
曾於領域內知名會議發表相關論文,擁有豐富的算法落地經驗。

戴錫強

資深AI算法工程師,主要研究方向為知識圖譜、對話系統等,參與構建了百科知識圖譜,
醫藥領域知識圖譜,基於知識圖譜的問答系統等,具有豐富的知識圖譜落地經驗。

目錄大綱

推薦序
前言
第1章 知識圖譜概覽 1
1.1 知識圖譜序言 1
1.2 知識圖譜基本概念 3
1.2.1 知識圖譜背景 3
1.2.2 知識圖譜的定義 5
1.2.3 典型知識圖譜示例 7
1.3 知識圖譜的模式 10
1.4 為什麼需要知識圖譜 13
1.5 知識圖譜的典型應用 15
1.6 知識圖譜的技術架構 17
參考文獻 18

第2章 知識圖譜技術體系 19
2.1 知識表示與知識建模 19
2.1.1 知識表示 19
2.1.2 知識建模 26
2.2 知識抽取與知識挖掘 29
2.2.1 知識抽取 29
2.2.2 知識挖掘 38
2.3 知識存儲與知識融合 42
2.3.1 知識存儲 42
2.3.2 知識融合 47
2.4 知識檢索與知識推理 52
2.4.1 知識檢索 53
2.4.2 知識推理 58
參考文獻 61

第3章 知識圖譜工具 63
3.1 知識建模工具 63
3.1.1 Protégé 64
3.1.2 其他本體建模工具 79
3.1.3 本體建模工具的選擇 83
3.2 知識抽取工具 84
3.2.1 DeepDive 84
3.2.2 其他知識抽取工具 102
3.2.3 知識抽取工具對比 106
3.3 知識存儲工具 107
3.3.1 Neo4j 108
3.3.2 Neo4j安裝與部署 109
3.3.3 可視化 113
3.3.4 圖模型 115
3.3.5 其他圖數據庫 120
參考文獻 122

第4章 從零構建通用知識圖譜 123
4.1 通用知識表示與抽取 123
4.1.1 通用知識數據來源 123
4.1.2 實體層構建 126
4.1.3 表述層構建 131
4.1.4 概念層構建 134
4.2 知識增強 135
4.2.1 實體層知識增強 135
4.2.2 模式完善 139
4.2.3 實體鏈接:表述層與實體層之間的映射 144
4.2.4 實體分類:實體層與概念層之間的映射 146
4.3 百科知識存儲與更新 153
4.3.1 屬性圖存儲模型 154
4.3.2 知識存儲 156
4.3.3 知識更新 168

第5章 領域知識圖譜構建 172
5.1 領域知識圖譜概覽 172
5.2  醫藥領域知識圖譜 173
5.2.1 領域模式構建 174
5.2.2 領域知識抽取 176
5.2.3 領域圖譜構建 178
5.2.4 圖譜展示 182
5.3 用戶畫像圖譜 183
5.3.1 用戶畫像知識表示 183
5.3.2 知識抽取和挖掘 185
5.3.3 抽取案例 194
參考文獻 207

第6章 知識圖譜應用 208
6.1 知識可視化 208
6.1.1 D3 208
6.1.2 ECharts 213
6.1.3 其他工具介紹 220
6.1.4 小結 225
6.2 實體鏈接 225
6.2.1 實體鏈接的定義 225
6.2.2 實體鏈接的步驟 226
6.2.3 實體鏈接工具 232
6.2.4 實體鏈接的應用 242
6.3 知識問答 245
6.3.1 知識問答系統概述 245
6.3.2 知識問答系統的主要流程 247
6.3.3 主流知識問答系統介紹 252
6.3.4 問答系統實戰 260
6.4 聯想 277
6.4.1 聯想整體流程 278
6.4.2 話題識別 279
6.4.3 候選話題生成 280
6.4.4 候選話題排序 282
6.4.5 聯想回復生成 290
參考文獻 292

第7章 基於知識圖譜的問答系統 297
7.1 簡介 297
7.2 自然語言理解 300
7.2.1 概述 300
7.2.2 基礎NLU 301
7.2.3 意圖理解 309
7.2.4 實體識別與鏈接 317
7.2.5 文本相似度與向量化 317
7.3 對話管理 322
7.3.1 概述 322
7.3.2 知識問答 327
7.3.3 閒聊 331
7.4 自然語言生成 332
7.5 服務化 333
參考文獻 335
第8章 總結與展望 336
參考文獻 338