大模型 RAG 實戰：RAG 原理、應用與系統構建

Name: 大模型 RAG 實戰：RAG 原理、應用與系統構建
Price: 505 TWD
Availability: InStock
Author: 汪鵬, 谷清水, 卞龍鵬
ISBN: 7111761995

汪鵬, 谷清水, 卞龍鵬

出版商: 機械工業
出版日期: 2024-09-01
定價: $594
售價: 8.5 折 $505 (限時優惠至 2026-03-31)
語言: 簡體中文
頁數: 203
裝訂: 平裝
ISBN: 7111761995
ISBN-13: 9787111761990
相關分類: Large language model

立即出貨

買這商品的人也買了...

$474

機器學習
~~$580~~ $452

無瑕的程式碼－整潔的軟體設計與架構篇 (Clean Architecture: A Craftsman's Guide to Software Structure and Design)
~~$894~~ $849

機器人 SLAM 導航：核心技術與實戰
~~$599~~ $569

Elasticsearch 數據搜索與分析實戰
~~$750~~ $592

最強 AI 投資分析：打造自己的股市顧問機器人，股票趨勢分析 × 年報解讀 × 選股推薦 × 風險管理
$555

大規模語言模型：從理論到實踐
~~$880~~ $748

跟 NVIDIA 學深度學習！從基本神經網路到 ......、GPT、BERT...，紮穩機器視覺與大型語言模型 (LLM) 的建模基礎
~~$660~~ $561

Python：股票 × ETF 量化交易實戰 105個活用技巧, 2/e
$402

Diffusion AI 繪圖模型構造與訓練實戰
~~$594~~ $564

人工智能邊緣運算開發實戰：基於 NVIDIA Jetson Nano
~~$880~~ $695

LLM 走進你的電腦 - 自己動手開發大型語言模型應用
~~$650~~ $507

LLM 大型語言模型的絕世祕笈：27路獨步劍法，帶你闖蕩生成式 AI 的五湖四海（iThome鐵人賽系列書）
~~$414~~ $393

AI 訓練師手冊：演算法與模型訓練從入門到精通
~~$780~~ $616

機器學習的訓練資料 (Training Data for Machine Learning)
$378

大模型應用開發：RAG 入門與實戰
~~$880~~ $695

全格局使用 PyTorch - 深度學習和圖神經網路 - 基礎篇, 2/e
~~$680~~ $537

最新 AI 開發範式 - Agent 多重智慧體自動產生應用
~~$880~~ $695

多 Agent 智慧體 - LangChain 大型 ReAct 系統開發
$708

基於大模型的 RAG 應用開發與優化 — 構建企業級 LLM 應用
$504

大模型實戰：微調、優化與私有化部署
~~$680~~ $537

讓 AI 好好說話！從頭打造 LLM (大型語言模型) 實戰秘笈
$446

AI律師助理：律師實務ChatGPT實戰指南
$356

DeepSeek 實用操作指南 : 入門、搜索、答疑、寫作
~~$650~~ $507

生成式 AI 專案實踐指南：從模型挑選、上線、RAG 技術到 AI Agent 整合
~~$980~~ $774

LLM 最強重武裝 - RAG 開發應用優化現場直擊

商品描述

這是一本全面講解RAG技術原理、實戰應用與系統構建的著作。作者結合自身豐富的實戰經驗，詳細闡述了RAG的基礎原理、核心組件、優缺點以及使用場景，同時探討了RAG在大模型應用開發中的變革與潛力。

書中不僅揭示了RAG技術背後的數學原理，還通過豐富的案例與代碼實現，引導讀者從理論走向實踐，輕鬆掌握RAG系統的構建與優化。無論你是深度學習初學者，還是希望提升RAG應用技能的開發者，本書都將為你提供寶貴的參考與指導。

通過閱讀本書，你將掌握以下知識：透徹理解RAG的召回和生成模塊算法、高級RAG系統的技巧、RAG系統的各種訓練方式方法、深入瞭解RAG的範式變遷、實戰0基礎搭建RAG系統、實戰高級RAG系統微調與流程搭建。

作者簡介

汪鵬，資深NLP技術專家和AI技術專家，擁有多年NLP落地經驗。擅長結合用戶場景，針對性地設計圖譜、問答、檢索、多模態、AIGC等相關的算法和落地方案。在Kaggle獲得多枚獎牌，等級master。擁有公眾號“NLP前沿”。

目錄大綱

前　言
第一部分　基礎
第1章　RAG與大模型應用　2
1.1　大模型應用的方向：RAG　　2
1.1.1 　什麼是RAG　　2
1.1.2　RAG與模型微調的對比　　5
1.1.3　RAG帶來的範式改變　　5
1.2　為什麼需要RAG　　6
1.2.1　大模型的知識更新問題　　6
1.2.2　大模型生成結果的不可解釋性問題　　8
1.2.3　大模型的數據泄露問題　　8
1.2.4　大模型的訓練成本問題　　9
1.3　RAG的工作流程　　9
1.3.1　數據準備　　10
1.3.2　數據召回　　11
1.3.3　答案生成　　12
1.4　RAG的優缺點　　12
1.4.1　RAG的優點　　12
1.4.2　RAG的缺點　　13
1.5　RAG的使用場景　　14
1.6　RAG面臨的挑戰　　16
1.6.1　LLM的伸縮法則與知識庫大小的關系　　16
1.6.2　相似度搜索的性能問題　　17
1.7　本章小結　　19
第2章　語言模型基礎　20
2.1　Transformer　　20
2.1.1　詞嵌入　　24
2.1.2　編碼器　　35
2.1.3　解碼器　　39
2.1.4　解碼頭　　41
2.2　自動編碼器　　41
2.2.1　ELMo　　42
2.2.2　BERT　　43
2.3　自回歸模型　　47
2.3.1　GPT　　48
2.3.2　LLaMA　　53
2.4　本章小結　　56
第3章　文本召回模型　58
3.1　文本召回模型基礎　　58
3.2　稠密向量檢索模型　　61
3.2.1　SimCSE　　61
3.2.2　SBERT　　63
3.2.3　CoSENT　　64
3.2.4　WhiteBERT　　65
3.2.5　SGPT　　66
3.3　稀疏向量檢索模型　　67
3.3.1　樸素詞袋模型　　67
3.3.2　TF-IDF　　68
3.3.3　BM25　　70
3.4　重排序模型　　71
3.5　本章小結　　72

第二部分　原理
第4章　RAG核心技術與優化方法　74
4.1　提示詞工程　　74
4.1.1　提示詞工程基礎　　74
4.1.2　RAG場景下的提示詞設計　　81
4.2　文本切塊　　83
4.2.1　固定大小文本切塊　　84
4.2.2　基於NLTK的文本切塊　　85
4.2.3　特殊格式文本切塊　　85
4.2.4　基於深度學習模型的文本切塊　　86
4.3　向量數據庫　　87
4.3.1　Faiss　　88
4.3.2　Milvus　　92
4.3.3　Weaviate　　93
4.3.4　Chroma　　93
4.3.5　Qdrant　　93
4.4　召回環節優化　　94
4.4.1　短文本全域信息增強　　94
4.4.2　召回內容上下文擴充　　95
4.4.3　文本多向量表示　　96
4.4.4　查詢內容優化　　98
4.4.5　召迴文本重排序　　101
4.4.6 　多檢索器融合　　102
4.4.7　結合元數據召回　　104
4.5　效果評估　　107
4.5.1　召回環節評估　　107
4.5.2　模型回答評估　　109
4.6　LLM能力優化　　115
4.6.1　LLM微調　　115
4.6.2　FLARE　　117
4.6.3　Self-RAG　　119
4.7　本章小結　　120
第5章　RAG範式演變　121
5.1　基礎RAG系統　　121
5.1.1　基礎流程　　121
5.1.2　存在的問題　　122
5.2　先進RAG系統　　125
5.3　大模型主導的RAG系統　　127
5.4　多模態RAG系統　　131
5.5　本章小結　　135
第6章　RAG系統訓練　 136
6.1　RAG系統的訓練難點　　136
6.2　訓練方法　　138
6.3　獨立訓練　　138
6.4　序貫訓練　　139
6.4.1　凍結召回模塊　　140
6.4.2　凍結生成模塊　　141
6.5　聯合訓練　　143
6.5.1　異步更新索引　　143
6.5.2　批近似　　147
6.6　本章小結　　149

第三部分　實戰
第7章　基於LangChain實現RAG應用　 152
7.1　LangChain基礎模塊　　152
7.2　基於LangChain實現RAG　　156
7.3　基於Streamlit搭建一個ChatPDF可視化應用　　158
7.4　本章小結　　161
第8章　RAG系統構建與微調實戰　 162
8.1　向量模型構建　　162
8.1.1　模型選型　　162
8.1.2　訓練數據構造　　163
8.1.3　向量模型訓練　　166
8.1.4　向量模型聯合訓練　　167
8.2　大模型指令微調　　175
8.3　復雜問題處理　　179
8.3.1　微調數據構造　　180
8.3.2　微調數據處理　　194
8.3.3　復雜問題推理處理　　200
8.4　本章小結　　203