DeepSeek 實戰:從提示詞到部署和實踐

張成文

  • 出版商: 電子工業
  • 出版日期: 2025-04-01
  • 售價: $408
  • 語言: 簡體中文
  • 頁數: 294
  • ISBN: 7121500310
  • ISBN-13: 9787121500312
  • 下單後立即進貨 (約4週~6週)

相關主題

商品描述

本書旨在提供一份全面、易懂的DeepSeek大模型實戰內容,通過深入淺出的講解,幫助讀者快速掌握DeepSeek的核心技術和應用場景。本書不僅涵蓋了DeepSeek的技術原理、架構設計和訓練方法,還詳細介紹瞭如何通過API調用、本地部署和雲服務等方式將DeepSeek集成到實踐項目中。此外,本書通過大量實例和案例分析,展示了DeepSeek在不同領域的應用實踐,幫助讀者更好地理解和應用這一強大的工具。本書圖文並茂,理論翔實,案例豐富,適合從事DeepSeek開發的科研人員以及廣大的開發者作為技術參考和培訓資料,亦可作為高校本科生和研究生的教材。

目錄大綱

目 錄
第1章 DeepSeek初探 1
1.1 大模型的定義 2
1.2 從GPT到DeepSeek 3
1.2.1 GPT模型的發展脈絡 4
1.2.2 DeepSeek模型的發展脈絡 7
1.2.3 技術突破:從全球競速到本土創新 10
1.2.4 應用生態的進化:從工具到生態夥伴 11
1.3 DeepSeek的核心能力和獨特優勢 12
1.3.1 核心能力 12
1.3.2 獨特優勢 14
1.4 DeepSeek的應用場景 16
1.4.1 智能客服 16
1.4.2 輔助辦公 18
1.4.3 智能家居 20
1.4.4 醫療診斷 21
1.4.5 教育學習 22
1.4.6 金融投資 24
1.4.7 智能政務 24
1.5 DeepSeek帶來的機遇 25
1.5.1 DeepSeek模型帶給個人的機遇 26
1.5.2 DeepSeek帶給中小企業的機遇 28
小結 30
第2章 DeepSeek的模型架構 32
2.1 DeepSeek-V3/R1模型的架構 33
2.2 混合專家 35
2.2.1 稠密MoE架構和稀疏MoE架構 36
2.2.2 DeepSeekMoE 37
2.2.3 無輔助損耗負載均衡 39
2.3 多頭潛在註意力 41
2.3.1 鍵值緩存簡介 41
2.3.2 RoPE簡介 43
2.3.3 傳統MHA的緩存機制的不足 46
2.3.4 低秩鍵值聯合壓縮的註意力機制 47
2.4 多Token預測 52
2.4.1 塊級並行解碼策略 53
2.4.2 Meta的MTP方法 53
2.4.3 DeepSeek的MTP方法 54
小結 56
第3章 DeepSeek的訓練架構 57
3.1 DeepSeek的訓練 58
3.1.1 基礎技術 58
3.1.2 訓練過程 61
3.2 DeepSeek在硬件層面的訓練亮點 62
3.2.1 FP8混合精度訓練 62
3.2.2 DualPipe算法 63
3.3 DeepSeek在算法層面的訓練亮點 66
3.3.1 組相對策略優化 67
3.3.2 知識蒸餾 69
3.4 DeepSeek的數據優化手段 70
小結 72
第4章 高質量提示詞 74
4.1 提示詞概述 75
4.1.1 提示詞的定義 75
4.1.2 提示詞的種類 76
4.2 新手常見誤區和陷阱 77
4.3 提示詞的設計技巧 79
4.3.1 STAR法則:讓問題更有條理 79
4.3.2 5W2H法則:全面提問的利器 80
4.3.3 CO-STAR框架:精準表達需求 82
4.3.4 CRISPE框架:激發創意和拓展深度 85
4.3.5 BROKE框架:目標導向和持續優化 86
4.3.6 借助大模型優化提示詞 88
4.4 企業層面的提示詞應用場景 92
4.4.1 傳播策略制定 92
4.4.2 執行發展制定 93
4.4.3 品牌故事生成 94
4.4.4 產品定位 96
小結 97
第5章 面向個人的DeepSeek部署 98
5.1 DeepSeek的模型 99
5.1.1 DeepSeek模型的常見版本 99
5.1.2 DeepSeek模型的版本說明 100
5.1.3 DeepSeek模型的開源協議 101
5.2 硬件需求和配置建議 103
5.2.1 存儲精度 103
5.2.2 顯存占用估算 105
5.3 軟件環境安裝和配置 107
5.3.1 Ollama安裝 107
5.3.2 使用Ollama部署DeepSeek模型 111
5.3.3 Ollama常用API 113
5.4 DeepSeek模型下載和部署 121
5.4.1 Hugging Face社區簡介 121
5.4.2 模型下載 121
5.4.3 常見大模型文件類型 125
5.5 使用Web UI構建對話界面 126
5.5.1 Open-WebUI 126
5.5.2 Hollama 129
5.5.3 ChatBox 132
小結 133
第6章 面向企業的DeepSeek API調用 135
6.1 API調用的優勢 136
6.2 常用DeepSeek API調用方式 137
6.2.1 DeepSeek官方開放平臺 137
6.2.2 DMXAPI 144
小結 148
第7章 面向企業的DeepSeek雲服務部署 149
7.1 本地部署與雲服務部署的對比 150
7.1.1 本地部署的特點 150
7.1.2 雲服務部署的特點 151
7.2 模型推理加速框架 152
7.2.1 推理加速框架的必要性 153
7.2.2 BladeLLM 153
7.2.3 SGLang 156
7.2.4 vLLM 159
7.3 常用DeepSeek雲服務部署方式 164
7.3.1 阿裡雲 164
7.3.2 騰訊雲 171
7.3.3 華為雲 176
7.3.4 火山引擎 181
7.3.5 AutoDL 187
小結 198
第8章 DeepSeek模型訓練 199
8.1 常用訓練框架 200
8.1.1 Unsloth 200
8.1.2 TRL 201
8.2 DeepSeek模型的SFT訓練 202
8.2.1 算力租用 202
8.2.2 模型下載和部署 204
8.2.3 數據預處理 207
8.2.4 模型訓練 208
8.2.5 模型推理 210
8.3 DeepSeek模型的GRPO訓練 212
8.3.1 加載模型 212
8.3.2 配置PEFT模型 213
8.3.3 數據集準備 213
8.3.4 模型訓練 216
8.3.5 模型推理 217
小結 219
第9章 DeepSeek的RAG實戰 220
9.1 用LangChain構建簡單的RAG本地系統 221
9.1.1 RAG管道構建 221
9.1.2 向量數據庫構建 223
9.1.3 Web頁面啟動 225
9.2 開源DeepSeek RAG應用案例 227
9.2.1 Local PDF Chat RAG 227
9.2.2 RAG Flow 231
小結 239?
第10章 DeepSeek的Agent實戰 241
10.1 基於LlamaIndex項目構建簡單的智能體應用 242
10.1.1 軟件安裝和模型下載 243
10.1.2 構建本地知識庫 245
10.1.3 實現基於本地知識庫的智能體問答 246
10.2 基於Swarm框架構建智能體應用 250
10.2.1 Swarm框架介紹 251
10.2.2 DeepSeek模型接入 253
10.2.3 調用外部工具 255
10.3 開源Agent應用框架 260
10.3.1 Browser Use 260
10.3.2 Camel 268
小結 279
參考文獻 281