大規模語言模式開發基礎與實踐

王振麗

出版商: 北京大學
出版日期: 2024-08-01
售價: $534
貴賓價: 9.5 折 $507
語言: 簡體中文
頁數: 368
裝訂: 平裝
ISBN: 730135259X
ISBN-13: 9787301352595

立即出貨

買這商品的人也買了...

$454

深入淺出 SSD：固態存儲核心技術、原理與實戰
$352

機器學習經典算法剖析基於OpenCV
~~$490~~ $417

超限未來：無人駕駛先端技術核新領航 (舊名: 無人駕駛真的來了：第一本從技術面深入的實作書)
~~$834~~ $792

遷移學習 -- TRANSFER LEARNING (楊強教授新作)
$403

仿人機器人建模與控制
$470

計算機視覺中的深度學習
$407

OpenCV 圖像處理入門與實踐
~~$539~~ $512

動手打造深度學習框架
~~$648~~ $616

自動駕駛算法與芯片設計
$709

深入理解電腦視覺：關鍵算法解析與深度神經網絡設計
$454

擴散模型：生成式 AI 模型的理論、應用與代碼實踐
~~$834~~ $792

機器學習高級實踐：運算廣告、供需預測、智慧行銷、動態定價
~~$1,280~~ $869

萬顆 GPU 的訓練 - 分散式機器學習 — 系統工程與實戰
~~$714~~ $678

PyTorch 自動駕駛視覺感知算法實戰
~~$850~~ $672

API 設計模式｜簡化整合的訊息交換技術 (Patterns for API Design: Simplifying Integration with Loosely Coupled Message Exchanges)
~~$1,800~~ $1,422

演算法導論, 4/e (Introduction to Algorithms, 4/e)
~~$720~~ $569

AI 繪圖邁向視覺設計
~~$479~~ $455

機器視覺偵測與辨識技術及應用基於深度學習
~~$780~~ $616

ChatGPT 4 Omni 領軍 - Copilot、Claude、Gemini、36組GPT ...全面探索生成式AI的無限可能
~~$690~~ $545

輕量又漂亮的 Python Web 框架 - Streamlit AI 時代非學不可
~~$680~~ $537

內行人才知道的機器學習系統設計面試指南 (Machine Learning System Design Interview)
~~$599~~ $473

世界第一簡單的演算法：圖解 ✕ 程式 ✕ 刷題機器人
~~$480~~ $379

決戰半導體：解讀大數據時代的強勢版塊，掌握未來投資趨勢
~~$780~~ $616

AI 讀心數 - 推薦系統演算法核心程式碼精通
$454

大模型動力引擎 — PyTorch 性能與顯存優化手冊

商品描述

本書循序漸進、詳細講解了大模型開發技術的核心知識，
並透過具體實例的實現過程演練了使用TensorFlow和PyTorch開發大模型程序的方法和流程。
全書共12章，分別講解了大模型基礎，資料集的加載、基本處理與製作，資料集的預處理，捲積神經網絡模型，循環神經網絡模型，
特徵提取，註意力機制，模型訓練與調優，模型推理和評估，大模型優化演算法和技術，AI智慧問答系統和AI人臉辨識系統。
全書簡潔而不失其技術深度，內容豐富全面。
本書易於閱讀，以極簡的文字介紹了複雜的案例，是學習大模型開發的實用教學。
本書適用於已經瞭解Python基礎開發的讀者，以及想進一步學習大模型開發、模型優化、模型應用和模型架構的讀者，
還可以作為大專院校相關專業的師生用書和培訓學校的專業性教材。

目錄大綱

第1章大模型基礎

1.1人工智能

1.1.1 人工智能的發展歷程

1.1.2 人工智能的研究領域

1.1.3 人工智能對人們生活的影響

1.2機器學和深度學

1.2.1 機器學

1.2.2 深度學

1.2.3 機器學和深度學的區別

1.3大模型簡介

1.3.1 大模型的作用

1.3.2 數據

1.3.3 數據和大模型的關係

1.4大模型開發與應用的技術堆疊

第2章資料集的加載、基本處理和

2.1資料集的加載

2.1.1 PyTorch加載資料集

2.1.2 TensorFlow加載資料集

2.2資料集的基本處理

2.2.1 轉換為Tensor格式

2.2.2 標準化處理

2.2.3 調整大小和裁剪

2.2.4 隨機翻轉和旋轉

2.3數據集的

2.3.1 自訂資料集

2.3.2 簡易圖片資料集

2.3.3 有標籤的資料集

第3章資料集的預處理

3.1資料清洗和處理

3.1.1 缺失值處理

3.1.2 異常值檢測與處理

3.1.3 重複資料處理

3.2資料轉換與整合

3.2.1 徵選擇與抽取

3.2.2 徵變換與降維

3.2.3 資料整合與關聯

3.3數據標準化與歸一化

3.3.1 標準化及其重要性

3.3.2 徵縮放和歸一化

3.3.3 資料轉換與規範化

3.3.4 “ 小- 大”縮放

3.4數據技術

3.4.1 數據的意義

3.4.2 影像數據

3.4.3 自然語言數據

第4章捲積經網絡模型

4.1捲積經網絡簡介

4.1.1 捲積經網絡的發展背景

4.1.2 捲積經網絡的結構

4.2捲積經網絡模型開發實戰

4.2.1 使用TensorFlow建立一個捲積經網絡模型並評估

4.2.2 使用PyTorch建立手寫數碼模型

第5章循環經網絡模型

5.1文本處理與循環經網絡簡介

5.1.1 循環經網絡基礎

5.1.2 文本分類

5.2循環經網絡模型開發實戰

5.2.1 使用PyTorch開發歌詞生成器模型

5.2.2 使用TensorFlow情緒分析模型

第6章徵提取

6.1徵擷取簡介

6.1.1 徵在大模型中的關鍵作用

6.1.2 徵提取與資料預處理的關係

6.2徵的類型和重要性

6.2.1 數值徵和類別徵

6.2.2 高維度資料的挑戰

6.3徵選擇

6.3.1 徵選擇的要性

6.3.2 徵選擇的方法

6.4徵抽取

6.4.1 徵抽取的概念

6.4.2 主成分分析

6.4.3 立成分分析

6.4.4 自動編碼器

6.5文本資料的徵提取

6.5.1 嵌入

6.5.2 詞袋模型

6.5.3 TF-IDF徵

6.6 影像資料的徵提取

6.6.1 預訓練的圖像徵提取模型

6.6.2 基本影像徵：邊緣偵測、色彩直方圖等

第7章註意力機制

7.1註意力機制基礎

7.1.1 註意力機制簡介

7.1.2 註意力機制的變體

7.1.3 註意力機制解決的問題

7.2TensorFlow 機器翻譯系統

7.2.1 專案簡介

7.2.2 下載並準備資料集

7.2.3 文字預處理

7.2.4 編碼器模型

7.2.5 繪製可視化註意力圖

7.2.6 解碼器

7.2.7 訓練

7.2.8 翻譯

7.3 PyTorch 機器翻譯系統

7.3.1 準備資料集

7.3.2 資料預處理

7.3.3 實作Seq2Seq 模型

7.3.4 訓練模型

7.3.5 模型評估

7.3.6 訓練和評估

7.3.7 註意力的可視化

第8章模型訓練與調

8.1模型訓練化

8.1.1 底層化

8.1.2 樣本權重與分類權重

8.2損失函數和化演算法

8.2.1 損失函數與化演算法的概念

8.2.2 TensorFlow損失函數和化演算法

8.2.3 PyTorch損失函數和化演算法

8.3批量訓練和隨機訓練

8.3.1 批量訓練和隨機訓練的概念

8.3.2 小批量隨機梯度下降

8.3.3 批量歸一化

8.3.4 丟棄

8.4模型驗證與調

8.4.1 訓練集、驗證集和測試集

8.4.2 交驗證化

8.4.3 參數調

第9章模型推理與評估

9.1模型推理

9.1.1 模型推理的步驟

9.1.2 前向傳播與輸出計算的過程

9.1.3 模型推理的化與加速

9.2模型評估

9.2.1 模型評估的方法與指標

9.2.2 交驗證和統計顯著性測試的應用

第10章大模型化演算法與技術

10.1常見的大模型化演算法與技術

10.2梯度下降法

10.2.1 梯度下降法簡介

10.2.2 TensorFlow梯度下降法化實踐

10.2.3 PyTorch梯度下降法化實踐

10.3模型並行與資料並行

10.3.1 模型並行與資料並行的基本概念

10.3.2 TensorFlow模型並行與資料並行實踐

10.3.3 PyTorch模型並行與資料並行實踐

10.4學率調度

10.4.1 學率調度的方法

10.4.2 TensorFlow學率調度化實踐

10.4.3 PyTorch學率調度化實踐

10.5權重初始化策略

10.6遷移學

10.6.1 遷移學的基本概念

10.6.2 TensorFlow遷移學化實踐

10.6.3 PyTorch遷移學化實踐

10.7其他大模型化演算法與技術

10.7.1 分佈式訓練

10.7.2 正規化

10.7.3 梯度裁剪

10.7.4 混合度訓練化

10.7.5 量化技術

10.7.6 剪枝化技術

第11章AI智慧問答系統（TensorFlow+TensorFlow. js+SQuAD 2.0+Mobile-BERT）

11.1背景簡介

11.1.1 網絡的影響

11.1.2 問答系統的發展

11.2問答系統的發展趨勢：AI 問答系統

11.3技術架構

11.3.1 TensorFlow.js

11.3.2 SQuAD 2.0

11.3.3 BERT

11.3.4 知識蒸餾

11.4具體實現

11.4.1 編寫HTML文件

11.4.2 腳本處理

11.4.3 加載訓練模型

11.4.4 查詢處理

11.4.5 文章處理

11.4.6 加載處理

11.4.7 尋找答案

11.4.8 提取答案

11.4.9 將答案轉換回原始文本

11.5調試運行

第12章AI人臉辨識系統（PyTorch+OpenCV+Scikit-Image+MobileNet+ArcFace）

12.1 系統簡介

12.1.1 背景簡介

12.1.2 人臉辨識的發展與現狀

12.2系統需求分析

12.2.1 系統功能分析

12.2.2 技術分析

12.2.3 實現流程分析

12.3數據集

12.3.1 準備資料集

12.3.2 提取人臉

12.4訓練模型

12.4.1 ArcFace演算法

12.4.2 MobileNet演算法

12.4.3 開始訓練

12.5評估模型

12.5.1 評估的重要性

12.5.2 評估程序

12.6人臉辨識

12.6.1 影像預處理

12.6.2 人臉辨識模型

12.6.3 開始識別

大規模語言模式開發基礎與實踐

王振麗

買這商品的人也買了...

商品描述

目錄大綱

類似商品

最後瀏覽商品 (15)