萬顆 GPU 的訓練 - 分散式機器學習 — 系統工程與實戰

柳浩著

萬顆 GPU 的訓練 - 分散式機器學習 — 系統工程與實戰

預覽內頁

出版商: 深智
出版日期: 2024-01-20
定價: $1,280
售價: 7.9 折 $1,011
語言: 繁體中文
頁數: 816
ISBN: 626738327X
ISBN-13: 9786267383278
相關分類: GPU、Machine Learning

立即出貨 (庫存 < 10)

萬顆 GPU 的訓練 - 分散式機器學習 — 系統工程與實戰-preview-1

買這商品的人也買了...

~~$580~~ $458

深度學習｜生命科學應用 (Deep Learning for the Life Sciences)
~~$474~~ $450

UVM 實戰
~~$354~~ $336

Verilog HDL 數字系統設計與驗證 — 以太網交換機案例分析
~~$648~~ $616

自動駕駛算法與芯片設計
~~$479~~ $455

SoC 設計方法與實現, 4/e
~~$880~~ $695

多核心 CPU 加速程式 32倍 - 深入高平行開發深度原理及專案實戰
~~$980~~ $686

WebGL 建構網頁中的 3D遊戲從基礎渲染原理、光影到應用
~~$414~~ $393

芯片驗證調試手冊 -- 驗證疑難點工作錦囊
$891

AI 量化投資
~~$1,280~~ $1,011

完全 OS 核心精修 - 熟稔 Windows API 高級篇
~~$594~~ $564

AI 加速器架構設計與實現圖書
~~$980~~ $774

AI + IoT 佈建邊緣運算 - 電腦視覺業界專案原理及實作
~~$750~~ $592

最強 AI 投資分析：打造自己的股市顧問機器人，股票趨勢分析×年報解讀×選股推薦×風險管理
~~$880~~ $695

跨框架提昇開發高度 - 前端高級架構師應具備的思想及技能
~~$880~~ $695

跟 NVIDIA 學深度學習！從基本神經網路到 ......、GPT、BERT...，紮穩機器視覺與大型語言模型 (LLM) 的建模基礎
~~$599~~ $473

Discord 全方位工具書 - 基本操作、伺服器設置完全解說
~~$680~~ $537

AI 繪圖夢工廠 + 社群玩家特典：Midjourney、Stable Diffusion、Copilot、Leonardo.Ai、Adobe Firefly 超應用神技
~~$880~~ $695

邊緣AI｜使用嵌入式機器學習解決真實世界的問題 (AI at the Edge: Solving Real-World Problems with Embedded Machine Learning)
~~$352~~ $331

AI Agent：AI 的下一個風口
~~$680~~ $537

GPT5 新時代 - 多模態深度學習精實操練
~~$980~~ $774

新範式來臨 - 用 PyTorch 了解 LLM 開發微調 ChatGLM 全過程
~~$800~~ $632

新世代 AI 範式 - 多模態+大模型實作精解
$621

UVM 芯片驗證技術案例集
~~$680~~ $537

無料 AI：ChatGPT + Gemini + Claude + Copilot + Coze + PlaygroundAI + Ideogram + Stylar + Faceswapper + Suno + Stable Audio + D-ID + Runway + Sora + Gamma-「文字、繪圖、動漫、視覺、音樂、影片、簡報」創意無限 (第二版)
~~$1,200~~ $948

深度學習 -- 最佳入門邁向 AI 專題實戰, 2/e

商品描述

分散式機器學習機礎，包括資料、模型、管線的並行
集合通訊的重要性、參數伺服器PS-Lite
PyTorch DataParalle、PyTorch DDP的基礎及動態邏輯
Uber Horovod的原理及實作
GPipe、PyTorch的管線並行及PipeDream基礎架構及實作
Megatron原理及實作、PyTorch的模型並行原理實作
分散式運算的最佳化器
TensorFlow的分散式環境，靜態架構、動態邏輯
分散式架構的策略基礎、MirroredStrategy、ParameterServerStrategy

本書書以PyTorch為主體講解，從系統和實踐的角度對分散式機器學習進行整理。

包括了第1篇分散式基礎，介紹了分散式機器學習的基本概念、基礎設施，以及機器學習並行化的技術、框架和軟體系統，然後對集合通訊和參數伺服器PS-Lite進行了介紹。

第2篇介紹資料並行，將計算負載切分到多張卡上，實作為PyTorch及Horovod。

第3篇介紹模型並行，主要說明了張量模型並行及管線模弄並行，讓模型可以放入多節點上。

第4篇NVIDIA Megatron進行分析，講解如何進行層內分割模型並行，然後學習PyTorch如何支援模型並行。

第5篇則是將全書的內容用TensorFlow實作，讓已經熟悉TensorFlow的使用者不必重新學習新的框架。

作者簡介

柳浩

網名「羅西的思考」，浙江大學碩士。

曾就職於多家世界500強企業，主導過多個大型項目，現就職於某新能源車企。

技術棧廣博，有豐富的各種大型軟體開發和系統架構經驗，對機器學習框架、微服務框架、大數據引擎、NoSQL、訊息佇列、分散式追蹤系統、可觀測系統、可靠性設計、移動開發方案和源代碼有著深刻的理解和認識。

目錄大綱

第1篇 分散式基礎

第1章 分散式機器學習

1.1 機器學習概念

1.2 機器學習的特點

1.3 分散式訓練的必要性

1.4 分散式機器學習研究領域

1.5 從模型角度看如何並行

1.6 從訓練併發角度看如何並行

1.7 分散式機器學習程式設計介面

1.8 PyTorch分散式

1.9 總結

第2章 集合通訊

2.1 通訊模式

2.2 點對點通訊

2.3 集合通訊

2.4 MPI_AllReduce

2.5 Ring All-Reduce

第3章 參數伺服器之PS-Lite

3.1 參數伺服器

3.2 基礎模組Postoffice

3.3 通訊模組Van

3.4 代理人Customer

3.5 應用節點實現

第2篇 資料並行

第4章 PyTorch DataParallel

4.1 整體說明

4.2 範例

4.3 定義

4.4 前向傳播

4.5 計算損失

4.6 反向傳播

4.7 總結

第5章 PyTorch DDP的基礎架構

5.1 DDP總述

5.2 設計理念

5.3 基礎概念

5.4 架構和初始化

第6章 PyTorch DDP的動態邏輯

6.1 Reducer類別

6.2 前向/反向傳播

第7章 Horovod

7.1 從使用者角度切入

7.2 horovodrun

7.3 網路基礎和Driver

7.4 DistributedOptimizer

7.5 融合框架

7.6 背景執行緒架構

第3篇 管線並行

第8章 GPipe

8.1 管線基本實現

8.2 梯度累積

8.3 Checkpointing

第9章 PyTorch管線並行

9.1 如何劃分模型

9.2 切分資料和Runtime系統

9.3 前向計算

9.4 計算依賴

9.5 平行計算

第10章 PipeDream之基礎架構

10.1 整體想法

10.2 profile階段

10.3 計算分區階段

10.4 轉換模型階段

第11章 PipeDream之動態邏輯

11.1 Runtime引擎

11.2 通訊模組

11.3 1F1B策略

第4篇 模型並行

第12章 Megatron

12.1 設計想法

12.2 模型並行實現

12.3 如何設置各種並行

12.4 Pipedream的管線刷新

第13章 PyTorch如何實現模型並行

13.1 PyTorch模型並行

13.2 分散式自動求導之設計

13.3 RPC基礎

13.4 上下文相關

13.5 如何切入引擎

13.6 自動求導引擎

第14章 分散式最佳化器

14.1 原生最佳化器

14.2 DP的最佳化器

14.3 DDP的最佳化器

14.4 Horovod的最佳化器

14.5 模型並行的分散式問題

14.6 PyTorch分散式最佳化器

14.7 PipeDream分散式最佳化器

第5篇 TensorFlow分散式

第15章 分散式運行環境之靜態架構

15.1 整體架構

15.2 Server

15.3 Master的靜態邏輯

15.4 Worker的靜態邏輯

第16章 分散式運行環境之動態邏輯

16.1 Session機制

16.2 Master動態邏輯

16.3 Worker動態邏輯

16.4 通訊機制

第17章 分散式策略基礎

17.1 使用TensorFlow進行分散式訓練

17.2 DistributedStrategy基礎

17.3 分散式變數

第18章 MirroredStrategy

18.1 MirroredStrategy集合通訊

18.2 MirroredStrategy分發計算

第19章 ParameterServerStrategy

19.1 ParameterServerStrategyV1

19.2 ParameterServerStrategyV2

19.3 ClusterCoordinator

類似商品

VIP 95折
~~$834~~ $792

分佈式機器學習 — 系統、工程與實戰
85折
$505

Python機器學習及實踐——從零開始通往Kaggle競賽之路（2022年度版）
85折
~~$560~~ $476

用 TensorFlow 提早進入人工智慧的未來世界
85折
$658

移動平臺深度神經網絡實戰：原理、架構與優化
85折
$407

Python人工智能編程實踐
79折
~~$1,000~~ $790

別再 mnist 了：跨平台高平行 TensorFlow 2 精彩上陣
79折
$327

TensorFlow Lite 移動設備深度學習從入門到實踐
75折
$266

深度學習與 TensorFlow 實戰
85折
$275

深度學習框架應用開發
75折
$536

細說機器學習：從理論到實踐

最後瀏覽商品 (20)

78折
~~$560~~ $437

人手一本的資安健診實作課：不是專家也能自己動手做！（Win10 / Win11適用）【暢銷回饋版】
79折
~~$410~~ $324

猶太人致富金律
75折
$401

數字化轉型關鍵技術
79折
~~$880~~ $695

超上手的前端框架 - 好用 Vue.js 3 開發最主流的網站
85折
$352

WEB3.0 時代因特網的新未來
VIP 95折
~~$510~~ $485

程序設計競賽專題挑戰教程
~~$460~~ $414

企業倫理, 4/e
VIP 95折
~~$534~~ $507

HTML5 + Vue.js 3.x 從入門到精通 (視頻教學版)
85折
$403

機器人學, 4/e
85折
~~$499~~ $424

NFT 投資聖經：全面即懂的終極實戰攻略，從交易、發行到獲利，掌握市值破千億的元宇宙經濟商機
85折
$254

智能控制基礎
85折
$407

高效制勝 -- 程序員面試典型題解 (全彩印刷)
VIP 95折
~~$534~~ $507

區塊鏈架構之美 : 從比特幣、以太坊、超級賬本看區塊鏈架構設計
78折
~~$960~~ $749

深入探索 .NET 資料存取：ADO.NET + SqlDataSource + LINQ, 2/e
79折
~~$780~~ $616

自然語言處理最佳實務｜全面建構真正的 NLP 系統 (Practical Natural Language Processing: A Comprehensive Guide to Building Real-World Nlp Systems)
79折
~~$480~~ $379

使用 J2Store 開設網路商店的 10堂課｜商品管理x物流x金流x客服一次搞定
~~$600~~ $588

統計學：基礎與應用 (Keller: Statistics for Management and Economics + XLSTAT Bind-in, 11/e)
~~$520~~ $494

PYTHON 程式設計入門與運算思維
79折
~~$360~~ $284

大數據@工作力 : 如何運用巨量資料，打造個人與企業競爭優勢 (Big Data at Work)
VIP 95折
~~$5,920~~ $5,624

Engineering Wireless-Based Software Systems And Applications