大規模並行處理器程序設計(原書第4版) Programming Massively Parallel Processors: A Hands-On Approach, 4/e

Hwu, Wen-Mei W., Kirk, David B., El Hajj, Izzat 湯善江 於策 孫超 肖健 黃睿

相關主題

商品描述

本書內容豐富,註重編程實戰,涉及異構並行計算的基本概念、編程模型和應用案例,適合技術開發人員和學術研究人員學習與參考。本書主要由四個部分組成:第一部分(第2~6章)介紹異構並行計算編程的基本概念,包括數據並行化、GPU架構、CUDA編程及程序性能優化方法等內容;第二部分(第7~12章)介紹並行模式,包括捲積、模板、並行直方圖、歸約、前綴和、歸並等內容;第三部分(第13~19章)介紹高級模式及應用,包括排序、稀疏矩陣計算、圖遍歷、深度學習、疊代式磁共振成像重建、靜電勢能圖和計算思維等內容;第四部分(第20~22章)介紹高級編程實踐,包括異構計算集群編程、CUDA動態並行化等內容。

作者簡介

胡文美(Wen-Mei W.Hwu)是伊利諾伊大學厄巴納–香檳分校電氣與計算機工程系的Sanders-AMD講席教授。他的研究興趣是並行計算的體系結構、實現、編譯和算法領域。他是並行計算研究中心的首席科學家,IMPACT研究小組的負責人。他是MulticoreWare公司的聯合創始人兼CTO。在研究和教學方面,他獲得了ACM SigArch Maurice Wilkes獎、ACM Grace Murray Hopper獎、Tau Beta Pi Daniel C.Drucker傑出學者獎、ISCA影響力論文獎、IEEE計算機協會B.R.Rau獎以及加州大學伯克利分校計算機科學傑出校友獎。他是IEEE和ACM的會士。他主持UIUC CUDA卓越中心的工作,並且是NSF Blue Waters Petascale計算機項目的主要研究人員之一。Hwu博士在加州大學伯克利分校獲得計算機科學博士學位。

目錄大綱

譯者序
推薦序
前言
致謝
第1章 引言
1.1 異構並行計算
1.2 為什麽需要速度與並行性
1.3 加快實際應用的速度
1.4 並行編程中的挑戰
1.5 相關的並行編程接口
1.6 本書的總體目標
1.7 本書的章節安排
參考文獻
第一部分 基本概念
第2章 異構數據並行計算
2.1 數據並行性
2.2 CUDA C程序結構
2.3 向量加法核
2.4 設備全局存儲和數據傳輸
2.5 核函數和線程
2.6 調用核函數
2.7 編譯
2.8 總結
2.8.1 函數聲明
2.8.2 內核調用和網格啟動
2.8.3 內置(預定義)變量
2.8.4 運行時應用程序編程接口
練習
參考文獻
第3章 多維網格和數據
3.1 多維網格組織
3.2 將線程映射到多維數據
3.3 圖像模糊:更覆雜的內核
3.4 矩陣乘法
3.5 總結
練習
第4章 計算架構和調度
4.1 現代GPU架構
4.2 塊調度
4.3 同步和透明可擴展性
4.4 線程束和SIMD硬件
4.5 控制發散
4.6 線程束調度和延遲容忍
4.7 資源劃分和占用率
4.8 查詢設備屬性
4.9 總結
練習
參考文獻
第5章 內存架構和數據局部性
5.1 內存訪問效率的重要性
5.2 CUDA內存類型
5.3 利用平鋪減少內存流量
5.4 平鋪的矩陣乘法內核
5.5 邊界檢查
5.6 內存使用對占用率的影響
5.7 總結
練習
第6章 性能方面的考慮
6.1 內存合並
6.2 隱藏內存延遲
6.3 線程粗化
6.4 優化清單
6.5 瞭解計算瓶頸
……
第二部分 並行模式
第三部分 高級模式及應用
第四部分 高級實踐
附錄 數值方面的考慮

最後瀏覽商品 (17)