異構智算:高效算力築基數字社會
郭亮 李潔 彭競 趙繼壯 吳美希
相關主題
商品描述
本書從產業角度深刻分析了異構計算及智能計算中心建設的諸多關鍵技術和應用前景,介紹了異構融合智能計算的核心技術—智能計算中心異構算力芯片、異構算力適配、異構操作平臺,以及產業界中智能計算中心異構算力的解決方案、智能計算中心的高質量發展與未來展望。本書內容豐富、分析全面,是實現智能計算中心發展相關佈局的重要技術參考,對推動我國智能計算中心建設和智能計算領域的發展有很高的參考價值和實際意義,適合從事城市數字化建設、智能化建設、智能計算中心建設的相關技術人員,以及科研機構技術人員、高校師生閱讀。
作者簡介
郭亮
工程师,中国信息通信研究院云计算与大数据研究所副总工程师,开放数据中心委员会新技术与测试工作组组长。长期从事云计算、网络、服务器、存储和基础设施相关技术的研究工作。
李洁
博士,工程师,中国信息通信研究院云计算与大数据研究所副所长,开放数据中心委员会副主席,中国通信标准化协会TC1 WG4数据中心工作组组长。长期从事数据中心、算力基础设施等方面的政策、技术、标准和产业研究工作。
彭竞
硕士,中国电信股份有限公司北京分公司政企客户事业群副总经理,毕业于北京邮电大学计算机通信专业。从事移动通信、IT互联网、云计算等方面的工作15年余年,在产业数字化科技创新领域和“5G+云+AI”方向有丰富的实践经验。
赵继壮
中国电信研究院AI赋能平台团队总监,工程师,开放数据中心委员会新技术与测试工作组副组长。长期致力于数据中心、服务器与存储、HPC存储、云网融合计算研究。发表论文5篇,获得授权专利4项,主导通信行业标准3项。
吴美希,工程师,中国信通院云计算与大数据研究所业务主管,开放数据中心委员会项目经理。主要从事绿色数据中心、一体化大数据中心、边缘数据中心和算力算效等相关的规划咨询、标准编制、测评认证和政策支撑工作。
目錄大綱
第 一章 智能計算發展概述 1
1.1 全球智能計算發展概述 2
1.1.1 智能計算成為國家戰略 2
1.1.2 發達國家增加人工智能投資 3
1.1.3 龍頭企業構建智算服務 4
1.1.4 智能計算中心建設態勢分析 6
1.2 我國智能計算發展概述 13
1.2.1 頂層設計逐步完善 13
1.2.2 產業形態復雜多元 15
第二章 智能計算中心發展概述 19
2.1 概念與背景 20
2.1.1 概念 20
2.1.2 建設背景 20
2.1.3 建設意義 21
2.2 發展現狀 22
2.2.1 概述 22
2.2.2 建設主體 26
2.2.3 主要特徵 37
2.3 技術現狀 39
2.3.1 核心技術 39
2.3.2 技術趨勢 43
2.4 建設局限 47
2.4.1 算法待統一 47
2.4.2 能源消耗巨大 48
2.4.3 核心技術受限 50
第三章 智能計算中心異構計算 51
3.1 異構計算的作用 52
3.1.1 增強計算效力 52
3.1.2 適配算法模型 52
3.1.3 提升資源效率 53
3.2 異構計算維度劃分 53
3.2.1 AI加速芯片 54
3.2.2 算力適配層 54
3.2.3 算力調度網絡 55
3.2.4 算力管理 55
3.3 異構計算解決方案 55
3.3.1 解決方案概述 55
3.3.2 AI模型訓練方案 56
3.4 異構計算行業應用 58
3.4.1 智慧城市 58
3.4.2 智慧園區 65
3.4.3 智慧政務 66
3.4.4 智慧交通 69
3.4.5 智慧工業 70
3.4.6 智慧科研 74
3.4.7 智慧金融 77
第四章 智能計算中心異構算力芯片 85
4.1 AI芯片的概念 86
4.1.1 AI芯片的概念界定與分類方式 86
4.1.2 傳統芯片與AI芯片的對比分析 87
4.1.3 AI芯片異構架構 87
4.1.4 AI芯片的發展趨勢 88
4.2 AI芯片的分類 90
4.2.1 CPU 90
4.2.2 GPU 90
4.2.3 NPU 96
4.2.4 FPGA 97
4.2.5 ASIC 97
4.3 主流芯片產品 99
4.3.1 昇騰AI推理和訓練芯片 99
4.3.2 寒武紀智能加速卡 99
4.3.3 百度昆侖芯 101
4.3.4 “雲燧”系列加速卡 103
第五章 智能計算中心異構算力適配 105
5.1 異構算力適配架構 106
5.1.1 異構算力工作流程 106
5.1.2 異構算力適配的挑戰 108
5.1.3 智能計算中心異構算力適配架構 110
5.1.4 智能計算中心異構算力接入統一要求 113
5.2 硬件開發套件架構 115
5.2.1 華為 115
5.2.2 寒武紀 118
5.2.3 燧原科技 118
5.2.4 百度 120
5.2.5 算能科技 120
5.3 模型開發框架適配層 122
5.3.1 模型開發框架 123
5.3.2 計算圖編譯器 125
5.3.3 分佈式計算 127
5.3.4 算子庫 128
5.4 操作系統異構適配層 130
5.4.1 集成開發環境統一的操作界面 130
5.4.2 異構模型移植操作界面 131
5.4.3 異構模型調優操作界面 132
5.4.4 異構算子適配操作界面 133
5.4.5 異構性能分析與調優操作界面 134
第六章 智能計算中心異構算力調度網絡 137
6.1 異構算力遠程調用需求 138
6.2 算力調度網絡技術 140
6.2.1 並行通信庫 140
6.2.2 互聯技術 141
6.2.3 網絡優化技術 146
6.3 長距離無損網絡 147
第七章 智能計算中心操作系統 151
7.1 簡介 152
7.2 異構算力統一納管平臺 152
7.2.1 技術架構 152
7.2.2 平臺功能 154
7.3 異構算力智能運營平臺 163
7.3.1 平臺架構 163
7.3.2 服務應用 164
7.4 安全防護可信平臺 165
7.4.1 安全防護可信計算技術 166
7.4.2 智能計算中心安全防護功能 167
7.4.3 可信異構算力服務器 168
第八章 智能計算中心異構算力典型解決方案 169
8.1 華為Atlas人工智能解決方案 170
8.1.1 能力介紹 170
8.1.2 技術架構 170
8.1.3 應用成效 171
8.2 百度城市AI計算中心 172
8.2.1 能力介紹 172
8.2.2 總體框架 173
8.2.3 方案優勢 176
8.3 騰訊雲智天樞平臺 176
8.3.1 能力介紹 176
8.3.2 方案介紹 177
8.3.3 平臺優勢 178
8.4 趨動科技Orion X計算平臺 181
8.4.1 方案介紹 181
8.4.2 平臺優勢 182
8.5 燧原科技液冷訓練集群 183
8.5.1 能力介紹 183
8.5.2 方案介紹 184
8.6 算能AI智能計算中心平臺 184
8.7 寒武紀人工智能算力平臺 185
8.7.1 能力介紹 185
8.7.2 架構設計 186
8.7.3 核心優勢 186
8.8 一流科技“一站式”AI開發服務平臺 187
8.8.1 能力介紹 187
8.8.2 技術方案 188
8.8.3 平臺優勢 190
第九章 智能計算中心的高質量發展 193
9.1 高能效 194
9.1.1 建設要求 194
9.1.2 發展現狀 197
9.2 高算力 198
9.2.1 建設要求 198
9.2.2 發展現狀 199
9.3 強算效 200
9.3.1 建設要求 200
9.3.2 發展現狀 201
9.4 安全可靠 202
9.4.1 建設要求 202
9.4.2 發展現狀 203
9.5 評估認證 204
9.5.1 綠色低碳 204
9.5.2 算力算效 207
9.5.3 服務能力 208
9.5.4 安全可靠 209
9.5.5 智能化運營 210
第十章 展望 213
10.1 規範建設模式 214
10.1.1 規範算力調度納管 214
10.1.2 規範算力適配技術 214
10.1.3 規範算力安全防護 215
10.2 重視算力算效 216
10.2.1 提升算力應用管理體系效能 216
10.2.2 部署智能計算中心異構操作系統 216
10.2.3 形成全場景矩陣化合作模式 216
10.3 融合異構算力 217
10.3.1 建立智能算力虛擬資源 218
10.3.2 部署異構算力調度無損網絡 219
10.3.3 實現異構算力適配 220
10.4 綠色低碳發展 221
10.4.1 擴大綠色低碳產品應用場景 221
10.4.2 優化清潔能源使用機制結構 221
10.4.3 增強綠色低碳智能管理能力 222
參考文獻 223