大數據理論與工程實踐
陸晟 劉振川 汪關盛 等
- 出版商: 人民郵電
- 出版日期: 2018-12-01
- 定價: $348
- 售價: 8.5 折 $296
- 語言: 簡體中文
- 頁數: 299
- 裝訂: 平裝
- ISBN: 7115496838
- ISBN-13: 9787115496836
-
相關分類:
大數據 Big-data
下單後立即進貨 (約4週~6週)
相關主題
商品描述
本書主要面向架構師,或者是有具體大數據問題需要解決的工程師;也適合從零開始搭建大數據結構,或者需要將現有的非大數據的需求修改成大數據方案的讀者。你將從書中學到以下方面的知識:
◎數據存儲
◎計算資源
◎計算模型
◎大數據應用
◎數據治理
◎大數據與人工智能
作者簡介
陸晟博士
曾任IBM中國研究院研究員,涉及高性能計算、人機交互、虛擬世界等領域,最早在國內推廣云計算相關技術。參與創立過烽火安網公司,創立了北京敏思創想軟件技術有限公司。此外,先後擔任過VMware主任工程師、品友互動技術工程副總裁、豬八戒網商業基礎設施中心高級總監兼大數據事業部總經理等職務。現任美數信息科技公司首席技術官。從1995年開始參與中國教育和科研網的建設工作,並以第六完成人獲江蘇省科技進步二等獎,以第二作者參與過《計算機網絡安全導論》第1版的編著。獲得國內外專利授權超過15項。
劉振川
長期擔任品友互動首席研究員。從事廣告行業十餘年,歷經了國內數字廣告從0到1的誕生及發展過程。熟悉廣告行業的各個技術模塊,主導設計開發廣告投放、數據分析、人群畫像、算法支撐等系統。目前的研究專注於數字營銷的智能決策方向。
汪關盛
美數信息科技公司創始人、國際數據管理協會(DAMA)中國分會資深顧問。從事數據行業20多年,曾任職美國銀行、畢馬威、美國在線、谷歌等公司,擔任資深諮詢員和首席構架師。1999年成立美數集團公司。2012年起兼任北京交通大學大數據教授,講授大數據相關的碩士和博士全英文課程。受邀在中國平安、騰訊、阿里巴巴、復旦大學在內的多家國內知名企業和高校做過主題演講。
目錄大綱
第1章概述1
大數據處理的特徵/ 3
基本處理模型/ 5
工程角度的大數據歷史/ 8
大數據的基本處理框架/ 10
大數據的技術實施方法/ 13
第2章數據21
數據存儲/ 23
數據尋址/ 28
列式存儲/ 34
鍵值對高速緩存/ 43
持久化的高速緩存/ 54
大數據表/ 65
第3章計算資源73
集群總線/ 75
資源調度/ 91
資源控制/ 97
第4章計算模型109
MapReduce / 111
SQL類查詢/ 115
流式計算/ 119
圖計算/ 125
第5章大數據應用133
搜索信息匹配/ 136
搜索信息排名/ 140
文檔相似性判定/ 147
文檔主題生成/ 152
用戶畫像/ 163
廣告投放決策/ 175
基數計算/ 191
第6章數據治理199
元數據管理/ 202
主數據管理/ 207
數據標準/ 209
數據管理成熟度評估/ 213
數據資產/ 220
數據治理的組織構架/ 230
第7章大數據和人工智能233
大數據和計算機視覺/ 236
大數據和語音識別/ 259
大數據和博弈/ 284
術語表291
作者介紹299