買這商品的人也買了...
-
$590$466 -
$400$316 -
$580$493 -
$560$476 -
$235Hadoop 雲計算實戰
-
$500$390 -
$880$695 -
$600$510 -
$580$452 -
$580$493 -
$360$284 -
$454Hadoop 技術內幕-深入解析 Hadoop Common 和 HDFS 架構設計與實現原理
-
$1,260Data Warehousing in the Age of Big Data (Paperback)
-
$470Apache Sqoop Cookbook (Paperback)
-
$301HBase 管理指南 (HBase Administration Cookbook)
-
$580$493 -
$352Hadoop 技術內幕-深入解析 YARN 架構設計與實現原理
-
$400$360 -
$403全程軟體測試(第2版)
-
$403Hadoop 應用開發技術詳解
-
$454深入雲計算-Hadoop 源代碼分析(修訂版)
-
$454HBase企業應用開發實戰/大數據技術叢書
-
$301Spark 大數據處理(技術應用與性能優化)
-
$480$408 -
$720$612
相關主題
商品描述
<內容簡介>
“Hadoop技術內幕”共兩冊,分別從源代碼的角度對“Common+HDFS”和“MapReduce的架構設計和實現原理”進行了極為詳細的分析。本書由Hadoop領域資深的實踐者親自執筆,首先介紹了MapReduce的設計理念和編程模型,然後從源代碼的角度深入分析了RPC框架、客戶端、JobTracker、TaskTracker和Task等MapReduce運行時環境的架構設計與實現原理,最後從實際應用的角度深入講解了Hadoop的性能優化、安全機制、多用戶作業調度器和下一代MapReduce框架等高級主題和內容。本書適合Hadoop的二次開發人員、應用開發工程師、運維工程師閱讀。
本書共12章,分4個部分(不包括附錄):第一部分(第1~2章),介紹了Hadoop源代碼的組織結構、獲取、編譯、調試、閱讀環境搭建,以及MapReduce的設計理念和基本架構;第二部分(第3章),著重講解了MapReduce的編程接口,主要包括舊API和新API兩套編程接口,以及Hadoop工作流;第三部分(第4~8章)主要分析了MapReduce的運行時環境,包括RPC框架、客戶端、JobTracker、TaskTracker和Task等的內部實現細節和機制剖析;第四部分(第9~12章)深入講解了Hadoop的性能優化、多用戶作業調度器、安全機制和下一代MapReduce框架等高級主題。
經過幾年的快速發展,Hadoop已經成為大數據時代存儲和處理海量數據的事實標準,具有高可靠性、高擴展性、高效性和高容錯性等許多優點,在學術界備受關註,在業界則更受歡迎。 Hadoop的功能非常強大,與之相伴的是使用上的複雜性,如何才能更好地使用Hadoop、更好地對Hadoop進行性能優化、擴展和定製?通過閱讀和研究它的源代碼實現以上目標是一種不錯的選擇。 “Hadoop技術內幕”這兩本書根據讀者的需求,對Common、HDFS和MapReduce等核心技術的架構設計和實現原理進行了深入且詳細的分析,對於想瞭解Hadoop工作機制的讀者來說,這兩本書應該是十分難得的,強烈推薦。
—— EasyHadoop開源技術社區(www.easyhadoop.com) 致力於Hadoop的易用和普及
Hadoop是近兩年來技術領域最熱門的話題,從媒體界到學術界,再到企業界,都給予了高度關註。在企業界,無論是在IT領域,還是在金融、電信、生物、醫藥、製造等傳統領域,Hadoop的應用都非常廣泛,可以說只要有海量數據需要處理的地方,就有Hadoop。尤其是在IT領域,從國外的Google、Yahoo! 、Microsoft、Oracle、Facebook,到國內的阿裡巴巴、淘寶、騰訊、百度、新浪、搜狐,都在Hadoop的研發和應用上投入了大量的人力和資金,並獲得了豐厚的收益。隨著Hadoop的普及,用戶遇到的問題會越來越多,也會越來越複雜。要解決實際生產環境中可能遇到的複雜問題,掌握Hadoop本身的設計和實現原理是根本之道。 “Hadoop技術內幕”這兩本書就本著這個目標出發,從源代碼的角度對Hadoop的工作機制進行了深入的分析,並對實踐中可能會遇到的各種問題給出瞭解決方案。
—— 童小軍資深Hadoop技術專家、企業級大數據解決方案RedHadoop創始人
本書主要內容:
Hadoop源代碼的組織結構、獲取方法、編譯與調試,以及閱讀環境的搭建;
MapReduce的設計目標和Hadoop的基本結構;
MapReduce的編程模型、核心概念、新舊API的比較,以及Hadoop的工作流;
Hadoop RPC框架的原理和機制分析;
作業提交與初始化過程詳細分析;
JobTracker和TaskTracker的內部實現機制剖析;
Task運行過程的深度分析;
Hadoop的性能優化經驗總結;
Hadoop多用戶作業調度器的實現原理;
Hadoop的安全機制和原理;
下一代MapReduce框架的設計