Hadoop 金融大數據分析 Hadoop金融大数据分析

拉吉夫·蒂瓦里 (Rajiv Tiwari)

  • 出版商: 機械工業
  • 出版日期: 2017-05-01
  • 定價: $354
  • 售價: 8.5$301
  • 語言: 簡體中文
  • 頁數: 158
  • 裝訂: 平裝
  • ISBN: 7121310511
  • ISBN-13: 9787121310515
  • 相關分類: Hadoop大數據 Big-dataData Science
  • 下單後立即進貨 (約4週~6週)

買這商品的人也買了...

相關主題

商品描述

在因特網+時代,數據是炙手可熱的重要資源,網絡使用基礎的提升,數據流量增大,用戶需求多樣化和多變對架構設計提出嚴峻考驗,而Hadoop為快速響應用戶需求提供了重要技術支撐。作者Rajiv Tiwari從事數據研究近15年,在Hadoop應用方面有許多實戰經驗,他通過實際案例幫助讀者學習如何借助Hadoop來處理巨大數據信息,對於開發者、分析師、架構師、管理者等都具有很好的指導。

作者簡介

Rajiv Tiwari是一位有著超過15年經驗的自由大數據架構師,他的研究方向包括大數據、數據分析、數據管理、數據架構、數據清洗/數據整合、數據倉庫,以及銀行和其他金融組織中的數據智能等。
他畢業於瓦拉納西印度理工學院( IIT)電子工程專業,在英國工作了10年有餘,大部分時間居住在英國金融城——倫敦。從2010年起, Rajiv就開始使用Hadoop,當時銀行部門使用Hadoop的還很少。他目前正在幫助1級投資銀行( Tier 1 Investment Bank)在Hadoop平台上實施一個大型風險分析項目。

我一直認為當作家把自己的書獻給他們的妻子、合作夥伴或孩子時有點俗氣,但是近幾個月來,讓我明白了為什麼一個家庭的支持對寫一本書那麼重要。
考慮到我目前在投資銀行每天工作時間很長,且很難抽出時間來寫這本書,所以,我一直在深夜和周末寫這本書。我要感謝我的妻子Seema,她幾乎幫我照料一切能分散我寫作注意力的東西;還有我的兒子Rivaan。

審稿人簡介
Harshit Bakliwal是一位印度領先的IT公司的Hadoop開發者。他有6年左右的工作經驗和超過3年的大數據/Hadoop經驗。他從2010年開始使用Hadoop,當時Hadoop剛剛在科技界嶄露頭角,並沒有太多的在線幫助。從那時起,他繼續用自己的方式學習這門語言及其他高水平的語言,如Pig、 Hive、Sqoop、Oozie和HBase。現如今他能處理4~ 5個集群(每個集群大約有200個節點)上PB級的數據。
Dr.Daniel Fasel是Scigility公司的創始人和CEO。Scigility公司為瑞士和歐洲其他國家的大規模信息系統和大數據技術提供解決方案。它的專業團隊在大數據技術上有超過7年的極強的學術背景和實際知識經驗。
他是瑞士電信(瑞士第一大電信運營商)商業智能團隊的第一位數據科學家,並在就職期間實現了NoSQL技術在瑞士電信公司的探索性分析技術。在註重科學數據和NoSQL技術之前,他是合同和客戶域(瑞士電信數據倉庫的核心組件)的商業智能工程師。他還擔任商業情報架構師和Oracle Hyperion Essbase立方體管理員。
他在瑞士福里堡大學( University of Fribourg)獲得經濟學博士學位。他寫了一篇關於模糊數據倉庫的文章,讓他獲得了最高的成績。除了他的博士研究,他一直擔任福里堡大學信息學系的系統工程師和系統管理員團隊的領導。2009年(當時大數據還不是一個流行詞),他安裝和維護了分佈式計算集群和NoSQL技術。他還經常在大數據和數據倉庫領域出版英語或德語的書籍與文章。
Mark Reddy是軟件工程師和分佈式系統愛好者。他從愛爾蘭的高威梅奧理工學院( Galway-Mayo Institute of Technology)榮譽畢業後,曾在Hewlett-Packard和Avaeon Solutions公司任職。他目前在Boxever工作,這是一家專
注於旅遊行業大數據和預測分析的愛爾蘭初創企業。他使用Hadoop、Spark、 Cassandra、ZooKeeper、Storm、Kafka等工具設計並實現了大規模分佈式的解決方案,這些系統處理的數據達TB級。他喜歡利用他的知識和經驗為開源項目做貢獻,並對行業熱點話題進行公開演講。
當他不寫代碼的時候,他喜歡公開演講或寫博客,他也喜歡旅遊、健身,以及發推特隨想@ markreddy。

目錄大綱

第1章大數據回顧
大數據是什麼
數據量
數據速度
數據類型
大數據技術的演進
過去
現在
未來
大數據願景
存儲
NoSOL 
NoSQL數據庫類型
資源管理
數據治理
枇量計算
實時計算
數據整合工具
機器學習
商務智能和可視化
大數據相關的職業
Hadoop架構
HDFS集群
MapReduceV1 
MapReduceV2—YARN 
Hadoop生態圈簡介
馴服大數據
Hadoop——英雄
HDFS——Hadoop分佈式系統
Hadoop版本
發行版——本地部署
發行版——雲端
總結

第2章金融服務中的大數據
各個行業的大數據使用情況
衛生保健
人類科學
電信
在線零售商
為什麼金融部門需要大數據
金融部門的大數據應用案例
HDFS上的數據歸檔
監管
欺詐檢測
交易數據
風險管理
客戶行為預測
情感分析— —非結構化
其他應用案例
金融大數據的演進過程
應該如何學習金融大數據
把你的數據上傳到HDFS上
從HDFS上查詢數據
在Hadoop上的SQL 
實時
數據治理和運營
ETL工具
數據分析和商業 智能
金融大數據的實現
關鍵挑戰
克服挑戰
總結

第3章在雲端使用Hadoop 
大數據云的故事
原因
時機
收穫
項目細節——在雲中進行風險模擬
解決方案
現實世界
目標世界
數據轉換
數據分析
總結

第4章使用Hadoop進行數據遷移
項目細節——歸檔你的交易數據
解決方案
項目第一階段——分裂交易數據到數據倉庫和Had00p 
項目第=階段——完成數據從關係型數據倉庫到Hadoop的遷移
總結


第5章入門
項目詳細信息——風險和監管報告
解決方案
現實世界
目標世界
數據收集
數據轉換
數據分析
總結

第6章變得有經驗
實時大數據
項目細節——識別欺詐交易
解決方案
現實世界
目標世界
馬爾科夫鏈模型執行——批處理模式
數據收集
數據轉換
總結

第7章深入擴展Hadoop的企業級應用
擴展開來——實際上的水平
更多的大數據使用案例
使用案例——再談欺詐問題
解決方案
使用案例——用戶投訴
解決方案 
用案例——算法交易
解決方案
使用案例——外匯交易
解決方案
使用案例——基於社交媒體的交易數據
解決方案
使用案例——非大數據
解決方案
數據湖
Lambda架構
大數據管理
ApacheFalcon概覽
安全性
總結

第8章Hadoop的快速增長
Hadoop發行版的升級週期
最佳實踐和標準
環境
與BI和ETL工具的集成
提示
新的趨勢
總結