Data Science Solutions with Python: Fast and Scalable Models Using Keras, PySpark MLlib, H2O, XGBoost, and Scikit-Learn
暫譯: 使用 Python 的數據科學解決方案:利用 Keras、PySpark MLlib、H2O、XGBoost 和 Scikit-Learn 快速且可擴展的模型
Nokeri, Tshepo Chris
- 出版商: Apress
- 出版日期: 2021-10-26
- 售價: $1,540
- 貴賓價: 9.5 折 $1,463
- 語言: 英文
- 頁數: 136
- 裝訂: Quality Paper - also called trade paper
- ISBN: 1484277619
- ISBN-13: 9781484277614
-
相關分類:
DeepLearning、Python、程式語言、JVM 語言、Spark、Data Science
海外代購書籍(需單獨結帳)
相關主題
商品描述
Chapter 1: Understanding Machine Learning and Deep Learning.
Chapter goal: It carefully presents supervised and unsupervised ML and DL models and their application in the real world.
Understanding Machine Learning.
Supervised Learning.
The Non-parametric method.
Ensemble Methods.
- Unsupervised Learning.
Cluster Analysis.
Dimension Reduction.
- Exploring Deep Learning.
Conclusion.
The Parametric Method.
Chapter goal: It explains a big data framework recognized as PySpark, machine learning frameworks like SciKit-Learn, XGBoost, and H2O, and a deep learning framework called Keras.
Big Data Frameworks and ML and DL Frameworks.
Characteristics of Big Data.
Impact of Big Data on Business and People.
Refined Product Development.
Improved Decision-Making.
- Big Data Warehousing.
Big Data ETL.
Big Data Frameworks.
Resilient Distributed Datasets.
Spark Configuration.
- Spark Frameworks.
ML Frameworks.
SciKit-Learn.
- H2O.
XGBoost.
Big Data.
Better Customer Relationships.
Apache Spark.
DL Frameworks.
Keras.
Conclusion.
Chapter 3: The Parametric Method - Linear Regression.
Chapter goal: It considers the most popular parametric model - the Generalized Linear Model.
Regression Analysis.
SciKit-Learn in action.
Spark MLlib in action.
- H2O in action.
Conclusion.
Regression in practice.
Chapter goal: It covers two main survival regression analysis models, the Cox Proportional Hazards and Accelerated Failure Time model.
Cox Proportional Hazards.
Lifeline in action.
Spark MLlib in Action.
Conclusion.
Chapter 5: The Non-Parametric Method - Classification.
Chapter goal: It covers a binary classification model, recognized as Logistic Regression, using SciKit-Learn, Keras, PySpark MLlib, and H2O.
Logistic Regression.
SciKit-Learn in action.
Spark MLlib in Action.
- H2O in action.
Conclusion.
Chapter goal: It covers two main ensemble methods, the decision tree model and the gradient boost model.
Decision Tree.
SciKit-Learn in action.
Gradient Boosting.
XGBoost in action.
H2O in action.
Spark MLlib in Action.
Conclusion.
Chapter 7: Artificial Neural Networks.
Chapter goal: It covers deep learning and its application in the real world. It shows ways of designing, building, and testing an MLP classifier using the SciKit-Learn framework and an artificial neural network using the Keras framework.
Deep Learning.
Restricted Boltzmann Machine.
Multi-Layer Perception Neural Network.
SciKit-Learn in action.
Keras in action.
H2O in action.
Deep Belief Networks.
Chapter 8: Cluster Analysis using K-Means.
Chapter goal: It covers a technique of finding k, modelling and evaluating a cluster model known as K-Means using framework商品描述(中文翻譯)
第1章:理解機器學習與深度學習
章節目標:仔細介紹監督式與非監督式的機器學習(ML)和深度學習(DL)模型及其在現實世界中的應用。
- 理解機器學習。
- 監督式學習。
- 參數方法。
- 非參數方法。
- 集成方法。
- 非監督式學習。
- 聚類分析。
- 降維。
- 探索深度學習。
- 結論。
第2章:大數據框架與機器學習及深度學習框架
章節目標:解釋一個被認可的大數據框架PySpark,機器學習框架如SciKit-Learn、XGBoost和H2O,以及一個名為Keras的深度學習框架。
- 大數據框架與機器學習及深度學習框架。
- 大數據。
- 大數據的特徵。
- 大數據對商業與人們的影響。
- 更好的客戶關係。
- 精細化的產品開發。
- 改善決策。
- 大數據倉儲。
- 大數據ETL。
- 大數據框架。
- Apache Spark。
- 韌性分散式資料集。
- Spark配置。
- Spark框架。
- 機器學習框架。
- SciKit-Learn。
- H2O。
- XGBoost。
- 深度學習框架。
- Keras。
- 結論。
第3章:參數方法 - 線性回歸
章節目標:考慮最受歡迎的參數模型 - 廣義線性模型。
- 回歸分析。
- 實踐中的回歸。
- SciKit-Learn的應用。
- Spark MLlib的應用。
- H2O的應用。
- 結論。
第4章:生存回歸分析
章節目標:涵蓋兩個主要的生存回歸分析模型,Cox比例風險模型和加速失敗時間模型。
- Cox比例風險。
- 生命線的應用。
- 加速失敗時間(AFT)模型。
- Spark MLlib的應用。
- 結論。
第5章:非參數方法 - 分類
章節目標:涵蓋一個二元分類模型,稱為邏輯回歸,使用SciKit-Learn、Keras、PySpark MLlib和H2O。
- 邏輯回歸。
- 實踐中的邏輯回歸。
- SciKit-Learn的應用。
- Spark MLlib的應用。
- H2O的應用。
- 結論。
第6章:基於樹的建模與梯度提升
章節目標:涵蓋兩個主要的集成方法,決策樹模型和梯度提升模型。
- 決策樹。
- SciKit-Learn的應用。
- 梯度提升。
- XGBoost的應用。
- Spark MLlib的應用。
- H2O的應用。
- 結論。
第7章:人工神經網絡
章節目標:涵蓋深度學習及其在現實世界中的應用。展示如何使用SciKit-Learn框架設計、構建和測試多層感知器(MLP)分類器,以及使用Keras框架的人工神經網絡。
- 深度學習。
- 受限玻爾茲曼機。
- 多層感知神經網絡。
- SciKit-Learn的應用。
- 深度信念網絡。
- Keras的應用。
- H2O的應用。
- 結論。
第8章:使用K-Means的聚類分析
章節目標:涵蓋尋找k的技術,建模和評估一個稱為K-Means的聚類模型。