Data Science Solutions with Python: Fast and Scalable Models Using Keras, PySpark MLlib, H2O, XGBoost, and Scikit-Learn
暫譯: 使用 Python 的數據科學解決方案:利用 Keras、PySpark MLlib、H2O、XGBoost 和 Scikit-Learn 快速且可擴展的模型

Nokeri, Tshepo Chris

  • 出版商: Apress
  • 出版日期: 2021-10-26
  • 售價: $1,540
  • 貴賓價: 9.5$1,463
  • 語言: 英文
  • 頁數: 136
  • 裝訂: Quality Paper - also called trade paper
  • ISBN: 1484277619
  • ISBN-13: 9781484277614
  • 相關分類: DeepLearningPython程式語言JVM 語言SparkData Science
  • 海外代購書籍(需單獨結帳)

相關主題

商品描述

Chapter 1: Understanding Machine Learning and Deep Learning.

Chapter goal: It carefully presents supervised and unsupervised ML and DL models and their application in the real world.

  • Understanding Machine Learning.

  • Supervised Learning.

    • The Parametric Method.

    • The Non-parametric method.

    • Ensemble Methods.

  • Unsupervised Learning.

    • Cluster Analysis.

    • Dimension Reduction.

  • Exploring Deep Learning.

  • Conclusion.

Chapter 2: Big Data Frameworks and ML and DL Frameworks.

Chapter goal: It explains a big data framework recognized as PySpark, machine learning frameworks like SciKit-Learn, XGBoost, and H2O, and a deep learning framework called Keras.

  • Big Data Frameworks and ML and DL Frameworks.

  • Big Data.

    • Characteristics of Big Data.

  • Impact of Big Data on Business and People.

    • Better Customer Relationships.

    • Refined Product Development.

    • Improved Decision-Making.

  • Big Data Warehousing.

    • Big Data ETL.

  • Big Data Frameworks.

    • Apache Spark.

      • Resilient Distributed Datasets.

      • Spark Configuration.

      • Spark Frameworks.

  • ML Frameworks.

  • SciKit-Learn.

  • H2O.

  • XGBoost.

  • DL Frameworks.

    • Keras.

  • Conclusion.

  • Chapter 3: The Parametric Method - Linear Regression.

    Chapter goal: It considers the most popular parametric model - the Generalized Linear Model.

    • Regression Analysis.

    • Regression in practice.

      • SciKit-Learn in action.

      • Spark MLlib in action.

      • H2O in action.

    • Conclusion.

    Chapter 4: Survival Regression Analysis.

    Chapter goal: It covers two main survival regression analysis models, the Cox Proportional Hazards and Accelerated Failure Time model.

    • Cox Proportional Hazards.

    • Lifeline in action.

  • Accelerated Failure Time (AFT) model.

    • Spark MLlib in Action.

  • Conclusion.

  • Chapter 5: The Non-Parametric Method - Classification.

    Chapter goal: It covers a binary classification model, recognized as Logistic Regression, using SciKit-Learn, Keras, PySpark MLlib, and H2O.

  • Logistic Regression.

  • Logistic Regression in Practice.

    • SciKit-Learn in action.

    • Spark MLlib in Action.

    • H2O in action.

  • Conclusion.

  • Chapter 6: Tree-based Modelling and Gradient Boosting.

    Chapter goal: It covers two main ensemble methods, the decision tree model and the gradient boost model.

  • Decision Tree.

    • SciKit-Learn in action.

  • Gradient Boosting.

    • XGBoost in action.

    • Spark MLlib in Action.

    • H2O in action.

  • Conclusion.

  • Chapter 7: Artificial Neural Networks.

    Chapter goal: It covers deep learning and its application in the real world. It shows ways of designing, building, and testing an MLP classifier using the SciKit-Learn framework and an artificial neural network using the Keras framework.

  • Deep Learning.

    • Restricted Boltzmann Machine.

  • Multi-Layer Perception Neural Network.

    • SciKit-Learn in action.

    • Deep Belief Networks.

    • Keras in action.

    • H2O in action.

  • Conclusion.

  • Chapter 8: Cluster Analysis using K-Means.

    Chapter goal: It covers a technique of finding k, modelling and evaluating a cluster model known as K-Means using framework

    商品描述(中文翻譯)

    第1章:理解機器學習與深度學習
    章節目標:仔細介紹監督式與非監督式的機器學習(ML)和深度學習(DL)模型及其在現實世界中的應用。
    - 理解機器學習。
    - 監督式學習。
    - 參數方法。
    - 非參數方法。
    - 集成方法。
    - 非監督式學習。
    - 聚類分析。
    - 降維。
    - 探索深度學習。
    - 結論。

    第2章:大數據框架與機器學習及深度學習框架
    章節目標:解釋一個被認可的大數據框架PySpark,機器學習框架如SciKit-Learn、XGBoost和H2O,以及一個名為Keras的深度學習框架。
    - 大數據框架與機器學習及深度學習框架。
    - 大數據。
    - 大數據的特徵。
    - 大數據對商業與人們的影響。
    - 更好的客戶關係。
    - 精細化的產品開發。
    - 改善決策。
    - 大數據倉儲。
    - 大數據ETL。
    - 大數據框架。
    - Apache Spark。
    - 韌性分散式資料集。
    - Spark配置。
    - Spark框架。
    - 機器學習框架。
    - SciKit-Learn。
    - H2O。
    - XGBoost。
    - 深度學習框架。
    - Keras。
    - 結論。

    第3章:參數方法 - 線性回歸
    章節目標:考慮最受歡迎的參數模型 - 廣義線性模型。
    - 回歸分析。
    - 實踐中的回歸。
    - SciKit-Learn的應用。
    - Spark MLlib的應用。
    - H2O的應用。
    - 結論。

    第4章:生存回歸分析
    章節目標:涵蓋兩個主要的生存回歸分析模型,Cox比例風險模型和加速失敗時間模型。
    - Cox比例風險。
    - 生命線的應用。
    - 加速失敗時間(AFT)模型。
    - Spark MLlib的應用。
    - 結論。

    第5章:非參數方法 - 分類
    章節目標:涵蓋一個二元分類模型,稱為邏輯回歸,使用SciKit-Learn、Keras、PySpark MLlib和H2O。
    - 邏輯回歸。
    - 實踐中的邏輯回歸。
    - SciKit-Learn的應用。
    - Spark MLlib的應用。
    - H2O的應用。
    - 結論。

    第6章:基於樹的建模與梯度提升
    章節目標:涵蓋兩個主要的集成方法,決策樹模型和梯度提升模型。
    - 決策樹。
    - SciKit-Learn的應用。
    - 梯度提升。
    - XGBoost的應用。
    - Spark MLlib的應用。
    - H2O的應用。
    - 結論。

    第7章:人工神經網絡
    章節目標:涵蓋深度學習及其在現實世界中的應用。展示如何使用SciKit-Learn框架設計、構建和測試多層感知器(MLP)分類器,以及使用Keras框架的人工神經網絡。
    - 深度學習。
    - 受限玻爾茲曼機。
    - 多層感知神經網絡。
    - SciKit-Learn的應用。
    - 深度信念網絡。
    - Keras的應用。
    - H2O的應用。
    - 結論。

    第8章:使用K-Means的聚類分析
    章節目標:涵蓋尋找k的技術,建模和評估一個稱為K-Means的聚類模型。