Data Science on the Google Cloud Platform: Implementing End-To-End Real-Time Data Pipelines: From Ingest to Machine Learning, 2/e (Paperback)
暫譯: 在 Google Cloud Platform 上的資料科學:實作端到端即時資料管道:從資料擷取到機器學習,第二版(平裝本)

Lakshmanan, Valliappa

  • 出版商: O'Reilly
  • 出版日期: 2022-05-03
  • 售價: $2,840
  • 貴賓價: 9.5$2,698
  • 語言: 英文
  • 頁數: 446
  • 裝訂: Quality Paper - also called trade paper
  • ISBN: 1098118952
  • ISBN-13: 9781098118952
  • 相關分類: Google CloudMachine LearningData Science
  • 海外代購書籍(需單獨結帳)

買這商品的人也買了...

商品描述

Learn how easy it is to apply sophisticated statistical and machine learning methods to real-world problems when you build using Google Cloud Platform (GCP). This hands-on guide shows data engineers and data scientists how to implement an end-to-end data pipeline, using statistical and machine learning methods and tools on GCP.

Through the course of this updated second edition, you'll work through a sample business decision by employing a variety of data science approaches. Follow along by implementing these statistical and machine learning solutions in your own project on GCP, and discover how this platform provides a transformative and more collaborative way of doing data science.

You'll learn how to:

  • Employ best practices in building highly scalable data and ML pipelines on Google Cloud
  • Automate and schedule data ingest using Cloud Run
  • Create and populate a dashboard in Data Studio
  • Build a real-time analytics pipeline using Pub/Sub, Dataflow, and BigQuery
  • Conduct interactive data exploration with BigQuery
  • Create a Bayesian model with Spark on Cloud Dataproc
  • Forecast time series and do anomaly detection with BigQuery ML
  • Aggregate within time windows with Dataflow
  • Train explainable machine learning models with Vertex AI
  • Operationalize ML with Vertex AI Pipelines

商品描述(中文翻譯)

學習如何輕鬆地將複雜的統計和機器學習方法應用於現實世界的問題,當你使用 Google Cloud Platform (GCP) 進行建構時。本手冊將向數據工程師和數據科學家展示如何在 GCP 上實現端到端的數據管道,使用統計和機器學習方法及工具。

在這個更新的第二版中,你將通過採用各種數據科學方法來處理一個示範商業決策。跟隨這些步驟,在你的 GCP 專案中實施這些統計和機器學習解決方案,並發現這個平台如何提供一種變革性且更具協作性的數據科學方式。

你將學習如何:

- 在 Google Cloud 上建立高度可擴展的數據和機器學習管道的最佳實踐
- 使用 Cloud Run 自動化和排程數據攝取
- 在 Data Studio 中創建並填充儀表板
- 使用 Pub/Sub、Dataflow 和 BigQuery 建立實時分析管道
- 使用 BigQuery 進行互動式數據探索
- 在 Cloud Dataproc 上使用 Spark 創建貝葉斯模型
- 使用 BigQuery ML 預測時間序列並進行異常檢測
- 使用 Dataflow 在時間窗口內進行聚合
- 使用 Vertex AI 訓練可解釋的機器學習模型
- 使用 Vertex AI Pipelines 將機器學習運營化

作者簡介

Valliappa (Lak) Lakshmanan is the director of analytics and AI solutions at Google Cloud, where he leads a team building cross-industry solutions to business problems. His mission is to democratize machine learning so that it can be done by anyone anywhere. Lak is the author or coauthor of Practical Machine Learning for Computer Vision, Machine Learning Design Patterns, Data Governance The Definitive Guide, Google BigQuery The Definitive Guide, and Data Science on the Google Cloud Platform.

作者簡介(中文翻譯)

Valliappa (Lak) Lakshmanan 是 Google Cloud 的分析與人工智慧解決方案總監,他領導一個團隊,專注於為各行各業的商業問題建立解決方案。他的使命是讓機器學習民主化,使任何人都能在任何地方進行機器學習。Lak 是《實用電腦視覺機器學習》、《機器學習設計模式》、《數據治理權威指南》、《Google BigQuery 權威指南》以及《Google Cloud Platform 上的數據科學》的作者或合著者。

最後瀏覽商品 (20)