جلد سخت سیاه و سفید
Product details
- Publisher : O'Reilly Media; 2nd edition (May 3, 2022)
- Language : English
- Paperback : 459 pages
- ISBN-10 : 1098118952
- ISBN-13 : 978-1098118952
کتاب Data Science on the Google Cloud Platform: Implementing End-to-End Real-Time Data Pipelines: From Ingest to Machine Learning
Learn how easy it is to apply sophisticated statistical and machine learning methods to real-world problems when you build using Google Cloud Platform (GCP). This hands-on guide shows data engineers and data scientists how to implement an end-to-end data pipeline with cloud native tools on GCP.
Throughout this updated second edition, you'll work through a sample business decision by employing a variety of data science approaches. Follow along by building a data pipeline in your own project on GCP, and discover how to solve data science problems in a transformative and more collaborative way.
You'll learn how to:
- Employ best practices in building highly scalable data and ML pipelines on Google Cloud
- Automate and schedule data ingest using Cloud Run
- Create and populate a dashboard in Data Studio
- Build a real-time analytics pipeline using Pub/Sub, Dataflow, and BigQuery
- Conduct interactive data exploration with BigQuery
- Create a Bayesian model with Spark on Cloud Dataproc
- Forecast time series and do anomaly detection with BigQuery ML
- Aggregate within time windows with Dataflow
- Train explainable machine learning models with Vertex AI
- Operationalize ML with Vertex AI Pipelines
منابع کتاب کتاب Data Science on the Google Cloud Platform: Implementing End-to-End Real-Time Data Pipelines: From Ingest to Machine Learning
بیاموزید که وقتی با استفاده از پلتفرم ابری Google (GCP) میسازید، استفاده از روشهای آماری و یادگیری ماشینی پیچیده برای مشکلات دنیای واقعی چقدر آسان است. این راهنمای عملی به مهندسان داده و دانشمندان داده نشان می دهد که چگونه یک خط لوله داده سرتاسر را با ابزارهای بومی ابری در GCP پیاده سازی کنند.
در طول این نسخه دوم به روز شده، با به کارگیری انواع رویکردهای علم داده، از طریق یک تصمیم تجاری نمونه کار خواهید کرد. با ایجاد خط لوله داده در پروژه خود در GCP ادامه دهید و کشف کنید که چگونه مسائل علم داده را به روشی متحول کننده و مشارکتی تر حل کنید.
شما یاد خواهید گرفت که چگونه:
- بهترین شیوه ها را در ساخت خطوط لوله داده و ML بسیار مقیاس پذیر در Google Cloud به کار بگیرید
- دریافت داده ها را با استفاده از Cloud Run به صورت خودکار و برنامه ریزی کنید
- یک داشبورد در Data Studio ایجاد و پر کنید
- با استفاده از Pub/Sub، Dataflow و BigQuery یک خط لوله تجزیه و تحلیل بلادرنگ بسازید
- کاوش تعاملی داده با BigQuery انجام دهید
- یک مدل بیزی با Spark در Cloud Dataproc ایجاد کنید
- سری های زمانی را پیش بینی کنید و با BigQuery ML تشخیص ناهنجاری انجام دهید
- در پنجره های زمانی با Dataflow جمع کنید
- آموزش مدلهای یادگیری ماشینی قابل توضیح با Vertex AI
- ML را با خطوط لوله Vertex AI عملیاتی کنید
ارسال نظر درباره کتاب Data Science on the Google Cloud Platform: Implementing End-to-End Real-Time Data Pipelines: From Ingest to Machine Learning