وضعیت موجودی موجود
Product details
- Publisher : O'Reilly Media; 1st edition (October 16, 2012)
- Language : English
- Paperback : 350 pages
- ISBN-10 : 1449319335
-
ISBN-13 : 978-1449319335
کتاب Programming Hive: Data Warehouse and Query Language for Hadoop
Need to move a relational database application to Hadoop? This comprehensive guide introduces you to Apache Hive, Hadoop’s data warehouse infrastructure. You’ll quickly learn how to use Hive’s SQL dialect—HiveQL—to summarize, query, and analyze large datasets stored in Hadoop’s distributed filesystem.
This example-driven guide shows you how to set up and configure Hive in your environment, provides a detailed overview of Hadoop and MapReduce, and demonstrates how Hive works within the Hadoop ecosystem. You’ll also find real-world case studies that describe how companies have used Hive to solve unique problems involving petabytes of data.
- Use Hive to create, alter, and drop databases, tables, views, functions, and indexes
- Customize data formats and storage options, from files to external databases
- Load and extract data from tables—and use queries, grouping, filtering, joining, and other conventional query methods
- Gain best practices for creating user defined functions (UDFs)
- Learn Hive patterns you should use and anti-patterns you should avoid
- Integrate Hive with other data processing programs
- Use storage handlers for NoSQL databases and other datastores
- Learn the pros and cons of running Hive on Amazon’s Elastic MapReduce
منابع کتاب کتاب Programming Hive: Data Warehouse and Query Language for Hadoop
آیا نیاز به انتقال یک برنامه پایگاه داده رابطه ای به Hadoop دارید؟ این راهنمای جامع شما را با Apache Hive، زیرساخت انبار داده هادوپ آشنا می کند. شما به سرعت یاد خواهید گرفت که چگونه از گویش SQL Hive - HiveQL - برای خلاصه کردن، پرس و جو و تجزیه و تحلیل مجموعه داده های بزرگ ذخیره شده در سیستم فایل توزیع شده Hadoop استفاده کنید.
این راهنمای مثال محور به شما نشان می دهد که چگونه Hive را در محیط خود راه اندازی و پیکربندی کنید، یک نمای کلی از Hadoop و MapReduce ارائه می دهد، و نشان می دهد که Hive چگونه در اکوسیستم Hadoop کار می کند. همچنین مطالعات موردی در دنیای واقعی را خواهید یافت که توضیح میدهد چگونه شرکتها از Hive برای حل مشکلات منحصربهفرد مربوط به پتابایت داده استفاده کردهاند.
از Hive برای ایجاد، تغییر و رها کردن پایگاههای داده، جداول، نماها، توابع و فهرستها استفاده کنید
فرمت های داده و گزینه های ذخیره سازی، از فایل ها گرفته تا پایگاه های داده خارجی را سفارشی کنید
بارگیری و استخراج داده ها از جداول - و استفاده از پرس و جو، گروه بندی، فیلتر کردن، پیوستن و سایر روش های پرس و جو مرسوم
به دست آوردن بهترین شیوه ها برای ایجاد توابع تعریف شده توسط کاربر (UDF)
الگوهای Hive را که باید استفاده کنید و ضد الگوهایی که باید از آنها اجتناب کنید را بیاموزید
Hive را با سایر برنامه های پردازش داده ادغام کنید
برای پایگاههای داده NoSQL و دیگر ذخیرهسازیهای داده از کنترلکنندههای ذخیرهسازی استفاده کنید
با مزایا و معایب اجرای Hive در Elastic MapReduce آمازون آشنا شوید
ارسال نظر درباره کتاب Programming Hive: Data Warehouse and Query Language for Hadoop