Product details
- Publisher : Manning; 2nd edition (October 12, 2014)
- Language : English
- Paperback : 512 pages
- ISBN-10 : 1617292222
- ISBN-13 : 978-1617292224
کتاب Hadoop in Practice: Includes 104 Techniques
Summary
Hadoop in Practice, Second Edition provides over 100 tested, instantly useful techniques that will help you conquer big data, using Hadoop. This revised new edition covers changes and new features in the Hadoop core architecture, including MapReduce 2. Brand new chapters cover YARN and integrating Kafka, Impala, and Spark SQL with Hadoop. You'll also get new and updated techniques for Flume, Sqoop, and Mahout, all of which have seen major new versions recently. In short, this is the most practical, up-to-date coverage of Hadoop available anywhere.
Purchase of the print book includes a free eBook in PDF, Kindle, and ePub formats from Manning Publications.
About the Book
It's always a good time to upgrade your Hadoop skills! Hadoop in Practice, Second Edition provides a collection of 104 tested, instantly useful techniques for analyzing real-time streams, moving data securely, machine learning, managing large-scale clusters, and taming big data using Hadoop. This completely revised edition covers changes and new features in Hadoop core, including MapReduce 2 and YARN. You'll pick up hands-on best practices for integrating Spark, Kafka, and Impala with Hadoop, and get new and updated techniques for the latest versions of Flume, Sqoop, and Mahout. In short, this is the most practical, up-to-date coverage of Hadoop available.
Readers need to know a programming language like Java and have basic familiarity with Hadoop.
What's Inside
- Thoroughly updated for Hadoop 2
- How to write YARN applications
- Integrate real-time technologies like Storm, Impala, and Spark
- Predictive analytics using Mahout and RR
- Readers need to know a programming language like Java and have basic familiarity with Hadoop.
About the Author
Alex Holmes works on tough big-data problems. He is a software engineer, author, speaker, and blogger specializing in large-scale Hadoop projects.
Table of Contents
PART 1 BACKGROUND AND FUNDAMENTALS
PART 2 DATA LOGISTICS
PART 3 BIG DATA PATTERNS
PART 4 BEYOND MAPREDUCE
- Hadoop in a heartbeat
- Introduction to YARN
- Data serialization—working with text and beyond
- Organizing and optimizing data in HDFS
- Moving data into and out of Hadoop
- Applying MapReduce patterns to big data
- Utilizing data structures and algorithms at scale
- Tuning, debugging, and testing
- SQL on Hadoop
- Writing a YARN application
منابع کتاب کتاب Hadoop in Practice: Includes 104 Techniques
خلاصه
Hadoop in Practice، نسخه دوم بیش از 100 تکنیک آزمایش شده و فورا مفید را ارائه می دهد که به شما کمک می کند تا با استفاده از Hadoop داده های بزرگ را تسخیر کنید. این نسخه جدید اصلاحشده تغییرات و ویژگیهای جدید در معماری هسته Hadoop، از جمله MapReduce 2 را پوشش میدهد. فصلهای کاملاً جدید YARN و ادغام Kafka، Impala، و Spark SQL با Hadoop را پوشش میدهند. همچنین تکنیک های جدید و به روز شده ای را برای Flume، Sqoop و Mahout دریافت خواهید کرد، که همه آنها اخیراً نسخه های جدید اصلی را مشاهده کرده اند. به طور خلاصه، این عملی ترین و به روزترین پوشش Hadoop است که در همه جا موجود است.
خرید کتاب چاپی شامل یک کتاب الکترونیکی رایگان در قالبهای PDF، Kindle و ePub از انتشارات منینگ است.
درباره کتاب
همیشه زمان خوبی برای ارتقاء مهارت های Hadoop خود است!Hadoop in Practice، نسخه دوم مجموعهای از 104 تکنیک آزمایششده و فوراً مفید را برای تجزیه و تحلیل جریانهای بلادرنگ، انتقال امن دادهها، یادگیری ماشینی، مدیریت خوشههای مقیاس بزرگ و رام کردن دادههای بزرگ با استفاده از Hadoop ارائه میکند. این نسخه کاملاً اصلاح شده تغییرات و ویژگیهای جدید در هسته Hadoop، از جمله MapReduce 2 و YARN را پوشش میدهد. شما بهترین روشهای عملی را برای ادغام Spark، Kafka، و Impala با Hadoop انتخاب میکنید و تکنیکهای جدید و بهروز را برای آخرین نسخههای Flume، Sqoop و Mahout دریافت خواهید کرد. به طور خلاصه، این کاربردی ترین و به روزترین پوشش موجود Hadoop است.
خوانندگان باید زبان برنامه نویسی مانند جاوا را بدانند و با Hadoop آشنایی اولیه داشته باشند.
چه چیزی در داخل است
- به طور کامل برای Hadoop 2 به روز شد
- نحوه نوشتن برنامه های YARN
- فناوریهای بلادرنگ مانند Storm، Impala و Spark را ادغام کنید
- تجزیه و تحلیل پیش بینی با استفاده از Mahout و RR
- خوانندگان باید زبان برنامه نویسی مانند جاوا را بدانند و با Hadoop آشنایی اولیه داشته باشند.
درباره نویسنده
الکس هولمز روی مشکلات کلان داده کار می کند. او یک مهندس نرم افزار، نویسنده، سخنران و وبلاگ نویس متخصص در پروژه های بزرگ مقیاس Hadoop است.
فهرست مطالب
بخش 1 پیشینه و مبانی
بخش 2 لجستیک داده
بخش 3 الگوهای کلان داده
قسمت 4 فراتر از نقشه برداری
- هادوپ در ضربان قلب
- مقدمه ای بر YARN
- سریال سازی داده ها - کار با متن و فراتر از آن
- سازماندهی و بهینه سازی داده ها در HDFS
- انتقال داده ها به داخل و خارج از Hadoop
- استفاده از الگوهای MapReduce برای داده های بزرگ
- استفاده از ساختارهای داده و الگوریتم ها در مقیاس
- تنظیم، اشکال زدایی و تست
- SQL در Hadoop
- نوشتن برنامه YARN
ارسال نظر درباره کتاب Hadoop in Practice: Includes 104 Techniques