Hadoop入门应该看那些书?
来源:海牛大数据 时间:2020-11-20 13:49:56 编辑:简单
Hadoop作为大数据的主流技术框架,至今仍然在大数据技术圈占有重要的地位,大数据学习基本上也离不开Hadoop,从Hadoop开始,学习核心组件,逐步扩展到生态圈其他组件,这是比较建议的学习路线。今天我们就来和大家聊聊Hadoop入门应该看那些书?
1、Hadoop权威指南:大数据的存储与分析(第4版)
这本书作为Hadoop最全面的入门书,结合理论和实践,由浅入深,全方位介绍了Hadoop这一高性能的海量数据处理和分析平台。内容包括:
Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。
MapReduce组件,MapReduce应用开发、MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。
Hadoop运维,构建Hadoop集群、管理Hadoop。
Hadoop相关开源项目,Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。
2、深度剖析Hadoop HDFS
这本书着重在Hadoop的分布式文件系统HDFS上,基于Hadoop 2.7.1版本进行分析,全面描述了HDFS 2.X的核心技术与解决方案。内容包括:
核心设计,HDFS的数据存储原理、HDFS的数据管理与策略选择机制、HDFS的新颖功能特性。
细节实现,HDFS的块处理、流量处理等细节,以及部分结构分析。
解决方案,HDFS的数据管理、HDFS的数据读写、HDFS的异常场景等。
3、HBase不睡觉书
Hbase在Hadoop生态当中,地位同样不可小觑。这本书对于Hbase作为非常详解的讲解,适合于零基础入门,并且希望深入掌握的大数据学习者。内容包括:
HBase概念、安装、配置、部署,让读者对HBase先有一个感性认识,再从应用角度介绍了高级用法、监控和性能调优。既兼顾了初学者,也适用于想要深入学习HBase的读者。
4、Hive实战
Hive在Hadoop生态当中,常常被定义为数据仓库工具,简单且容易上手,是深入学习Hadoop技术的一个很好的切入点。内容包括:
Hive的安装和配置,其核心组件和架构,Hive数据操作语言,如何加载、查询和分析数据,Hive的性能调优以及安全性等等。
Hadoop入门应该看那些书?大数据学习路漫漫,Hadoop生态是核心知识点,以上书单建议大家作为入门首选。
海牛大数据专注于大数据课程开发及培训,"因为专注,所以专业"。如果您想要了解更多大数据的知识,您可以浏览我们的网站,我们会为您提供更专业服务。