第六章 Hadoop架构:Hadoop架构是一个开源的、基于Java的编程框架,设计用于跨电脑集群来处理大数据。Hadoop架构管理多个节点之间的数据传输,确保即使有一个节点坏掉了,系统仍然保有适当的功能。Hadoop架构有两个主要的组件:分布式文件系统和MapReduce引擎。主要的分布式文件系统是Hadoop分布式文件系统(HDFS),这里存储着程序。MapReduce引擎是用于执行程序的一个框架。6.1Hadoop简介:Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。
6.2Hadoop大数据处理框架:Hadoop 是一个基础框架,允许用简单的编程模型在计算机集群上对大型数据集进行分布式处理。它的设计规模从单一服务器到数千台机器,每个服务器都能提供本地计算和存储功能,框架本身提供的是计算机集群高可用的服务,不依靠硬件来提供高可用性。
6.3Hadoop安装与部署:本节主要介绍了Hadoop安装与部署配置教程,通过详细的讲解,为大家学习使用Hadoop提供帮助和支持。
6.4MapReduce编程:MapReduce应用广泛的原因之一就是其易用性,提供了一个高度抽象化而变得非常简单的编程模型,它是在总结大量应用的共同特点的基础上抽象出来的分布式计算框架,在其编程模型中,任务可以被分解成相互独立的子问题。
[单选题]Hadoop 是一个由( )开发的大数据分布式系统基础架构。选项:[IBM, Apache 基金会, 谷歌, 苹果]
[判断题]Hadoop 是一个数据管理系统,作为数据分析的核心,汇集了结构化和非结构化的数据。选项:[对, 错]
[多选题]通常一个HDFS集群中包含( )。选项:[一个主节点, 数据节点, 一个名称节点, 第二名字节点, 若干分枝节点]
[多选题]名字节点保存源信息的种类有( )。选项:[文件目录的所有者及其权限, 文件类型, 数据类型, 文件名目录名及它们之间的层级关系, 每个文件块的名及文件由哪些块组成]
[单选题]( )角色就是定期的合并元数据信息文件和元数据操作日志。选项:[名称节点, 数据节点, 第2名字节点, 主节点]
[多选题]Mapreduce的运行机制,按照时间顺序包括( )。选项:[输入分片, reduce阶段, combiner阶段, shuffle阶段, map阶段]
[单选题]( )是在服务器集群上搭建Hadoop,更接近真实的生产环境。选项:[网络模式, 单机模式, 伪分布模式, 全分布模式]
[单选题]( )是在单机上,模拟一个分布式的环境,具备Hadoop的所有功能。选项:[单机模式, 网络模式, 伪分布模式, 全分布模式]
[判断题]使用MapReduce之前不一定要初始化Configuration。选项:[对, 错]
[判断题]使用MapReduce框架时,我们仅仅只是填写map和reduce部分的代码,其他的都交给mapreduce框架来处理。选项:[对, 错]

温馨提示支付 ¥1.00 元后可查看付费内容,请先翻页预览!
点赞(0) dxwkbang
返回
顶部