⬆️⬆️⬆️本课程2024最新同名章节期末答案⬆️⬆️

集群部署与数据存储期末答案和章节题库2024春

所有课程章节/期末均有答案,可提供word版,点击联系客服✅

65 阅读 0 评论 2 点赞

大数据的计量单位已经越过TB级别发展到ZB，甚至更高的级别来衡量了。（）

答案:对

使用Hadoop中的MapReduce编程模型非常简单，只需要定义好map和reduce函数的输入和输出键值对的类型即可。（）

答案:对

关于hdfs元数据，Edits编辑日志中记录了文件系统的所有操作。（）

答案:错

数据应用层主要采用了大数据采集技术，实现对数据的ETL操作。（）

答案:错

Map的主要工作是将多个任务的计算结果进行汇总。（）

答案:错

hive中包含数据库、表、分区、桶四类数据模型。（）

答案:错

MapReduce设计的一个理念就是“计算向数据靠拢”，而不是“数据向计算靠拢”，因为，移动数据需要大量的网络传输开销。（）

答案:对

内部表的数据有Hive自身管理，外部表的数据有HDFS管理。（）

答案:对

Hadoop框架是用Java实现的，MapReduce应用程序则一定要用Java来写。（）

答案:错

Region服务器是HBase中最核心的模块。（）

答案:对

HDFS是整个Hadoop体系的基础，负责数据的存储与管理。（）

答案:对

Hadoop的核心主要是指HDFS和MapReduce。（）

内容已经隐藏，点击付费后查看

Client与HRegionServer进行数据读写类操作。（）

内容已经隐藏，点击付费后查看

Hive将元数据保存在关系数据库中，大大减少了在查询过程中执行语义检查的时间。（）

内容已经隐藏，点击付费后查看

HDFS是分布式文件系统，其命名空间包括块、目录和文件。（）

内容已经隐藏，点击付费后查看

HBase是四维坐标(即行键、列族、列、时间戳)定位数据。（）

内容已经隐藏，点击付费后查看

Hive中数据表info更名为info1，其实现命令如下：hive > alter table info rename to info1 ；（）

内容已经隐藏，点击付费后查看

Hive中show tables命令用来显示数据表名称。（）

内容已经隐藏，点击付费后查看

HDFS只设置唯一一个名称节点带来的局限性包括（）。

内容已经隐藏，点击付费后查看

关于HBase特性，是下列选项中的哪些？（）

内容已经隐藏，点击付费后查看

使用Apache Sqoop的主要好处有哪些？（）

内容已经隐藏，点击付费后查看

以下（）属于Sqoop的命令。

内容已经隐藏，点击付费后查看

下面关于Zookeeper功能的描述正确的是（）。

内容已经隐藏，点击付费后查看

除了键入sqoop语法之外，还可以使用指定sqoop-(toolname)语法的别名脚本，sqoop提供了以下哪些脚本（）

内容已经隐藏，点击付费后查看

关于HBase Region进行的管理控制，分别为下列中哪些选项？（）。

内容已经隐藏，点击付费后查看

下面关于Hive存储的文件格式描述正确的是（）

内容已经隐藏，点击付费后查看

HDFS中的NameNode节点用于存放元数据，数据内容包含（）。

内容已经隐藏，点击付费后查看

Hive中向数据表添加数据的主要方式有（）。

内容已经隐藏，点击付费后查看

下面关于Hive的索引描述不正确的是（）。

内容已经隐藏，点击付费后查看

MapReduce程序执行的阶段主要有：（）

内容已经隐藏，点击付费后查看

在HBase中，关于Region描述，下列选项中哪些是正确的（）

内容已经隐藏，点击付费后查看

Hadoop MapReduce计算的流程是（）。

内容已经隐藏，点击付费后查看

下列不属于Hadoop特点的是（）。

内容已经隐藏，点击付费后查看

关于Sqoop的说法，不正确的是？（）

内容已经隐藏，点击付费后查看

当Zookeeper的节点数据发生变更时，被触发的事件是（）。

内容已经隐藏，点击付费后查看

（）是Zookeeper集群工作的核心，也是事务性请求（写操作）的唯一调度和处理者。

内容已经隐藏，点击付费后查看

Sqoop的底层实现是？（）

内容已经隐藏，点击付费后查看

Znode有两种类型，分别是（）和永久节点。

内容已经隐藏，点击付费后查看

Hive是由哪家公司开源的（）。

内容已经隐藏，点击付费后查看

在Hadoop体系中，分布式文件系统是指（）

内容已经隐藏，点击付费后查看

Hive是为了解决哪类问题（）

内容已经隐藏，点击付费后查看

大数据的文件系统是（）。

内容已经隐藏，点击付费后查看

MapReduce体系结构主要由TaskTracker、Task、JobTracker和（）组成。

内容已经隐藏，点击付费后查看

在词频统计中，对于文本行"hello hadoop hello world"，经过WordCount的Reduce函数处理后的结果是（）。

内容已经隐藏，点击付费后查看

下列关于传统并行计算框架（比如MPI）和MapReduce并行计算框架比较错误的是（）。

内容已经隐藏，点击付费后查看

下面哪个配置是在mapred-site、xml中配置的（）。

内容已经隐藏，点击付费后查看

shuffle和sort输出的key实现了下面哪个接口（）

内容已经隐藏，点击付费后查看

OutputFormat是MapReduce输出的基类，所有的MapReduce输出都实现OutputFormat接口。（）

内容已经隐藏，点击付费后查看

Sqoop本质上是使用MR程序进行数据迁移的工具。（）

内容已经隐藏，点击付费后查看

Hive中desc new_info命令用来显示当前数据表字段结构。（）

内容已经隐藏，点击付费后查看

安装Hadoop时，配置项”dfs、replication”是配置在文件core-site、xml（）。

内容已经隐藏，点击付费后查看

HDFS集群开始启动时，其处于安全模式，可以进行读操作，不能进行写操作。（）

内容已经隐藏，点击付费后查看

大数据技术是一系列技术的总称，它是集合了数据采集与传输、数据存储、数据处理与分析、数据挖掘、数据可视化等技术，是一个庞大而复杂的技术体系。（）

内容已经隐藏，点击付费后查看

Zookeeper的选举机制，实际上是采用算法FastLeaderElection，投票数大于半数则胜出的机制。（）

内容已经隐藏，点击付费后查看

设置免密登录需要先用ssh-keygen生成一对密钥（）。

内容已经隐藏，点击付费后查看

Watcher事件类型(EventType)常见的表示事件类型枚举属性及属性含义（）

内容已经隐藏，点击付费后查看

下列成员属于MapReduce体系结构中的有：（）

内容已经隐藏，点击付费后查看

Hadoop有3大核心组件分别是（）。

内容已经隐藏，点击付费后查看

YARN作为Hadoop的资源管理器，它的引入为集群带来了哪些好处？（）

内容已经隐藏，点击付费后查看

下面关于Hive SQL编译描述不正确的是（）

内容已经隐藏，点击付费后查看

HDFS的适用性和局限性，以下说法正确的是（）。

内容已经隐藏，点击付费后查看

以下对名称节点理解正确的是（）。

内容已经隐藏，点击付费后查看

Client使用HBase RPC机制与哪些组件进行通信？（）

内容已经隐藏，点击付费后查看

Watcher机制主要包括（）

内容已经隐藏，点击付费后查看

HDFS中第二名称节点的作用是（）。

内容已经隐藏，点击付费后查看

端口9870默认是Hadoop3、X哪个服务的端口？（）。

内容已经隐藏，点击付费后查看

Zookeeper是由（）组成的树。

内容已经隐藏，点击付费后查看

HDFS集群采用主从结构，节点主要包括（）和数据节点。

内容已经隐藏，点击付费后查看

如何查看sqoop命令列表？（）

内容已经隐藏，点击付费后查看

对MapReduce的体系结构，以下说法错误的是（）。

内容已经隐藏，点击付费后查看

Sqoop的作用是？（）

内容已经隐藏，点击付费后查看

Sqoop中的（）命令是将数据导入到集群中。

内容已经隐藏，点击付费后查看

在使用MapReduce程序WordCount进行词频统计时，对于文本行“hello hadoop hello world”，经过WordCount程序的Map函数处理后直接输出的中间结果，应该是下面哪种形式（）。

内容已经隐藏，点击付费后查看

下列说法中，关于Zookeeper说法错误的是（）。

内容已经隐藏，点击付费后查看

HBase 语言大小写不敏感。（）

内容已经隐藏，点击付费后查看

在Hadoop中每个应用程序被表示成一个作业，每个作业又被分成多个任务，JobTracker的负责作业的分解、状态监控以及资源管理。（）

内容已经隐藏，点击付费后查看

非全新集群选举时是优中选优，保证Leader是Zookeeper集群中数据最完整、最可靠的一台服务器。（）

内容已经隐藏，点击付费后查看

Hive的数据库、表、分区在HDFS的表现形式是文件夹。（）

内容已经隐藏，点击付费后查看

下列选项中，属于Zookeeper集群的角色有（）。

内容已经隐藏，点击付费后查看

Hive 中主要包括4 种数据模型，分别为哪些选项？（）。

内容已经隐藏，点击付费后查看

以下（）哪些项属于sqoop2优点。

内容已经隐藏，点击付费后查看

HBase表的索引结构，包含下列哪些选项（）

内容已经隐藏，点击付费后查看

关于HBase表的单元格描述，下面哪些是正确的（）

内容已经隐藏，点击付费后查看

关于MapReduce过程中的split阶段，说法正确的是：（）

内容已经隐藏，点击付费后查看

下面关于Hive内外表描述不正确的是（）

内容已经隐藏，点击付费后查看

编写MapReduce程序时，下列叙述错误的是（）。

内容已经隐藏，点击付费后查看

通过执行（）命令，查看该节点的Zookeeper角色

内容已经隐藏，点击付费后查看

HBase表中关于列族描述，下列选项哪个是不正确？（）

内容已经隐藏，点击付费后查看

一旦NameNode关闭，就无法访问Hadoop集群的是（）

内容已经隐藏，点击付费后查看

sqoop安装完成后，查看sqoop版本的命令是？（）

内容已经隐藏，点击付费后查看

如何查看当前sqoop中都有哪些job？（）

内容已经隐藏，点击付费后查看

Znode的类型在创建时被指定，创建后仍能改变。（）

内容已经隐藏，点击付费后查看

HBase是面向行的存储模式。（）

内容已经隐藏，点击付费后查看

关于MapReduce的shuffle过程，叙述正确的是（）。

内容已经隐藏，点击付费后查看

HBase的主要组件有3个，是下列选项中的哪些？（）

内容已经隐藏，点击付费后查看

以下对数据节点理解正确的是（）。

内容已经隐藏，点击付费后查看

格式化文件系统指令（）。

内容已经隐藏，点击付费后查看

下列概念正确的有（）

内容已经隐藏，点击付费后查看

下面哪些是MapReduce的计划的主要配置参数？（）

内容已经隐藏，点击付费后查看

执行sqoop help会有以下哪些帮助项？（）

内容已经隐藏，点击付费后查看

Sqoop是连接传统关系型数据库和Hadoop的桥梁。包括（）两个方面。

内容已经隐藏，点击付费后查看

当Zookeeper客户端连接认证失败，此时客户端和服务器的连接状态就是（）说明认证失败。

内容已经隐藏，点击付费后查看

在实验集群的master节点使用jps命令查看进程时，终端出现以下哪项能说明Hadoop主节点启动成功？（）

内容已经隐藏，点击付费后查看

Watch机制有4个特点：一次性触发、分布式锁、异步发送、先注册再触发（）

内容已经隐藏，点击付费后查看

起初的Hadoop是使用Java语言开发的。（）

内容已经隐藏，点击付费后查看

Hadoop集群配置文件中，配置HDFS的属性的是以下哪一项（）。

内容已经隐藏，点击付费后查看

Client 端上传文件的时候下列哪项正确？（）

内容已经隐藏，点击付费后查看

Hive有什么好处（）

内容已经隐藏，点击付费后查看

HBase 是一个构建在Hadoop文件系统之上的面向列的数据库管理系统。（）

内容已经隐藏，点击付费后查看

安装完全分布式Apache Hadoop的核心配置文件有？（）

内容已经隐藏，点击付费后查看

YARN主要负责大数据计算管理中的（）。

内容已经隐藏，点击付费后查看

以下哪一项属于 Hadoop 可以运行的模式（）。

内容已经隐藏，点击付费后查看

对HDFS内的文件进行操作，以下说法正确的是（）。

内容已经隐藏，点击付费后查看

hdfs系统不支持数据的修改。（）

内容已经隐藏，点击付费后查看

Sqoop的使用者需要以下哪些先决条件知识（）

内容已经隐藏，点击付费后查看

Zookeeper的顺序性主要分为两种，分别是（）和偏序。

内容已经隐藏，点击付费后查看

HBase表中单元格中的值是（）

内容已经隐藏，点击付费后查看

HDFS具有高延迟性。它不适用于低延迟的数据访问。（）

内容已经隐藏，点击付费后查看

HDFS与传统数据存储对比，主要特点包含（）。

内容已经隐藏，点击付费后查看

Zookeeper作为一个分布式应用提供一致性服务的软件，提供的功能（）

内容已经隐藏，点击付费后查看

Hadoop中，MapReduce负责提供对数据的计算结果的汇总的是（）。

内容已经隐藏，点击付费后查看

以下（）属于Sqoop的特点。

内容已经隐藏，点击付费后查看

传统关系型数据库数据定位是二维坐标，即行和列。（）

内容已经隐藏，点击付费后查看

–append参数是将数据追加到HDFS上一个已存在的数据集上。（）

内容已经隐藏，点击付费后查看

ResourceManager（RM）负责对各NodeManager上的资源进行统一管理和调度。（）。

内容已经隐藏，点击付费后查看

hadoopdfsadmin –report 命令用于检测HDFS损坏块。（）

内容已经隐藏，点击付费后查看

HQL语言大小写敏感，但内容分大小写。（）

内容已经隐藏，点击付费后查看

Hadoop环境变量中的HADOOP_HEAPSIZE用于设置所有 Hadoop守护线程的内存。它默认是200 GB。（）。

内容已经隐藏，点击付费后查看

HDFS有着高容错性的特点。（）

内容已经隐藏，点击付费后查看

当客户端断开连接，此时客户端和服务器的连接就是SyncConnected状态，说明连接失败。（）

内容已经隐藏，点击付费后查看

客户端连接HBase依赖于Zookeeper，HBase存储依赖于Hadoop Client。（）

内容已经隐藏，点击付费后查看

hcatalog是hive对外的一个统一存储格式的接口，使用hcatalog对接到hive的数据不需要担心数据在hive中的存储格式和存储位置。（）

内容已经隐藏，点击付费后查看

SQL语言大小写不敏感。（）

内容已经隐藏，点击付费后查看

Client与HMaster进行通信进行管理类操作（）

内容已经隐藏，点击付费后查看

HDFS的namenode保存了一个文件包括哪些数据块，分布在哪些数据节点上，这些信息也存储在硬盘上。（）

内容已经隐藏，点击付费后查看

Hive是数据库工具。（）

内容已经隐藏，点击付费后查看

drop 内部表时，会删除hdfs上的文件夹和元数据。（）

内容已经隐藏，点击付费后查看

因为 HDFS 有多个副本，所以NameNode是不存在单点问题的。（）

内容已经隐藏，点击付费后查看

大数据主要具有四个特征：即大量（Volume）、多样（Variety）、高速（Velocity）和价值（Value），也就是所谓的“4V”特征。（）

内容已经隐藏，点击付费后查看

Hadoop实现了一个分布式文件系统，简称HDFS。（）。

内容已经隐藏，点击付费后查看

Hadoop集群配置文件中配置Yarn运行所需的环境变量的是hdfs-site、xml。（）。

内容已经隐藏，点击付费后查看

修改~/、bashrc文件保存后，修改的内容能立即生效（）。

内容已经隐藏，点击付费后查看

HBase通过行键、列族、列限定符和时间戳来确定一个单元格数据。（）

内容已经隐藏，点击付费后查看

Zookeeper具有全局数据一致性、高容错性、无序性、原子性以及实时性。（）

内容已经隐藏，点击付费后查看

SecondaryNameNode应与NameNode部署到一个节点（）。

内容已经隐藏，点击付费后查看

查看Linux ip的命令是ifconfig（）。

内容已经隐藏，点击付费后查看

由于Zookeeper集群的运行不需要Java环境支持，所以不需要提前安装JDK。（）

内容已经隐藏，点击付费后查看

InputFormat接口决定了输入文件如何被Hadoop分块。InputFormat能够从一个job中得到一个list集合。（）

内容已经隐藏，点击付费后查看

两个键值对<“hello”，1>和<“hello”，1>x，如果对其进行归并(merge)，会得到<“hello”，内容已经隐藏，点击付费后查看>，如果对其进行合并(combine)，会得到<“hello”，2>。（）

内容已经隐藏，点击付费后查看

Zookeeper提供的getChildren()方法可以用于获取指定节点下的所有子节点列表。（）

内容已经隐藏，点击付费后查看

数据收集层是大数据技术和应用的目标。通常包括信息检索、关联分析等功能。（）

内容已经隐藏，点击付费后查看

NameNode 本地磁盘保存了Block的位置信息。（）

内容已经隐藏，点击付费后查看

在Hive进行表删除操作时，要区分内部表与外部表，下面描述正确的选项有哪些？删除内部表时：。（）等。

内容已经隐藏，点击付费后查看

选举机制类型（）

内容已经隐藏，点击付费后查看

以下关于sqoop-import的作用描述正确的有（）

内容已经隐藏，点击付费后查看

下面关于Hive数据模型描述正确的是（）

内容已经隐藏，点击付费后查看

Zookeeper采用了Watch机制来实现分布式数据的（）功能

内容已经隐藏，点击付费后查看

在设置Linux环境中，关闭防火墙的代码有哪些（）。

内容已经隐藏，点击付费后查看

Yarn它主要由两大核心模块构成，分别是（）。

内容已经隐藏，点击付费后查看

Hadoop存储系统HDFS的体系结构的设计目标包含（）。

内容已经隐藏，点击付费后查看

下面关于传统关系型数据库的特性描述，正确的有哪些？（）

内容已经隐藏，点击付费后查看

下列关于hadoop集群启动中的所有进程及其作用，正确的有（）

内容已经隐藏，点击付费后查看

第一代Hadoop存在的问题（）。

内容已经隐藏，点击付费后查看

一个完整的mapreduce程序在分布式运行时有三类实例进程，是哪三个？（）

内容已经隐藏，点击付费后查看

关于MapReduce程序，下列说法正确的有：（）

内容已经隐藏，点击付费后查看

以下HDFS相关的shell命令不正确的是（）。

内容已经隐藏，点击付费后查看

下列说法中，关于zoo.cfg配置文件中的参数server.1=hadoop01：2888：3888说法正确的是（）。

内容已经隐藏，点击付费后查看

Hive驱动器主要包括哪些选项？（）

内容已经隐藏，点击付费后查看

MapReduce中的JobTracker拆分为两个独立任务，这两个任务分别是（）。

内容已经隐藏，点击付费后查看

Zookeeper 使用 WatchedEvent 对象来封装服务端事件并传递。该对象包含了每个事件的（）基本属性

内容已经隐藏，点击付费后查看

关于HBase表的列限定符描述，下面哪些是正确的（）

内容已经隐藏，点击付费后查看

YARN服务组件包括（）

内容已经隐藏，点击付费后查看

Hadoop的生态系统组件之—Sqoop的功能是？（）

内容已经隐藏，点击付费后查看

Sqoop工具是通过（）进行导入导出数据的。

内容已经隐藏，点击付费后查看

Zookeeper中的数据存储结构和标准文件系统非常类似，两者采用的层次结构是（）。

内容已经隐藏，点击付费后查看

Hadoop 集群的运行模式？（）。

内容已经隐藏，点击付费后查看

Hive与传统SQL数据库对比，下面描述不正确的是（）

内容已经隐藏，点击付费后查看

为了保证Leader选举能够通过半数以上台服务器选举支持，因此Zookeeper集群搭建的服务器为（）。

内容已经隐藏，点击付费后查看

下列哪个层主要采用了大数据采集技术，实现对数据的处理？（）

内容已经隐藏，点击付费后查看

下面选项中，与Zookeeper功能类似的框架是（）？

内容已经隐藏，点击付费后查看

下面中不属于Hive中的元数据信息（）

内容已经隐藏，点击付费后查看

在默认情况下，HDFS块的大小为（）。

内容已经隐藏，点击付费后查看

关于Hadoop MapReduce的叙述错误的是（）。

内容已经隐藏，点击付费后查看

不是hadoop主要组成部分的是：（）。

内容已经隐藏，点击付费后查看

从下列选项中，选择命令用于删除整行操作（）。

内容已经隐藏，点击付费后查看

从下列选项中，选择命令以查询表中指定列（）

内容已经隐藏，点击付费后查看

下列哪个程序通常与NameNode在一个节点启动？（）。

内容已经隐藏，点击付费后查看

下面关于Hive格式描述正确的是（）。

内容已经隐藏，点击付费后查看

以下哪种不是 Hive支持的数据类型（）

内容已经隐藏，点击付费后查看

HBase是哪个技术的开源实现（）。

内容已经隐藏，点击付费后查看

目前，Hadoop的最高版本是哪个？（）。

内容已经隐藏，点击付费后查看

NoSQL可划分为多种存储数据库，下列选项哪个不属于NoSql（）

内容已经隐藏，点击付费后查看

Hive的元数据存储在derby和 MySQL中有什么区别（）

内容已经隐藏，点击付费后查看

MapReduce为了保证任务的正常执行，采用重复执行和（）等多种容错机制。

内容已经隐藏，点击付费后查看

下列用来存放部署Hadoop集群服务器的机架的是（）

内容已经隐藏，点击付费后查看

以下哪种是HBase支持的数据类型（）

内容已经隐藏，点击付费后查看

通过将以下什么工具与Hadoop集群整合后，可以查看Hadoop集群中每个Master/Slave节点的运行状态？（）。

内容已经隐藏，点击付费后查看

HBase是哪个公司开发的（）。

内容已经隐藏，点击付费后查看

下面关于Hive和传统数据库的比较描述正确的是（）

内容已经隐藏，点击付费后查看

HBase依赖于Hadoop中的（）提供强大的计算能力。

内容已经隐藏，点击付费后查看

下列对Sqoop描述正确的是？（）

内容已经隐藏，点击付费后查看

Sqoop实现向hdfs系统导入数据使用的命令是（）

内容已经隐藏，点击付费后查看

下列选择参数是sqoop指令的是（）

内容已经隐藏，点击付费后查看

关于Map和Reduce两个阶段描述正确的是（）。

内容已经隐藏，点击付费后查看

Sqoop不支持下列哪种数据库（）

内容已经隐藏，点击付费后查看

Map任务作为MapReduce工作流程的前半部分，它主要经历了5个阶段，分别是Copy阶段、Merge阶段、Sort阶段、Reduce阶段和Write阶段。（）

内容已经隐藏，点击付费后查看

Partition主要作用就是将map的结果发送到相应的reduce。这就对partition有两个要求（）。

内容已经隐藏，点击付费后查看

sqoop的迁移的方式就是把sqoop的迁移命令转换成（）

内容已经隐藏，点击付费后查看

HBase中的显示命名空间名称的命令是：list_namespace。（）

内容已经隐藏，点击付费后查看

在HBase表中添加数据的命令，是下列选项中的哪个？（）

内容已经隐藏，点击付费后查看

对HBase表中数据进行全表查看的命令，是下列选项中的哪个？（）

内容已经隐藏，点击付费后查看

HBase表名区分大小写，所有的字符串都必须包含在单引号里（）

内容已经隐藏，点击付费后查看

在HBase表中按行键查询数据的命令，是下列选项中的哪个？（）

内容已经隐藏，点击付费后查看

HBase是一种键值类型的NoSql数据库。（）

内容已经隐藏，点击付费后查看

HBase 依靠（）来存储底层数据的。

内容已经隐藏，点击付费后查看

关于HBase的相关描述，下面哪些是正确的？（）

内容已经隐藏，点击付费后查看

关于HBase的逻辑表描述，下面选项中正确的是（）

内容已经隐藏，点击付费后查看

HBase来源于IBM Bigtable （）

内容已经隐藏，点击付费后查看

下列关于Hive的描述，正确的有哪些？（）。

内容已经隐藏，点击付费后查看

Hive在删除内部表时，内部表的元数据被删除，数据本身不删除（）

内容已经隐藏，点击付费后查看

Hive能够用来进行海量数据的存储、查询和离线分析。（）

内容已经隐藏，点击付费后查看

HiveQL和SQL的一个不同之处在于Partition操作。（）

内容已经隐藏，点击付费后查看

Hive定义了简单的类似SQL的语言，称为（）。

内容已经隐藏，点击付费后查看

Hive是基于（）

内容已经隐藏，点击付费后查看

从下列选项中，选出不是Hive基本类型的选项。（）

内容已经隐藏，点击付费后查看

按粒度大小的顺序，Hive数据被分为数据库，数据表，分区和桶。（）

内容已经隐藏，点击付费后查看

Hive默认分桶的数量是（）。

内容已经隐藏，点击付费后查看

Hive是建立在（）之上的数据仓库。

内容已经隐藏，点击付费后查看

ZooKeeper是一个封闭源码的分布式应用程序协调服务，它是由Google的Chubby开源实现，是Hadoop和Hbase的重要组件。（）

内容已经隐藏，点击付费后查看

下列选项中，用于获取Zookeeper所包含的信息的Shell命令是（）。

内容已经隐藏，点击付费后查看

Zookeeper中，Watcher机制的特点包含（）。

内容已经隐藏，点击付费后查看

安装Hadoop时，发现50070对应的页面无法打开，可以通过下面哪个命令查看某个端口（TCP或UDP）是否在监听?（）

内容已经隐藏，点击付费后查看

Zookeeper特点（）

内容已经隐藏，点击付费后查看

Namenode在启动时自动进入安全模式，在安全模式阶段，说法错误的是（）

内容已经隐藏，点击付费后查看

临时节点允许拥有子节点。（）

内容已经隐藏，点击付费后查看

在Hadoop中负责运算的组件是（）

内容已经隐藏，点击付费后查看

Hadoop的框架最核心的设计就是：HDFS和MapReduce。（）

内容已经隐藏，点击付费后查看

HDFS为海量的数据提供了存储，而MapReduce为海量的数据提供了计算。（）

内容已经隐藏，点击付费后查看

在MapReduce中，下面哪个阶段是并行进行的（）

内容已经隐藏，点击付费后查看

ReduceTask工作过程包含下面哪些阶段（）。

内容已经隐藏，点击付费后查看

在Hadoop中，下面哪个是默认的InputFormat类型，它将每行内容作为新值，而将字节偏移量作为key（）

内容已经隐藏，点击付费后查看

关于combiner描述正确的是（）。

内容已经隐藏，点击付费后查看

Map阶段，溢出的数据写入磁盘之前，线程会根据ReduceTask的数量进行数据分区，一个Reduce任务对应一个分区的数据。（）

内容已经隐藏，点击付费后查看

Google公司设计MapReduce的初衷主要是为了解决其搜索引擎中大规模网页数据的并行化处理。（）

内容已经隐藏，点击付费后查看

在MapReduce中，下面哪个数据流的顺序是正确的（）

内容已经隐藏，点击付费后查看

下列属于HDFS缺点的是（）

内容已经隐藏，点击付费后查看

HDFS对于服务器性能要求很高，必须构建在高成本的机器上。（）

内容已经隐藏，点击付费后查看

下列属于HDFS集群的主服务器的是（）

内容已经隐藏，点击付费后查看

NameNode收到客户端的请求后，检查数据操作权限并判断上传的文件是否已存在，如果已存在，则拒绝客户端的上传。（）

内容已经隐藏，点击付费后查看

HDFS 中的block默认保存几个备份。（）

内容已经隐藏，点击付费后查看

HDFS是一个易于扩展的分布式文件系统。（）

内容已经隐藏，点击付费后查看

命令hadoop fs -ls / 的功能是（）

内容已经隐藏，点击付费后查看

下列不属于NameNode的功能的是（）

内容已经隐藏，点击付费后查看

客户端向（）发出写文件请求？

内容已经隐藏，点击付费后查看

在HDFS中，我们只能使用Shell命令来管理和操作文件系统。（）

内容已经隐藏，点击付费后查看

Hadoop 支持数据的随机读写。（）

内容已经隐藏，点击付费后查看

Hadoop配置文件所在目录是哪个？（）

内容已经隐藏，点击付费后查看

下面哪个目录保存了Hadoop集群的命令（比如启动Hadoop）?（）

内容已经隐藏，点击付费后查看

Hadoop 默认调度器策略为FIFO （）

内容已经隐藏，点击付费后查看

HDFS配置文件和配置Yarn运行所需的环境变量是以下哪两个文件（）

内容已经隐藏，点击付费后查看

完成Hadoop集群主节点hadoop01的配置后，还需要将系统环境配置文件、JDK安装目录和Hadoop安装目录分发到其他子节点hadoop02和hadoop03上，具体指令（）

内容已经隐藏，点击付费后查看

Nagios不可以监控Hadoop集群，因为它不提供Hadoop支持。（）

内容已经隐藏，点击付费后查看

下列哪个属性是hdfs-site.xml中的配置？（）

内容已经隐藏，点击付费后查看

重启网卡服务是systemctl restart network（）

内容已经隐藏，点击付费后查看

Hadoop完全分布模式配置免密登录是要？（）

内容已经隐藏，点击付费后查看

1、起初的Hadoop是什么语言开发的？（）

内容已经隐藏，点击付费后查看

大数据处理分为两类：批量处理（即离线处理）和实时处理（即在线处理）。（）

内容已经隐藏，点击付费后查看

下列（）是整个Hadoop体系的基础，负责数据的存储与管理？

内容已经隐藏，点击付费后查看

数据的种类不仅包括文字、图片，还包含了视频、语音、地图定位信息、网络日志信息等。（）

内容已经隐藏，点击付费后查看

下列哪个层主要采用了大数据采集技术，实现对数据的ETL操作？（）

内容已经隐藏，点击付费后查看

下列属于Hadoop核心的是（）

内容已经隐藏，点击付费后查看

怎样级别的数据称得上是海量数据？（）

内容已经隐藏，点击付费后查看

大数据的“4V”特征是指什么（）

内容已经隐藏，点击付费后查看

HDFS是Hadoop的核心之一，主要实现分布式计算功能。（）

内容已经隐藏，点击付费后查看

Hadoop已经正式成为、Apache顶级开源项目，俨然已经处于大数据处理技术的核心地位。（）

内容已经隐藏，点击付费后查看

yarn集群是负责集群（）和运算资源管理的分布式集群。

内容已经隐藏，点击付费后查看

目前典型的大数据文件系统有（）。

内容已经隐藏，点击付费后查看

大数据存储是指把不同来源、不同格式及不同类型的大规模数据在逻辑上或物理上有机的集中，存储在分布式存储系统中，以提高数据的可靠性和可扩展性。（）

内容已经隐藏，点击付费后查看

分布式数据存储策略可分为ACID和（）两类

内容已经隐藏，点击付费后查看

HDFS是一个（）

内容已经隐藏，点击付费后查看

mapreduce不是一个集群，而是一个编程框架（）

内容已经隐藏，点击付费后查看

Hadoop集群主要包含以上哪三个模块：（）

内容已经隐藏，点击付费后查看

mapreduce是一个分离再合并的集群。（）

内容已经隐藏，点击付费后查看

Hadoop集群旨在用于分布式计算环境中（）和分析大量非结构化数据。

内容已经隐藏，点击付费后查看

Hadoop集群具有很高的抗故障能力，因为每个数据块都复制到其他节点上，以确保在单个节点发生故障时不会丢失数据。（）

内容已经隐藏，点击付费后查看

温馨提示支付 ￥5.00 元后可查看付费内容,请先翻页预览!

微信支付

点赞(2) dxwkbang

本文分类：知到智慧树期末考试答案章节题库2024春-非顺序
本文标签：集群部署与数据存储
浏览次数：65 次浏览
发布日期：2024-05-05 01:29:47

上一篇 > 数据结构与算法分析期末答案和章节题库2024春
下一篇 > 机械基础期末答案和章节题库2024春