⬆️⬆️⬆️本课程2024最新同名章节期末答案⬆️⬆️

Hadoop平台构建期末答案和章节题库2024春

所有课程章节/期末均有答案,可提供word版,点击联系客服✅

75 阅读 0 评论 4 点赞

zookeeper集群使用的协议（）。

答案:ZAB协议

在spark生态组件中，哪个产品可用于复杂的批量数据处理（）。

答案:spark core

下列通常是集群最主要的瓶颈是：（）

答案:磁盘I/O

在ps命令中什么参数是用来显示所有用户的进程的？（）

答案:a

在Hadoop集群中，负责海量数据的存储和分析的组件是___B______。

答案:HBase

ssh服务端的进程名为（）

答案:sshd

以下哪项不属于大数据思维的涵盖内容（）：

答案:通过采样的手段获取目标群体的统计特性

Hadoop的NameNode负责____A_____。

答案:管理HDFS的数据块

关于ZKFC故障转移控制器，说法正确的是（）。A .当集群启动时，主备节点的概念是很模糊的，当ZKFC检查到任意一个节点是健康状态，直接将其设置为主节点。

答案:当zkfc检查到两个NN节点是健康状态，发起投票机制选出一个主节点，一个备用节点，并修改主备节点的状态。

显示一个文件最后几行的命令是：（）

答案:tail

HDFS是Hadoop提供的_____A____。

答案:分布式文件系统

如何在文件中查找显示所有以"*"打头的行？（）

内容已经隐藏，点击付费后查看

下面哪条命令可以把f1.txt复制为f2.txt?（）

内容已经隐藏，点击付费后查看

关于hadoop MapReduce分片（split）的概念，下列说法不正确的是（）

内容已经隐藏，点击付费后查看

在Hadoop中，可以使用___C______进行流式数据处理。

内容已经隐藏，点击付费后查看

在Hadoop中，可以使用_____C____执行高级数据查询。

内容已经隐藏，点击付费后查看

HBase默认使用什么作为其底层文件存储系统?（）

内容已经隐藏，点击付费后查看

Zookeeper角色分配不包括（）

内容已经隐藏，点击付费后查看

在Hadoop中，可以使用____C_____进行消息传递。

内容已经隐藏，点击付费后查看

在思维方式方面，不是大数据显著影响的是（）。

内容已经隐藏，点击付费后查看

RDD可以从hadoop兼容的文件系统生成，生成之后通过调用RDD算子对RDD的数据进行部分更新。（）

内容已经隐藏，点击付费后查看

在Hadoop集群中，HBase负责数据的增删改查。（）

内容已经隐藏，点击付费后查看

Hbase的最小存储单元不是Region而是一个Cell单元。（）

内容已经隐藏，点击付费后查看

假设HDFS 在写入数据是只存 2 份,那么在写入过程中, HDFS Client 先将数据写入Datanode1,再将数据写入Datanode2。（）

内容已经隐藏，点击付费后查看

对高价值高度聚合的信息和知识的批次处理是大数据行业主要商业诉求.（）

内容已经隐藏，点击付费后查看

Hadoop 集群具体来说包含两个集群：HDFS集群和YARN集群，两者逻辑上分离，但物理上常在一起（）

内容已经隐藏，点击付费后查看

在Hadoop中，可以使用Kafka进行实时数据处理。（）

内容已经隐藏，点击付费后查看

在HDFS NameNode中Fslmage中并没有记录具体的记录块在哪些数据节点上存储的，是通过数据节点和名称节点在运行时不断通过沟通而实时维护这些信息的, 而这些信息都是存储到内存单中去了。（）

内容已经隐藏，点击付费后查看

HBase中Compaction的目的是减少同一个Region，同一个ColumnFamily下的文件数目。（）

内容已经隐藏，点击付费后查看

Hadoop中的HDFS是用来处理非结构化数据的。（）

内容已经隐藏，点击付费后查看

Hadoop的NameNode负责存储HDFS的文件。（）

内容已经隐藏，点击付费后查看

大数据不是万能的，所以我们要将大数据方法结合传统的推理预测方法，才得到一个更加精确的结果。（）

内容已经隐藏，点击付费后查看

HDFS系统不支持数据的修改。（）

内容已经隐藏，点击付费后查看

HDFS集群中的数据节点一般是一个节点运行一个数据节点进程，负责处理文件系统客户端的读/写请求，在名称节点的统一调度下进行数据块的创建、删除和复制等操作。（）

内容已经隐藏，点击付费后查看

一个 Java 源程序文件中只能定义一个 public 类。（）

内容已经隐藏，点击付费后查看

spark是由C编程语言实现的。（）

内容已经隐藏，点击付费后查看

Yarn-client 和Yarn-cluster 主要区是Application Master 进程的区别.（）

内容已经隐藏，点击付费后查看

使用Shell命令insert对HBase中的一张表进行数据添加操作。（）

内容已经隐藏，点击付费后查看

Spark 是基于内存的计算，所有 Spark 程序运行过程中的数据只能存储在内存中。（）

内容已经隐藏，点击付费后查看

在Hadoop中，可以使用Flume进行消息传递。（）

内容已经隐藏，点击付费后查看

Hadoop是一种分布式计算平台。（）

内容已经隐藏，点击付费后查看

对于大数据而言，最基本、最重要的要求就是减少错误、保证质量。因此，大数据收集的信息量要尽量精确。（）

内容已经隐藏，点击付费后查看

MapReduce是分布式并行计算框架，其计算模式属于流计算，实时性好。（）

内容已经隐藏，点击付费后查看

因为HDFS有多个副本，所以NameNode是不存在单点问题的。（）

内容已经隐藏，点击付费后查看

Flume 传输数据过程中，sink 取走数据并写入目的地后，会将 event 从channe中刪除。（）

内容已经隐藏，点击付费后查看

HBase是Hadoop中的关系型数据库。（）

内容已经隐藏，点击付费后查看

Hadoop集群中的任务调度和资源管理是由HBase完成的。（）

内容已经隐藏，点击付费后查看

每个 map 槽就是一个线程。（）

内容已经隐藏，点击付费后查看

Hadoop支持数据的随机写。（）

内容已经隐藏，点击付费后查看

Hadoop是一种关系型数据库。（）

内容已经隐藏，点击付费后查看

配置Hadoop时，JAVA_HOME包含在（）

内容已经隐藏，点击付费后查看

基于 Hadoop 开源大数据平台主要提供了针对数据分布式计算和存储能力，如下属于分布式存储组件的有（）。

内容已经隐藏，点击付费后查看

Hadoop 自身具有严格的权限管理和安全措施保障集群正常运行。（）

内容已经隐藏，点击付费后查看

Hadoop及其生态系统，可以部署在（）。

内容已经隐藏，点击付费后查看

Hadoop的三种安装模式包括以下哪种（）。

内容已经隐藏，点击付费后查看

Spark Streaming 计算基于DStream 将流式计算分解成一系列短小的批处理作业。（）

内容已经隐藏，点击付费后查看

spark 的 master 和 worker 通过什么方式进行通信的（）。

内容已经隐藏，点击付费后查看

Spark 任务的每个 stage 可划分为 job，划分的标记是 shuffle。（）

内容已经隐藏，点击付费后查看

Spark 任务的 Executor 可以执行多个 task。（）

内容已经隐藏，点击付费后查看

Spark 和 Hadoop 都不适用于迭代计算的场景。（）

内容已经隐藏，点击付费后查看

下列不属于非关系型数据库的是（）。

内容已经隐藏，点击付费后查看

以下属于Hive SQL 中DDL数据定义语言的是（）。

内容已经隐藏，点击付费后查看

Hive 是一种数据仓库处理工具,使用类sql 的HivesqlL 语言实现数据查询功能,所有Hive 的数据都存储在HDFS 中。（）

内容已经隐藏，点击付费后查看

Hive 中的这条命令“LOAD DATA LOCAL INPATH '/opt/college/person.csv' OVERWRITE into table person;”是个什么类型的操作 ( )。

内容已经隐藏，点击付费后查看

HIVE的元数据可存储在哪里（）。

内容已经隐藏，点击付费后查看

Hive 中的这条命令“drop table person;”是什么含义（）

内容已经隐藏，点击付费后查看

关于hive 建表基本描述正确的是（）。

内容已经隐藏，点击付费后查看

加载数据到 Hive 表，哪种方式不正确（）。

内容已经隐藏，点击付费后查看

对hive中表数据操作描述正确的是（）。

内容已经隐藏，点击付费后查看

对于Hive 中关于普通表和外部表描述不正确的是（）。

内容已经隐藏，点击付费后查看

Hadoop是当前大数据平台的事实标准，下列对Hadoop的描述中正确的是（）。

内容已经隐藏，点击付费后查看

MapReduce与HBase的关系，（）描述是正确的。

内容已经隐藏，点击付费后查看

MapReduce程序对数据的处理主要分为下列哪些过程（）。

内容已经隐藏，点击付费后查看

MapReduce 的 input split 一定是一个 block。（）

内容已经隐藏，点击付费后查看

Mapreduce 过程中,以下属于Shuffle 机制的是（）。

内容已经隐藏，点击付费后查看

HBase依赖（）技术框架提供消息通信机制。

内容已经隐藏，点击付费后查看

下列（）选项是安装HBase前所必须安装的。

内容已经隐藏，点击付费后查看

Hadoop 的 HBase 主要特点有哪些（）

内容已经隐藏，点击付费后查看

HBase 的数据文件 HFile 中一个 Keyvalue 格式包含哪些信息（）。

内容已经隐藏，点击付费后查看

HBase系统用于记录Region相关信息的表，具体的表包含（）。

内容已经隐藏，点击付费后查看

以下哪个不是HDFS的守护进程（）。

内容已经隐藏，点击付费后查看

下列关于HDFS的描述正确的是（）

内容已经隐藏，点击付费后查看

HDfS中的block默认保存几份（）。

内容已经隐藏，点击付费后查看

下列哪个属性是hdfs-site.xml中的配置（）。

内容已经隐藏，点击付费后查看

HDFS是基于流数据模式访问和处理超大文件的需求而开发的，具有高容错、高可靠性、高可扩展性、高吞吐率等特征，适合的读写任务是（）。

内容已经隐藏，点击付费后查看

Hadoop生态系统中，被作为ETL使用的软件是（）。

内容已经隐藏，点击付费后查看

Hadoop作为分布式计算技术的杰出代表，其主要特征包括（）。

内容已经隐藏，点击付费后查看

以下命令组成错误的是（）。

内容已经隐藏，点击付费后查看

想要修改集群的备份数量,可以修改哪个（）。

内容已经隐藏，点击付费后查看

关于Hadoop单机模式和伪分布式模式的说法，正确的是（）。

内容已经隐藏，点击付费后查看

（）在许多情况下，能够达到99.999%的可用性。

内容已经隐藏，点击付费后查看

解压.tar.gz结尾的HBase压缩包使用的Linux命令是（）。

内容已经隐藏，点击付费后查看

下列对大数据特点的说法中，错误的是（）。

内容已经隐藏，点击付费后查看

大数据的战略意义是实现数据的增值。大数据的显著特征主要表现在：数据体量巨大、（）。

内容已经隐藏，点击付费后查看

大数据与云计算之间的关系是（）。

内容已经隐藏，点击付费后查看

Hadoop平台构建项目重点内容（）。

内容已经隐藏，点击付费后查看

温馨提示支付 ￥3.00 元后可查看付费内容,请先翻页预览!

微信支付

点赞(4) dxwkbang

本文分类：知到智慧树期末考试答案章节题库2024春-非顺序
本文标签：Hadoop平台构建
浏览次数：75 次浏览
发布日期：2024-05-05 01:17:07

上一篇 > 机械制造技术基础期末答案和章节题库2024春
下一篇 > 建筑装饰设计原理期末答案和章节题库2024春