⬆️⬆️⬆️本课程2024最新同名章节期末答案⬆️⬆️

大数据平台技术期末考试答案2023春

所有课程章节/期末均有答案,可提供word版,点击联系客服✅

51 阅读 0 评论 1 点赞

提示:内容已经过期谨慎付费，点击上方查看最新答案

大数据平台技术

在vi编辑器的命令模式下，要进入输入模式并在目前光标所在的下一行处输入新的一行，需要按下键盘上的（）。

答案:ddAI参考:在vi编辑器的命令模式下，要进入输入模式并在目前光标所在的下一行处输入新的一行，需要按下键盘上的“o键”。选项A、B、C都不符合vi编辑器的操作规则。因此，正确答案是D。'

结构化数据一般具有（）。

AI参考:正确答案是D：二维表结构。结构化数据一般具有二维表结构，如表格中的数据，数据的每个字段之间存在一对多的关系。故选D。其他选项不符合结构化数据的特性。'

下列数据中属于结构化数据的是（）。

AI参考:正确选项是 C：学生成绩记录表。结构化数据是指具有固定格式和规范的数据，通常包括数字、字母、符号等，并且可以按照一定的逻辑进行组织和存储。在四个选项中，只有学生成绩记录表是按照一定的格式和规范进行组织和存储的数据，因此属于结构化数据。HTML代码、网页文本和Python代码都是非结构化数据或半结构化数据，不能被视为结构化数据。'

Spark的任务调度执行机制是以什么为基础的（）。

AI参考:正确选项是 D:RDD。Spark 的任务调度执行机制是以 RDD（Resilient Distributed Datasets）为基础的。RDD 是 Spark 计算的基础数据结构，它是不可变的，分区存储在集群的各个节点上。Spark 任务调度基于 RDD 的依赖关系进行计算，通过 Shuffle 和 Partition 机制实现任务的调度和执行。在 Spark 中，任务调度和执行的核心是 RDD 的操作和转换，以及它们之间的依赖关系。因此，选项 D 是正确答案。选项 A、B、C 虽然也是 Spark 的重要概念，但并不是任务调度执行机制的基础。'

下列数据中属于非结构化数据的是（）。

AI参考:正确答案是B：抖音视频。非结构化数据指的是没有固定格式，不能被计算机系统直接读取的数据，如图片、音频、视频、报告等。而选项A、C、D中的HTML代码、XML代码、学生成绩记录表都属于结构化数据，只有抖音视频属于非结构化数据。因此，本题答案为B。'

在vi编辑器的命令模式下，要向后删除一个字符，需要按下键盘上的（）。

答案:xAI参考:在vi编辑器的命令模式下，要向后删除一个字符，需要按下键盘上的“x”键。选项A正确。在vi编辑器中，x键用于删除光标后的字符，而i键用于进入插入模式，r键用于替换一个字符，o键用于插入新行。因此，选项B、C、D均不正确。'

在Spark中，Spark Core的主要功能是（）。

答案:###弹性的###高吞吐的###容错的AI参考:在Spark中，Spark Core的主要功能是实现Spark的基本功能，包含任务调度、内存管理、错误恢复、与存储系统交互等。因此，正确答案是D。Spark Core是Spark框架的最核心部分，负责处理底层的计算任务调度、内存管理、错误恢复以及与存储系统（如HDFS、本地文件系统等）的交互等。它能够高效地在单个计算节点到数千个计算节点之间伸缩计算，这是由Spark的分布式计算引擎属性决定的。而对于结构化数据的操作和对实时数据的流式计算，则是Spark的其他部分，如Spark SQL、MLlib和Streaming等模块的功能。'

下面不属于Flume中Agent的组成部分（）。

答案:Sink;Channel;Source

下面哪项关于HBase 的常用命令的描述是正确的（）。

答案:HBase要查看表可以使用list_namespace;HBase一张正在使用的表可以直接使用drop命令删除;HBase全表扫描使用get命令

Topic是什么（）。

AI参考:正确答案是C:发布消息的过程。题目中提到的Topic是通信的基本单位，但这个选项与题目中的选项A不符。消费者、处理的消息源的不同分类也不是题目中提到的Topic。因此，正确答案是发布消息的过程，因为它描述了通信中的一个基本过程。'

MapReduce适用于（）。