大数据分析与预测技术章节测试课后答案2024春

214 阅读 0 评论 8 点赞

第九章测试

1.Spark Streaming是什么软件栈中的流计算?
A:Hive B:Flume C:Storm D:Spark
答案:D
2.下列选项中,不是kafka适合的应用场景是?
A:消息系统 B:日志收集 C:业务系统 D:流式处理

3.在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系？
A:数量越多处理时间越短 B:数量越小处理时间越短 C:数量越多处理时间越长 D:没什么关系

4.整个MapReduce的过程大致分为Map、Shuffle、Combine和以下哪个？
A:Clean B:Loading C:Reduce D:Hash

5.Spark是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。需要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小但是计算密集度较大的场合,受益就相对较小
A:硬盘 B:显卡 C:内存 D:磁带

6.HBASE的特点不包括哪两项?
A:高可靠性 B:稠密性 C:面向行 D:多版本

7.Yarn架构在Hadoop生态圈中有哪些作用?
A:调度 B:计算数据 C:保证协同 D:资源分配

8.HDFS适用于哪些场景?
A:存储和管理PB级别数据 B:大量小文件 C:低延迟读取 D:一次写入,多次读取

9.NoSQL数据库具有以下哪几个特点？
A:灵活的可扩展性 B:灵活的数据模型 C:与云计算紧密融合 D:分布式存储

10.关于RDD，说法正确的两项是？
A:RDD 不能由多个分区（partition）组成 B:是一个容错的、并行的数据结构 C:弹性、集中式内存集 D:RDD能生成childrenRDD

温馨提示支付 ￥3.00 元后可查看付费内容,请先翻页预览!

微信支付

点赞(8) dxwkbang