第六章测试
1.Spark框架的特色包括( )。
A:容易使用
B:运行速度快
C:通用性
D:运行模式多样

答案:ABCD
2.Spark 支持的集群管理器包括( )。
A:Apache Mesos
B:SparkCore
C:Standalone
D:Hadoop YARN
3.下面关于Spark 驱动程序 driver program的说法,正确的是( )。
A:驱动程序包含 Spark 应用程序中的主函数
B:驱动程序定义了分布式数据集以应用在集群中
C:每个 Spark 应用程序都包含一个驱动程序
D:驱动程序负责把并行操作发布到集群上
4.弹性分布式数据集RDD的特性包括( )。
A:弹性
B:分区
C:只读
D:依赖
5.在Spark 操作中,map(func)的作用是( )。
A:返回一个新的数据集,这个数据集中的元素是通过func函数筛选后返回为true的元素
B:对RDD中的数据按照func进行计算得到新的RDD
C:返回排序后的数据集
D:对元素为键值对的RDD中Key相同的元素的value进行reduce
6.在Spark 操作中,collect()的作用是( )。
A:将数据集中的每个元素传递到函数func中运行
B:通过函数func聚合数据集中的元素
C:返回数据集中的元素个数
D:以数组的形式返回数据集中的所有元素
7.从概念上而言,流数据(或数据流)是指( )。
A:数据采用集中式处理
B:在时间分布和数量上无限的一系列动态数据集合体
C:数据记录是流数据的最小组成单元
D:数据分时段批量到达
8.Spark Streaming最主要的抽象是离散化数据流,表示连续不断的数据流。( )
A:错 B:对 9.在Spark Streaming中,作为一个长期运行的task跑在一个Executor上,用于接收 DStream的组件是( )。
A:Receiver
B:Analyzer
C:Streaming
D:RDD
10.在Spark Streaming中,可以通过streamingContext.awaitTermination()方法来手动结束流计算进程。( )
A:对 B:错

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(147) dxwkbang
返回
顶部