第六章测试
1.Spark框架的特色包括( )。
A:运行速度快 B:通用性 C:运行模式多样 D:容易使用
答案:ABCD
2.Spark 支持的集群管理器包括( )。
A:Standalone B:SparkCore C:Apache Mesos D:Hadoop YARN 3.下面关于Spark 驱动程序 driver program的说法,正确的是( )。
A:驱动程序负责把并行操作发布到集群上 B:驱动程序定义了分布式数据集以应用在集群中 C:驱动程序包含 Spark 应用程序中的主函数 D:每个 Spark 应用程序都包含一个驱动程序 4.弹性分布式数据集RDD的特性包括( )。
A:弹性 B:只读 C:分区 D:依赖 5.在Spark 操作中,map(func)的作用是( )。
A:返回排序后的数据集 B:返回一个新的数据集,这个数据集中的元素是通过func函数筛选后返回为true的元素 C:对RDD中的数据按照func进行计算得到新的RDD D:对元素为键值对的RDD中Key相同的元素的value进行reduce 6.在Spark 操作中,collect()的作用是( )。
A:将数据集中的每个元素传递到函数func中运行 B:通过函数func聚合数据集中的元素 C:返回数据集中的元素个数 D:以数组的形式返回数据集中的所有元素 7.从概念上而言,流数据(或数据流)是指( )。
A:在时间分布和数量上无限的一系列动态数据集合体 B:数据分时段批量到达 C:数据采用集中式处理 D:数据记录是流数据的最小组成单元 8.Spark Streaming最主要的抽象是离散化数据流,表示连续不断的数据流。( )
A:错 B:对 9.在Spark Streaming中,作为一个长期运行的task跑在一个Executor上,用于接收 DStream的组件是( )。
A:Analyzer B:RDD C:Receiver D:Streaming 10.在Spark Streaming中,可以通过streamingContext.awaitTermination()方法来手动结束流计算进程。( )
A:错 B:对

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(6) dxwkbang
返回
顶部