第十二章单元测试
- 下列关于Spark使用场景描述正确的有( )。
- 下列关于Spark GraphX图计算描述正确的有( )。
- Spark运行架构包括( )。
- Spark可运行于独立的集群模式中,或者运行于Hadoop中,也可运行于Amazon EC2等云环境中,并且可以访问HDFS、Cassandra、HBase、Hive等多种数据源。( )
- Spark支持使用Scala、Java、Python和R语言进行编程。( )
- Spark运行在YARN上要比运行在Mesos上更加灵活和自然,Spark官方推荐采用这种模式。( )
- 在 RDD 的计算过程中,不需立刻去存储计算出的数据本身, 只要记录每个 RDD 是经过哪些转化操作得来的。( )
A:将数据缓存在内存中,中间的计算结果写入到磁盘的离线数据计算框架。
B:基于历史数据的交互式查询,时间在数十秒到数十分钟之间。
C:复杂的海量数据批量处理,时间在数十分钟到数小时之间。
D:基于实时数据流的数据处理,时间在数百毫秒到数秒之间。
答案:基于历史数据的交互式查询,时间在数十秒到数十分钟之间。
###复杂的海量数据批量处理,时间在数十分钟到数小时之间。
###基于实时数据流的数据处理,时间在数百毫秒到数秒之间。
A:将Spark SQL转换成RDD,然后提交到集群执行。
B:图并行计算任务是指那些迭代计算任务,如PageRank。
C:图上的计算任务分成图并行计算和数据并行计算两种。
D:数据并行计算任务是指图上代数运算,如构建一个图、合并两个图、跨越多个图等。
A:每个应用的任务控制节点(Driver)。
B:集群资源管理器(Cluster Manager)。
C:运行作业任务的工作节点(Worker Node)。
D:每个工作节点上负责具体任务的执行进程(Executor)。
A:对 B:错
A:错 B:对
A:错 B:对
A:对 B:错
温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!