第十二章单元测试
  1. 下列关于Spark使用场景描述正确的有( )。

  2. A:将数据缓存在内存中,中间的计算结果写入到磁盘的离线数据计算框架。
    B:基于历史数据的交互式查询,时间在数十秒到数十分钟之间。
    C:复杂的海量数据批量处理,时间在数十分钟到数小时之间。
    D:基于实时数据流的数据处理,时间在数百毫秒到数秒之间。

    答案:基于历史数据的交互式查询,时间在数十秒到数十分钟之间。
    ###复杂的海量数据批量处理,时间在数十分钟到数小时之间。
    ###基于实时数据流的数据处理,时间在数百毫秒到数秒之间。

  3. 下列关于Spark GraphX图计算描述正确的有( )。

  4. A:将Spark SQL转换成RDD,然后提交到集群执行。
    B:图并行计算任务是指那些迭代计算任务,如PageRank。
    C:图上的计算任务分成图并行计算和数据并行计算两种。
    D:数据并行计算任务是指图上代数运算,如构建一个图、合并两个图、跨越多个图等。
  5. Spark运行架构包括( )。

  6. A:每个应用的任务控制节点(Driver)。
    B:集群资源管理器(Cluster Manager)。
    C:运行作业任务的工作节点(Worker Node)。
    D:每个工作节点上负责具体任务的执行进程(Executor)。
  7. Spark可运行于独立的集群模式中,或者运行于Hadoop中,也可运行于Amazon EC2等云环境中,并且可以访问HDFS、Cassandra、HBase、Hive等多种数据源。( )

  8. A:对 B:错
  9. Spark支持使用Scala、Java、Python和R语言进行编程。( )

  10. A:错 B:对
  11. Spark运行在YARN上要比运行在Mesos上更加灵活和自然,Spark官方推荐采用这种模式。( )

  12. A:错 B:对
  13. 在 RDD 的计算过程中,不需立刻去存储计算出的数据本身, 只要记录每个 RDD 是经过哪些转化操作得来的。( )

  14. A:对 B:错

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(2) dxwkbang
返回
顶部