第十章单元测试
  1. 常用大数据采集途径有( )。

  2. A:数据服务机构。
    B:智能感知设备。
    C:互联网数据采集。
    D:APP移动端数据采集。

    答案:数据服务机构。
    ###智能感知设备。
    ###互联网数据采集。
    ###APP移动端数据采集。

  3. 下列关于Flume架构描述正确的有( )。

  4. A:Source将数据封装到事件(event) 里,然后将事件推入Channel中。
    B:Source是数据的收集端,负责将数据捕获后进行特殊的格式化。
    C:Sink负责持久化日志或者把事件推向另一个Source。
    D:Channel是连接Source和Sink的组件,它将保存事件直到Sink处理完该事件。
  5. 下列关于数据迁移工具Sqoop描述正确的有( )。

  6. A:Sqoop工作机制是将导入或导出命令翻译成 MapReduce 程序来实现。
    B:Sqoop工具本质就是迁移数据。
    C:Sqoop工具只能用于非关系型数据库之间迁移。
    D:Sqoop 是一款用于在Hadoop和关系数据库服务器之间传输数据的工具。
  7. 下列关于Kafka描述正确的有( )。

  8. A:Kafka是一基于zookeeper协调的分布式日志系统。
    B:Kafka可以用于web/nginx日志、访问日志采集,也可用于消息服务等等。
    C:Kafka是一个分布式、分区的、多副本的、多订阅者日志系统。
    D:Kafka可以用于迁移数据。
  9. 各行业海量的数据中,大约20%左右属于结构化的数据,80%的数据属于广泛存在于社交网络、物联网、电子商务等领域的非结构化数据。( )

  10. A:对 B:错
  11. 大数据的处理流程的第一步就是大数据的采集与预处理。( )

  12. A:对 B:错
  13. 发布-订阅消息传递模式是将消息持久化到一个topic中。消费者可以订阅一个或多个topic,消费者可以消费该topic中所有的数据,同一条数据可以被多个消费者消费。( )

  14. A:错 B:对

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(2) dxwkbang
返回
顶部