第十章单元测试
- 常用大数据采集途径有( )。
- 下列关于Flume架构描述正确的有( )。
- 下列关于数据迁移工具Sqoop描述正确的有( )。
- 下列关于Kafka描述正确的有( )。
- 各行业海量的数据中,大约20%左右属于结构化的数据,80%的数据属于广泛存在于社交网络、物联网、电子商务等领域的非结构化数据。( )
- 大数据的处理流程的第一步就是大数据的采集与预处理。( )
- 发布-订阅消息传递模式是将消息持久化到一个topic中。消费者可以订阅一个或多个topic,消费者可以消费该topic中所有的数据,同一条数据可以被多个消费者消费。( )
A:数据服务机构。
B:智能感知设备。
C:互联网数据采集。
D:APP移动端数据采集。
答案:数据服务机构。
###智能感知设备。
###互联网数据采集。
###APP移动端数据采集。
A:Source将数据封装到事件(event) 里,然后将事件推入Channel中。
B:Source是数据的收集端,负责将数据捕获后进行特殊的格式化。
C:Sink负责持久化日志或者把事件推向另一个Source。
D:Channel是连接Source和Sink的组件,它将保存事件直到Sink处理完该事件。
A:Sqoop工作机制是将导入或导出命令翻译成 MapReduce 程序来实现。
B:Sqoop工具本质就是迁移数据。
C:Sqoop工具只能用于非关系型数据库之间迁移。
D:Sqoop 是一款用于在Hadoop和关系数据库服务器之间传输数据的工具。
A:Kafka是一基于zookeeper协调的分布式日志系统。
B:Kafka可以用于web/nginx日志、访问日志采集,也可用于消息服务等等。
C:Kafka是一个分布式、分区的、多副本的、多订阅者日志系统。
D:Kafka可以用于迁移数据。
A:对 B:错
A:对 B:错
A:错 B:对
温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!