1.在vi编辑器的命令模式下,要进入输入模式并在目前光标所在的下一行处输入新的一行,需要按下键盘上的( )。
A:i键 B:x键 C:r键 D:o键
答案:o键
2.结构化数据一般具有( )。
A:其余选项都不是 B:线性结构 C:空间结构 D:二维表结构
答案:二维表结构
3.下列数据中属于结构化数据的是( )。
A:HTML代码 B:网页文本 C:学生成绩记录表 D:Python代码
答案:学生成绩记录表
4.Spark的任务调度执行机制是以什么为基础的( )。
A:内存计算 B:DAG C:数据流 D:RDD
答案:DAG
5.下列数据中属于非结构化数据的是( )。
A:HTML代码 B:抖音视频 C:XML代码 D:学生成绩记录表
答案:抖音视频
6.在vi编辑器的命令模式下,要向后删除一个字符,需要按下键盘上的( )。
A:x键 B:i键 C:r键 D:o键
答案:x键
7.在Spark中,Spark Core的主要功能是( )。
A:用来操作结构化数据 B:对实时数据进行流式计算 C:高效地在一个计算节点到数千个计算节点之间伸缩计算 D:实现 Spark 的基本功能,包含任务调度、内存管理、错误恢复、与存储系统交互等
答案:实现 Spark 的基本功能,包含任务调度、内存管理、错误恢复、与存储系统交互等
8.下面不属于Flume中Agent的组成部分( )。
A:Channel B:Sink C:Event D:Source
答案:Event
9.下面哪项关于HBase 的常用命令的描述是正确的( )。
A:HBase要查看表可以使用list_namespace B:HBase全表扫描使用get命令 C:HBase使用scan命令时可以指定扫描区间 D:HBase一张正在使用的表可以直接使用drop命令删除
答案:HBase使用scan命令时可以指定扫描区间
10.Topic是什么( )。
A:是通信的基本单位 B:消费者 C:发布消息的过程 D:处理的消息源的不同分类
答案:处理的消息源的不同分类
11.MapReduce适用于( )。
A:任意应用程序 B:任意可在Windows Server 2008上的应用程序 C:可以并行处理的应用程序 D:可以串行处理的应用程序

12.Consumers中描述正确的为( )。
A:订阅 topic 并处理其发布的消息的过程 B:一个物理上的分组系统 C:发布一些消息 D:向 Kafka 的一个 topic 发布消息的过程 13.下面哪项关于MapReduce描述是错误的( )。
A:Map阶段负责汇总计算结果 B:MapReduce是Hadoop的一部分 C:MapReduce的核心思想是分而治之 D:Map阶段将任务拆分下去 14.linux系统中mv命令的作用是( )。
A:删除一个目录中的一个或多个文件 B:进入指定目录 C:将源文件复制至目标文件 D:移动文件或修改文件名 15.在大数据平台的基本架构中,数据存储层主要负责( )。
A:根据不同的用户需求对各种大数据处理和分析功能进行封装并对外提供服务 B:从各种不同的数据源采集数据 C:大数据的存储和管理工作 D:大数据的处理和分析工作 16.linux系统中rm命令的作用是( )。
A:移动文件或修改文件名 B:删除一个目录中的一个或多个文件或目录 C:将源文件复制至目标文件 D:进入指定目录 17.关于SecondaryNameNode 哪项是正确的( )。
A:SecondaryNameNode 应与 NameNode 部署到一个节点 B:它对内存不是没有要求 C:它的目的是帮助 NameNode 合并编辑日志,增加 NameNode 启动时间 D:它是 NameNode 的热备 18.Producers中描述正确的为( )。
A:消息和数据消费者 B:消息和数据生产者 C:订阅 topic 并处理其发布的消息 D:物理上的分组 19.下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是( )。
A:Map与Map之间不是相互独立的。 B:一个Map函数就是对一部分原始数据进行指定的操作。 C:一个Map操作就是对每个Reduce所产生的一部分中间结果进行合并操作。 D:Reducee与Reduce之间不是相互独立的。 20.在MapReduce中,下面哪个会将输入键值对处理成中间键值对( )。
A:Mapper和Reducer B:Mapper C:MRAppMaster D:Reducer 21.在Hadoop的计算过程中每次迭代的数据都是从哪里读取的( )。
A:CPU B:内存 C:磁盘 D:互联网 22.2TB数据等于多少MB( )。
A:2097152 B:2000048 C:2048000 D:2000000 23.在大数据平台的基本架构中,数据采集层主要负责( )。
A:大数据的处理和分析工作 B:根据不同的用户需求对各种大数据处理和分析功能进行封装并对外提供服务 C:从各种不同的数据源采集数据 D:大数据的存储和管理工作 24.下列描述中属于数据的是( )。
A:球赛结果 B:抖音视频 C:网页 D:天气情况记录 25.下列对元数据解释正确的是( )
A:NameNode内存中的数据 B:只有当NameNode正常停止时(非“意外情况下宕机”),才会将元数据写入到fsimage(除位置信息)。 C:在系统运行期间元数据保存在硬盘中 D:DataNode启动时上报的block位置信息 + fsimage + edits 26.下面关于Flume中Channel的说法正确的是( )。
A:Channel的类型包括Memory Channel和File Channel B:Channel允许Source和Sink运作在不同的速率上 C:Channel是位于Source和Sink之间的缓冲区 D:Channel可以同时处理多个Source和Sink 27.具体来看,流式数据处理一般包含下面的流程( )。
A:数据实时采集 B:数据实时存储 C:实时查询服务 D:数据实时计算 28.关于SecondaryNameNode的工作过程说法正确的是( )
A:NameNode在下次重启时会使用这个新的fsimage文件,从而减少重启的时间 B:定时到NameNode去获取 edit 文件和 fsimage。 C:将新的fsimage发送回NameNode。 D:读取下载的edits和fsimage,并根据edits修改fsimage,得到修改后的新的fsimage。 29.下面关于Flume中Event的说法正确的是( )。
A:Event是Flume的基本数据传输单元 B:Event的Header用来存放该Event的一些属性,为K-V结构 C:Event由Header和Body两部分组成 D:Event的Body用来存放该条数据,形式为字节数组 30.Python提交MapReduce任务时,可以使用的参数是( )。
A:-r hadoop B:-o 输出目录 C:-output 输出目录 D:-input 输入目录 31.HDFS中常用命令有下面哪些?( )
A:hadoop fs –put B:hadoop fs –rm C:hadoop fs –ls D:hadoop fs –mv 32.Hbase常用命令如下哪个是对的( )。
A:Select B:Get C:Asc D:Create 33.Kafka支持( )。
A:事务 B:负载均衡 C:动态扩展 D:集群 34.Hbase称为“列簇数据库”( )。
A:正确 B:错误 35.RDD 中可以对创建好的RDD 进行编辑改动。( )
A:错 B:对 36.Consumers:消息和数据生产者,向 Kafka 的一个 topic 发布消息的过程叫做 consumers( )。
A:错 B:对 37.一个 RDD 可以简单的理解为一个分布式的元素集合。( )
A:对 B:错 38.Sink是Flume中事件的源头,负责接收数据到Flume Agent,可以处理多种类型、多种格式的数据( )
A:错 B:对 39.非结构化数据是非纯文本类数据,没有标准结构格式,无法直接解析出相应的值( )。
A:对 B:错 40.MapReduce编程较为灵活( )。
A:对 B:错 41.Spark Streaming主要用于处理批处理的数据。( )
A:对 B:错 42.Python、Java都可以用于编写MapReduce( )。
A:对 B:错 43.dfs.blocksize是用于配置HDFS的block大小。( )
A:错 B:对 44.下面说法正确的是( )。
A:HBase表的一个列族只可以包含一个列 B:HBase一个RegionServer服务器中只有一个Region C:HBase的一个表中可以有多个列族 D:一个HBase集群中只能有一个RegionServer 45.下面说法错误的是( )。
A:HBase的Master节点宕机后仍然可以查询 B:HBase的Master节点宕机后不影响建表 C:Zookeeper记录了meta表存储在哪个RegionServer D:HBase可以自动对大表分片

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(1) dxwkbang
返回
顶部