linux系统中ls命令的作用是( )。 A:查看当前工作目录路径
B:查看 linux 文件夹包含的文件
C:改变文件或目录的访问权限
D:创建文件夹
答案:关注公众号【题涯答案】免费查看 Spark Streaming对实时输入数据流进行拆分的单位是( )。 A:时间
B:数据量
C:编号
D:计算量
答案:关注公众号【题涯答案】免费查看 下列关于HDFS常用命令错误的是( )。 A:下载文件 bin/hdfs dfs -get /2.txt 2.txt
B:复制文件 bin/hdfs dfs -cp /test/1.txt /new.txt
C:创建多级目录 bin/hdfs dfs -mkdir /test/a
D:上传文件 bin/hdfs dfs -put 1.txt /2.txt
答案:关注公众号【题涯答案】免费查看 Kafka集群描述正确的是( )。 A:消费者必须订阅所有topic
B:partition物理上由单个segment组成
C:集群中的每一个服务器都是一个代理
D:消费者只可以订阅一个topic
答案:关注公众号【题涯答案】免费查看 某个文件大小超过了单机容量的限制下列做法最合理的是( ) A:无法解决
B:加机器
C:换一台容量大的机器
D:将文件拆分为若干个数据块
答案:关注公众号【题涯答案】免费查看 HDFS中block默认会保存几份?( ) A:4
B:1
C:3
D:2
答案:关注公众号【题涯答案】免费查看 下面不属于Flume中Agent的组成部分( )。 A:Sink
B:Channel
C:Event
D:Source
答案:关注公众号【题涯答案】免费查看 下列数据中属于半结构化数据的是( )。 A:HTML代码
B:网页文本
C:学生成绩记录表
D:抖音视频
答案:关注公众号【题涯答案】免费查看 在Spark的运行架构中,执行器(executor)的主要功能是( )。 A:提供弹性分布式数据的操作
B:负责跨应用程序分配资源
C:负责把并行操作发布到集群上
D:用来执行计算和为应用程序存储数据
答案:关注公众号【题涯答案】免费查看 下面哪项关于HBase 的常用命令的描述是正确的( )。 A:HBase使用scan命令时可以指定扫描区间
B:HBase一张正在使用的表可以直接使用drop命令删除
C:HBase全表扫描使用get命令
D:HBase要查看表可以使用list_namespace
答案:关注公众号【题涯答案】免费查看 下面哪个是一种编程模型,它将大规模的数据处理工作拆分成互相独立的任务然后并行处理( ) A:HDFS
B:MapReduce
C:Kafka
D:Pig
答案:关注公众号【题涯答案】免费查看 Message的描述正确的为( )。 A:是通信的基本单位
B:是一个循环的队列消息
C:是一个无序的队列消息
D:是一个有序的队列消息
答案:关注公众号【题涯答案】免费查看 下列数据中属于结构化数据的是( )。 A:HTML代码
B:Python代码
C:网页文本
D:学生成绩记录表
答案:关注公众号【题涯答案】免费查看 以下说法有误的是( )。 A:传统单机存储方式扩容成本比较高
B:分布式存储系统可以实现数据容灾
C:分布式存储系统无需考虑数据的分块问题
D:“元数据”中不包含真正的文件数据
答案:关注公众号【题涯答案】免费查看 在大数据平台的基本架构中,服务封装层主要负责( )。 A:根据不同的用户需求对各种大数据处理和分析功能进行封装并对外提供服务
B:大数据的处理和分析工作
C:大数据的存储和管理工作
D:从各种不同的数据源采集数据
答案:关注公众号【题涯答案】免费查看 在Spark操作中,parallelize()的作用是( )。 A:获取文件中的行集合
B:提供弹性分布式数据的操作
C:获取文件集合
D:从内存数据中创建RDD
答案:关注公众号【题涯答案】免费查看 在Hadoop的计算过程中每次迭代的数据都是从哪里读取的( )。 A:磁盘
B:CPU
C:内存
D:互联网
答案:关注公众号【题涯答案】免费查看 HBASE支持( )。 A:Join
B:Sql
C:关系型数据
D:简单的事务
答案:关注公众号【题涯答案】免费查看 在MapReduce中,下面哪个会将输入键值对处理成中间键值对( )。 A:Mapper
B:MRAppMaster
C:Mapper和Reducer
D:Reducer
答案:关注公众号【题涯答案】免费查看 大数据至少为以下哪种存储量级?( ) A:ZB
B:TB
C:EB
D:PB
答案:关注公众号【题涯答案】免费查看

EB、TB、GB、MB之间的换算关系是( )。

A:100倍
B:1024倍
C:1000倍
D:其余选项都不是
答案:关注公众号【题涯答案】免费查看 Kafka开发语言( )。 A:C++
B:Python
C:Scala
D:Java
答案:关注公众号【题涯答案】免费查看 一个gzip文件大小75MB,集群设置Block大小为64MB,请问其占用几个Block?( ) A:1
B:4
C:3
D:2
答案:关注公众号【题涯答案】免费查看 下列数据中属于非结构化数据的是( )。 A:XML代码
B:学生成绩记录表
C:HTML代码
D:抖音视频
答案:关注公众号【题涯答案】免费查看 在Spark中,集群管理器的主要功能是( )。 A:用来操作结构化数据
B:对实时数据进行流式计算
C:高效地在一个计算节点到数千个计算节点之间伸缩计算
D:实现 Spark 的基本功能,包含任务调度、内存管理、错误恢复、与存储系统交互等
答案:关注公众号【题涯答案】免费查看 Kafka支持( )。 A:集群
B:动态扩展
C:负载均衡
D:事务
答案:关注公众号【题涯答案】免费查看 电商个性化推荐系统主要流程包括( )。 A:使用实时计算平台或离线计算平台通过多种算法进行数据分析与挖掘,得到用户画像和所购买商品的画像
B:通过多种可视化平台展示出去
C:使用多种算法引擎进行汇总、对比、计算等若干操作,最终形成对用户购买商品的个性化推荐信息
D:从多方面收集用户购物信息数据,将各类数据进行分布式存储
答案:关注公众号【题涯答案】免费查看 关于NameNode下列说法正确的是( )。 A:客户端每次读写请求,它都会从磁盘中读取或者写入元数据信息并反馈客户端
B:NameNode 负责管理元数据
C:如果 NameNode 意外终止,SecondaryNameNode 会接替它使集群继续工作每个数据块的内容
D:元数据内容包含文件与数据块的映射表
答案:关注公众号【题涯答案】免费查看 下列描述中属于数据的是( )。 A:抖音视频
B:天气情况记录
C:球赛结果
D:网页
答案:关注公众号【题涯答案】免费查看 下面关于Flume中Source的说法正确的是( )。 A:Source可以处理多种类型、多种格式的数据
B:Source是事件源头
C:Source负责接收数据到Flume Agent
D:Source只能从网络接收数据
答案:关注公众号【题涯答案】免费查看 Hbase基本架构包含( )。 A:Hive
B:HMaster
C:RegionServer
D:hbase shell
答案:关注公众号【题涯答案】免费查看 数据管理技术包括对数据进行( )。 A:索引
B:编码
C:存储
D:分类
答案:关注公众号【题涯答案】免费查看 消息队列的优势( )。 A:有助于控制和优化数据流经过系统的速度
B:允许独立的扩展或修改两边的处理过程,只要确保它们遵守同样的接口约束
C:无法解决生产消息和消费消息的处理速度不一致的情况
D:系统的一部分组件失效时,不会影响到整个系统。
答案:关注公众号【题涯答案】免费查看 具体来看,流式数据处理一般包含下面的流程( )。 A:数据实时存储
B:数据实时采集
C:数据实时计算
D:实时查询服务
答案:关注公众号【题涯答案】免费查看 下面哪一项是MapReduce编程需要考虑的问题( )。 A:数据输出
B:数据输入
C:Map阶段处理逻辑
D:Reduce阶段处理逻辑
答案:关注公众号【题涯答案】免费查看 HDFS中的NameNode节点用于存放元数据,元数据内容包含文件与数据块的映射表和每个数据块的内容( ) A:错 B:对 答案:关注公众号【题涯答案】免费查看 Hadoop 2.x中HDFS默认的block的大小为128M。( ) A:对 B:错 答案:关注公众号【题涯答案】免费查看 Sink是Flume中事件的源头,负责接收数据到Flume Agent,可以处理多种类型、多种格式的数据( ) A:错 B:对 答案:关注公众号【题涯答案】免费查看 MapReduce的核心思想是分而治之( )。 A:对 B:错 答案:关注公众号【题涯答案】免费查看 Spark Streaming主要用于处理批处理的数据。( ) A:对 B:错 答案:关注公众号【题涯答案】免费查看 在Spark Streaming中,可以通过streamingContext.start()来开始接收数据和处理流程。( ) A:错 B:对 答案:关注公众号【题涯答案】免费查看 RDD 中可以对创建好的RDD 进行编辑改动。( ) A:对 B:错 答案:关注公众号【题涯答案】免费查看 dfs.blocksize是用于配置HDFS的block大小。( ) A:对 B:错 答案:关注公众号【题涯答案】免费查看 Producers,消息和数据生产者,向 Kafka 的一个 topic 发布消息的过程叫做 producers( )。 A:对 B:错 答案:关注公众号【题涯答案】免费查看 Channel是位于Source和Sink之间的缓冲区,可以同时处理多个Source和Sink( ) A:错 B:对 答案:关注公众号【题涯答案】免费查看

点赞(0) dxwkbang
返回
顶部