1.字节跳动对 YARN 的定制主要实现( )。
A:异地多活,全球统一的 YARN UI 界面。 B:物理资源分配率提升和使用率提升。 C:多种负载场景优化。 D:稳定性提升。
答案:物理资源分配率提升和使用率提升。; 多种负载场景优化。; 稳定性提升。; 异地多活,全球统一的 YARN UI 界面。
2.关于Spark的RDD描述正确的有( )。
A:是 Spark 底层的分布式存储的数据结构,是 Spark 的核心。 B:RDD 是一种可读写的数据块。 C:RDD(Resilent Distributed Datasets) 是弹性分布式数据集简称。 D:Spark API 的所有操作都是基于 RDD 的。
答案:RDD(Resilent Distributed Datasets) 是弹性分布式数据集简称###是 Spark 底层的分布式存储的数据结构,是 Spark 的核心###Spark API 的所有操作都是基于 RDD 的
3.Hbase基本架构中RegionServer容错实现是( )。
A:如果一段时间内未出现心跳,Master将该RegionServer上的Region重新分配到其他RegionServer上。 B:RegionServer定时向Zookeeper汇报心跳。 C:失效RegionServer上“预写” 日志由主服务器进行分割并派送给新的RegionServer。 D:Hbase基本架构中一般配置3个 或5个Zookeeper实例。
答案:Master
4.下列关于Mesos与Yarn区别描述正确是( )。
A:Mesos中的Mesos Slave和Framework Executor 对应YARN中的Node Manager 主要实现单个节点的资源管理、任务启动。 B:Mesos实现语言是C++,YARN实现语言是Java。 C:Mesos中的Mesos Master实现对整个集群资源管理和调度。 D:YARN 中的Resource Manager 实现对整个集群资源管理和调度。
答案:Mesos实现语言是C++,YARN实现语言是Java###Mesos中的Mesos Master实现对整个集群资源管理和调度###YARN 中的Resource Manager 实现对整个集群资源管理和调度###Mesos中的Mesos Slave和Framework Executor 对应YARN中的Node Manager 主要实现单个节点的资源管理、任务启动
5.基于Hadoop架构设计一数据库产品Hbase原因有( )。
A:传统的通用关系型数据库无法应对在数据规模剧增时导致的系统扩展性和性能问题。 B:Hadoop无法满足大规模数据实时处理应用的需求。 C:传统关系数据库在数据结构变化时一般需要停机维护,空列浪费存储空间。 D:HDFS面向批量访问模式,不是随机访问模式。
答案:Hadoop
6.存储云与传统存储平台区别有哪些( )。
A:系统管理简单 B:按实际用量计费,降低存储成本 C:弹性扩展存储空间 D:快速为用户部署存储空间
答案:快速为用户部署存储空间; 按实际用量计费,降低存储成本; 弹性扩展存储空间; 系统管理简单
7.关于Hbase基本架构描述正确的是( )。
A:Zookeeper作为分布式的协调。RegionServer也会把自己的信息写到ZooKeeper中。 B:Master知道全局 RegionServer运行情况,可以控制RegionServer的故障转移和Region的切分。 C:无Master过程中, 数据读取、region切分、 负载均衡无法照常进行。 D:RegionServer是数据节点,用来存储数据,实时的向Master报告信息。
答案:RegionServer是数据节点,用来存储数据,实时的向Master报告信息。; Master知道全局 RegionServer运行情况,可以控制RegionServer的故障转移和Region的切分。; Zookeeper作为分布式的协调。RegionServer也会把自己的信息写到ZooKeeper中。
8.下列关于HDFS架构中Client功能描述正确的有( )。
A:定期合并fsimage和fsedits,推送给NameNode B:与NameNode交互,获取文件位置信息。 C:与DataNode交互,读取或者写入数据。 D:完成文件切分,管理HDFS
答案:与NameNode交互,获取文件位置信息###与DataNode交互,读取或者写入数据###完成文件切分,管理HDFS
9.Storm 的主要组件包括( )。
A:Spouts和Streams。 B:Bolts。 C:Topology。 D:Stream Groupings。
答案:Spouts和Streams。; Bolts。; Topology。; Stream Groupings。
10.下列关于Message Queue功能描述正确的是( )。
A:削峰填谷。 B:转换数据格式。 C:程序间解耦。 D:迁移数据。
答案:削峰填谷###程序间解耦
11.NAS的典型应用场景有哪些( )。
A:对带宽要求较高的数据读写 B:内部文件共享 C:文件级数据整合 D:海量非结构化数据

12.Hbase基本架构中Master主要功能包括( )。
A:发现失效的Region server并重新分配其上的region。 B:为Region server分配region。 C:管理用户对table的增删改查操作据。 D:负责Region server的负载均衡。 13.下列关于Spark Streaming描述正确的有( )。
A:处理后的结果只能存储成HDFS文件。 B:是构建在Spark RDD之上的一款流处理工具。 C:是Spark核心(Spark Core)API的一个扩展。 D:可以实现高吞吐量的,具备容错机制的实时流数据处理。 14.Hbase基本架构中Zookeeper作为分布式协调,主要功能包括( )。
A:存储所有Region的寻址入口。 B:保证任何时候, 集群中只有一个master。 C:实时监控Region server的上线和下线信息,并实时通知给Master。 D:存储HBase的schema和table元数据。 15.下列关于YARN框架描述正确的有( )。
A:NodeManager 是每个节点上的资源和任务管理器。 B:ApplicationMaster负责与 RM 调度器协商以获取资源。 C:ResourceManager 负责整个集群的资源管理和分配。 D:NodeManager定时向 ResourceManager 汇报本节点资源的使用情况和Container 的运行状态。 16.I/O设备虚拟化模式包括( )。
A:I/O半虚拟化 B:内存储器虚拟化 C:I/O直通虚拟化 D:I/O全虚拟化 17.关于数据的潜在价值,说法正确的是( )。
A:判断数据的价值需要考虑到未来它可能被使用的各种方式,而非仅仅考虑其目前的用途。 B:在基本用途完成后,数据的价值仍然存在,只是处于休眠状态。 C:数据的价值是其所有可能用途的总和。 D:数据的真实价值就像漂浮在海洋中的冰山,第一眼看到的只是冰山一角,绝大部分隐藏在表面之下。 18.下列关于Spark计算框架描述正确的有( )。
A:类似Hadoop MapReduce的通用并行框架,是基于内存计算的大数据并行计算框架。 B:可用于构建大型的、低延迟的数据分析应用程序。 C:Spark 运算比 Hadoop 的 MapReduce 框架慢。 D:由加州大学伯克利分校 AMP 实验室 (Algorithms, Machines, and People Lab) 开发。 19.Hbase数据模型中物理视图描述正确的是( )。
A:Region按大小分割的,当增大到一个阀值的时候,region就会等分为两个新的region。 B:Table 在行的方向上分割为多个Region。 C:Table中的所有行都按照row key的字典序排列。 D:Region是HBase中分布式存储和负载均衡的最小单元。 20.PaaS 实质是将互联网资源服务化为可编程接口。( )
A:错 B:对 21.MLlib提供的API主要分为spark.mllib和spark.ml两大类。( )
A:对 B:错 22.百度网盘、有道云笔记、阿里云服务器、微软Azure等都是云计算服务。( )
A:错误 B:正确 23.Spark集群资源管理器可以是Spark自带的资源管理器,也可以是YARN或Mesos等资源管理框架。( )
A:正确 B:错误 24.Hive外部表(external table)删除后, HDFS上的文件包括表元数据和数据都删掉。( )
A:对 B:错 25.多Sink Agent或多路复用流架构,可在agent中将混杂的日志流分开,然后给每种日志建立一个自己的传输通道。( )
A:正确 B:错误 26.虚拟机要运行在虚拟机软件(虚拟机监控器)里,而虚拟机软件运行在物理机上。( )
A:错 B:对 27.虚拟化技术是云计算发展的一个重要技术推力。( )
A:错误 B:正确 28.全虚拟化同时能够支持多个不同的操作系统。( )
A:对 B:错 29.Apache Hadoop是一种专用于流处理的处理框架,新版Hadoop包含多个组件(HDFS、YARN、MapReduce)。( )
A:错误 B:正确 30.下列不属于Active Namenode节点功能的是( )。
A:执行数据块读/写 B:处理客户端读写请求 C:管理HDFS的名称空间 D:管理数据块映射信息 31.Amazon.com公司通过( )计算云,可以让用户通过Web Service 方式租用计算机来运行自己的计算机应用程序。
A:EC2 B:GFS C:HDFS D:S3 32.云计算的服务模式不包括( )。
A:软件即服务 B:平台即服务 C:系统即服务 D:基础设施即服务 33.下列属于Hadoop2.0和Hadoop3.0区别的是( )。
A:Hadoop3.0新增了YARN框架 B:Hadoop3.0新增了HDFS HA机制 C:Hadoop3.0支持多于2个以上的NameNode D:Hadoop3.0新增了HDFS federation 34.大数据的核心就是( )。
A:规模化 B:预测 C:匿名化 D:告知与许可 35.下列不属于Strom特性的是( )。
A:容错性好、语言无关性 B:是一个通用资源管理系统和调度平台。 C:适用场景广泛,可伸缩性高。 D:保证无数据丢失、异常健壮 36.在大数据时代,下列说法正确的是。( )
A:对数据的分析技术和技能是最重要的 B:数据非常重要,一定要很好的保护起来,防止泄露 C:数据是最核心的部分 D:收集数据比较简单 37.2008年10月微软推出的云计算操作系统是( )。
A:Azure B:蓝云 C:EC2 D:Google App Engine 38.速率最大的协议是( )协议。
A:SATA协议 B:SCSI协议 C:FC协议 D:iSCSI协议 39.下列关于Message Queue定义正确的是( )。
A:是基于内存计算的大数据并行计算框架。 B:是一款用于在Hadoop和关系数据库服务器之间传输数据的工具。 C:是一种消息队列服务中间件,提供一套完整的信息生产、传递、消费的软件系统。 D:提供对数据进行简单处理,并写到各种数据接受方的能力。

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(1) dxwkbang
返回
顶部