提示:内容已经过期谨慎付费,点击上方查看最新答案

云计算与大数据技术

  1. PaaS 实质是将互联网资源服务化为可编程接口。( )

  2. A:错 B:对
    答案:对
  3. MLlib提供的API主要分为spark.mllib和spark.ml两大类。( )

  4. A:对 B:错
    答案:对
  5. 百度网盘、有道云笔记、阿里云服务器、微软Azure等都是云计算服务。( )

  6. A:错 B:对
    AI参考:答案是B:对。根据问题描述,百度网盘、有道云笔记、阿里云服务器、微软Azure都是提供云计算服务的平台或服务。因此,答案是B,即“对”。'
  7. Spark集群资源管理器可以是Spark自带的资源管理器,也可以是YARN或Mesos等资源管理框架。( )

  8. A:对 B:错
    答案:对
  9. Hive外部表(external table)删除后, HDFS上的文件包括表元数据和数据都删掉。( )

  10. A:对 B:错
    答案:错
  11. 多Sink Agent或多路复用流架构,可在agent中将混杂的日志流分开,然后给每种日志建立一个自己的传输通道。( )

  12. A:对 B:错
    AI参考:答案是A:对。多Sink Agent或多路复用流架构可以将混杂的日志流分开,然后给每种日志建立一个自己的传输通道。这种架构允许对不同类型的日志流进行独立处理,提高了日志处理的效率和准确性。因此,这个说法是正确的。'
  13. 虚拟机要运行在虚拟机软件(虚拟机监控器)里,而虚拟机软件运行在物理机上。( )

  14. A:错 B:对
    答案:对
  15. 虚拟化技术是云计算发展的一个重要技术推力。( )

  16. A:错 B:对

  17. 全虚拟化同时能够支持多个不同的操作系统。( )

  18. A:对 B:错

  19. Apache Hadoop是一种专用于流处理的处理框架,新版Hadoop包含多个组件(HDFS、YARN、MapReduce)。( )

  20. A:错 B:对
    AI参考:对新版Hadoop有所了解的朋友应该知道,新版Hadoop是支持多种数据处理范式的,包括批处理、流处理等,其中包含的组件有HDFS、YARN、MapReduce,因此这个说法是正确的。所以,正确选项是B:对。'
  21. 下列不属于Active Namenode节点功能的是( )。

  22. A:执行数据块读/写 B:处理客户端读写请求 C:管理HDFS的名称空间 D:管理数据块映射信息
    AI参考:正确选项是【A:执行数据块读/写】。在Hadoop中,Active NameNode节点主要负责处理客户端的读写请求、管理HDFS的名称空间、管理数据块映射信息等,但不执行数据块读/写操作。因此,不属于Active Namenode节点功能的是选项A。'
  23. Amazon.com公司通过( )计算云,可以让用户通过Web Service 方式租用计算机来运行自己的计算机应用程序。

  24. A:EC2 B:GFS C:HDFS D:S3

  25. 云计算的服务模式不包括( )。

  26. A:软件即服务 B:平台即服务 C:系统即服务 D:基础设施即服务

  27. 下列属于Hadoop2.0和Hadoop3.0区别的是( )。

  28. A:Hadoop3.0新增了YARN框架 B:Hadoop3.0新增了HDFS HA机制 C:Hadoop3.0支持多于2个以上的NameNode D:Hadoop3.0新增了HDFS federation

  29. 大数据的核心就是( )。

  30. A:规模化 B:预测 C:匿名化 D:告知与许可
    AI参考:正确答案是A:规模化。大数据的核心就是规模化,规模化是大数据技术体系建立、运行和发展的基础。B、C、D选项虽然也是大数据的重要方面,但都不是大数据的核心。'
  31. 下列不属于Strom特性的是( )。

  32. A:容错性好、语言无关性 B:是一个通用资源管理系统和调度平台。 C:适用场景广泛,可伸缩性高。 D:保证无数据丢失、异常健壮
    AI参考:答案:B推理过程:Strom特性主要包括容错性好、语言无关性、适用场景广泛,可伸缩性高,保证无数据丢失、异常健壮。其中A、C、D项都属于Strom特性,而B项“是一个通用资源管理系统和调度平台”属于Kubernetes的特性。故本题选B。'
  33. 在大数据时代,下列说法正确的是。( )

  34. A:对数据的分析技术和技能是最重要的 B:数据非常重要,一定要很好的保护起来,防止泄露 C:数据是最核心的部分 D:收集数据比较简单

  35. 2008年10月微软推出的云计算操作系统是( )。

  36. A:Azure B:蓝云 C:EC2 D:Google App Engine

  37. 速率最大的协议是( )协议。

  38. A:SATA协议 B:SCSI协议 C:FC协议 D:iSCSI协议
    AI参考:正确选项是【D:iSCSI协议】。iSCSI协议是一种基于TCP/IP协议的网络存储协议,通过在TCP上封装SCSI协议,实现数据的远程共享。iSCSI协议利用SCSI命令集进行数据传输,这使得iSCSI协议具有较高的传输效率,因此速率最大。其他选项中,SATA协议、SCSI协议和FC协议都是传统的存储协议,相比之下,iSCSI协议更适合用于远程存储和网络存储。'
  39. 下列关于Message Queue定义正确的是( )。

  40. A:是基于内存计算的大数据并行计算框架。 B:是一款用于在Hadoop和关系数据库服务器之间传输数据的工具。 C:是一种消息队列服务中间件,提供一套完整的信息生产、传递、消费的软件系统。 D:提供对数据进行简单处理,并写到各种数据接受方的能力。
    AI参考:正确选项是C:是一种消息队列服务中间件,提供一套完整的信息生产、传递、消费的软件系统。Message Queue是一种消息队列服务中间件,提供一套完整的信息生产、传递、消费的软件系统。它不是基于内存计算的大数据并行计算框架,也不是用于在Hadoop和关系数据库服务器之间传输数据的工具,更不是提供对数据进行简单处理并写到各种数据接受方的能力。'
  41. 字节跳动对 YARN 的定制主要实现( )。

  42. A:异地多活,全球统一的 YARN UI 界面。 B:物理资源分配率提升和使用率提升。 C:多种负载场景优化。 D:稳定性提升。

  43. 关于Spark的RDD描述正确的有( )。

  44. A:是 Spark 底层的分布式存储的数据结构,是 Spark 的核心。 B:RDD 是一种可读写的数据块。 C:RDD(Resilent Distributed Datasets) 是弹性分布式数据集简称。 D:Spark API 的所有操作都是基于 RDD 的。

  45. Hbase基本架构中RegionServer容错实现是( )。

  46. A:如果一段时间内未出现心跳,Master将该RegionServer上的Region重新分配到其他RegionServer上。 B:RegionServer定时向Zookeeper汇报心跳。 C:失效RegionServer上“预写” 日志由主服务器进行分割并派送给新的RegionServer。 D:Hbase基本架构中一般配置3个 或5个Zookeeper实例。
    AI参考:正确选项是【ABCD】 HBase的基本架构中,RegionServer容错实现如下: 1. RegionServer定时向Zookeeper汇报心跳,如果一段时间内未出现心跳,Master将该RegionServer上的Region重新分配到其他RegionServer上(选项A正确)。 2. 如果失效的RegionServer上还有正在处理的请求,这些请求会被转移到其他健康的RegionServer上(选项C正确)。 3. HBase使用Zookeeper进行集群管理,包括Region的分配和协调等。因此,Hbase基本架构中一般配置3个或5个Zookeeper实例(选项D正确)。 4. Zookeeper还负责“预写”日志,当失效的RegionServer上的日志被主服务器分割并派送给新的RegionServer(选项C正确)。 因此,ABCD都是正确的选项。"
  47. 下列关于Mesos与Yarn区别描述正确是( )。

  48. A:Mesos中的Mesos Slave和Framework Executor 对应YARN中的Node Manager 主要实现单个节点的资源管理、任务启动。 B:Mesos实现语言是C++,YARN实现语言是Java。 C:Mesos中的Mesos Master实现对整个集群资源管理和调度。 D:YARN 中的Resource Manager 实现对整个集群资源管理和调度。
    AI参考:下列关于Mesos与Yarn区别描述正确的有: A. Mesos中的Mesos Slave和Framework Executor 对应YARN中的Node Manager 主要实现单个节点的资源管理、任务启动。这个描述是正确的。在Mesos中,Mesos Slave是负责管理本地资源的,而Framework Executor是负责启动和监控框架任务的。在YARN中,Node Manager负责管理和监控单个节点的资源,并且启动和监控任务。 C. Mesos中的Mesos Master实现对整个集群资源管理和调度。这个描述也是正确的。Mesos Master是Mesos集群的中心节点,负责管理和协调整个集群的资源。 D. YARN 中的Resource Manager 实现对整个集群资源管理和调度。尽管YARN是一个分布式管理系统,但是它并没有一个专门的Resource Manager。在YARN中,ResourceManager是集群级别的一部分,用于协调和管理集群资源,但它不是唯一的资源管理实体。 所以,综上所述,答案是ACD。B选项的描述并不准确,因为YARN并不使用C++语言实现。"
  49. 基于Hadoop架构设计一数据库产品Hbase原因有( )。

  50. A:传统的通用关系型数据库无法应对在数据规模剧增时导致的系统扩展性和性能问题。 B:Hadoop无法满足大规模数据实时处理应用的需求。 C:传统关系数据库在数据结构变化时一般需要停机维护,空列浪费存储空间。 D:HDFS面向批量访问模式,不是随机访问模式。
    AI参考:基于Hadoop架构设计一数据库产品Hbase原因有( )。 选项A、C、D都是正确的原因。 具体来说: A选项:传统的通用关系型数据库在面对数据规模剧增时,由于其架构设计的问题,无法应对系统扩展性和性能问题。而HBase基于Hadoop架构,具有很好的扩展性和性能,能够应对数据规模剧增的问题。 C选项:传统关系数据库在数据结构变化时,通常需要停机维护,这会影响到业务运行。而HBase是基于列存储的,数据结构变化时,只需要对变化的部分进行修改,不会影响到其他部分,从而避免了停机维护。 D选项:HDFS(Hadoop分布式文件系统)是Hadoop架构中的一部分,它面向批量访问模式,不是随机访问模式。而HBase利用HDFS作为其基础存储设施,可以充分利用HDFS的批量访问模式,提高数据访问效率。 因此,基于以上原因,HBase被设计出来以应对传统关系数据库在面对数据规模剧增、数据结构变化、以及数据访问模式等问题时的不足。 至于B选项,Hadoop本身是可以满足大规模数据实时处理应用的需求的,但这并不是设计HBase的原因。"
  51. 存储云与传统存储平台区别有哪些( )。

  52. A:系统管理简单 B:按实际用量计费,降低存储成本 C:弹性扩展存储空间 D:快速为用户部署存储空间

  53. 关于Hbase基本架构描述正确的是( )。

  54. A:Zookeeper作为分布式的协调。RegionServer也会把自己的信息写到ZooKeeper中。 B:Master知道全局 RegionServer运行情况,可以控制RegionServer的故障转移和Region的切分。 C:无Master过程中, 数据读取、region切分、 负载均衡无法照常进行。 D:RegionServer是数据节点,用来存储数据,实时的向Master报告信息。
    AI参考:正确选项是【ABD】。 HBase的基本架构包括以下几个部分: 1. RegionServer:数据节点,存储数据,负责数据的读取和写入。RegionServer会定期向Master报告其状态和运行情况。 2. Zookeeper:分布式协调服务,用于维护HBase集群的元数据,包括RegionServer的注册、心跳检测、集群状态的同步等。RegionServer也会将自己的信息写到ZooKeeper中,以便Master可以实时了解集群的运行状态。 3. Master:HBase的唯一Master节点,负责管理所有的RegionServer,进行Region的分配、维护和分裂,以及处理客户端的请求。Master知道全局RegionServer运行情况,可以控制RegionServer的故障转移和Region的切分。 因此,选项A和B是正确的。选项C错误,因为HBase采用了Masterless架构,即没有专门的Master节点,数据读取、region切分、负载均衡等都可以正常进行。选项D也是正确的,因为RegionServer是数据节点,负责数据的存储和读取,同时实时的向Master报告信息。"
  55. 下列关于HDFS架构中Client功能描述正确的有( )。

  56. A:定期合并fsimage和fsedits,推送给NameNode B:与NameNode交互,获取文件位置信息。 C:与DataNode交互,读取或者写入数据。 D:完成文件切分,管理HDFS
    AI参考:关于HDFS架构中Client功能描述正确的有: B: 与NameNode交互,获取文件位置信息。 C: 与DataNode交互,读取或者写入数据。 分析: A选项是NameNode的功能,不是Client的功能;D选项是NameNode的功能,不是Client的功能。因此,这两个选项不正确。因此,正确答案是B和C。"
  57. Storm 的主要组件包括( )。

  58. A:Spouts和Streams。 B:Bolts。 C:Topology。 D:Stream Groupings。

  59. 下列关于Message Queue功能描述正确的是( )。

  60. A:削峰填谷。 B:转换数据格式。 C:程序间解耦。 D:迁移数据。
    AI参考:关于Message Queue的功能描述,正确的是: * 削峰填谷 * 程序间解耦 Message Queue的主要功能是用于进程间或线程间的通信,它允许一个进程或线程向另一个进程发送消息,而无需知道目标进程的细节。这种方式可以帮助降低系统负载,通过削峰填谷的方式处理突发的高峰流量,同时也可以实现程序间的解耦,提高系统的可维护性和可扩展性。关于转换数据格式和迁移数据,虽然也是Message Queue的一部分功能,但并不是其最主要的功能。"
  61. NAS的典型应用场景有哪些( )。

  62. A:对带宽要求较高的数据读写 B:内部文件共享 C:文件级数据整合 D:海量非结构化数据
    AI参考:正确选项为A:对带宽要求较高的数据读写;B:内部文件共享;C:文件级数据整合。NAS是一种网络附加存储设备,主要应用在中小企业、个人和科研机构等对存储需求较高且对性能有一定要求的场景。对于D选项,虽然也是NAS的主要应用场景之一,但是选项中的“海量非结构化数据”这一表述并不准确,因此不能选。 A、B、C选项都描述了NAS在存储需求较高且对性能有一定要求的场景中的典型应用,因此是正确选项。"
  63. Hbase基本架构中Master主要功能包括( )。

  64. A:发现失效的Region server并重新分配其上的region。 B:为Region server分配region。 C:管理用户对table的增删改查操作据。 D:负责Region server的负载均衡。

  65. 下列关于Spark Streaming描述正确的有( )。

  66. A:处理后的结果只能存储成HDFS文件。 B:是构建在Spark RDD之上的一款流处理工具。 C:是Spark核心(Spark Core)API的一个扩展。 D:可以实现高吞吐量的,具备容错机制的实时流数据处理。

  67. 数据可视化常用方式有( )。

  68. A:图形可视化。 B:地域空间可视化。 C:面积&尺寸可视化。 D:颜色可视化。

  69. Hbase基本架构中Zookeeper作为分布式协调,主要功能包括( )。

  70. A:存储所有Region的寻址入口。 B:保证任何时候, 集群中只有一个master。 C:实时监控Region server的上线和下线信息,并实时通知给Master。 D:存储HBase的schema和table元数据。

  71. 下列关于YARN框架描述正确的有( )。

  72. A:NodeManager 是每个节点上的资源和任务管理器。 B:ApplicationMaster负责与 RM 调度器协商以获取资源。 C:ResourceManager 负责整个集群的资源管理和分配。 D:NodeManager定时向 ResourceManager 汇报本节点资源的使用情况和Container 的运行状态。
    AI参考:关于YARN框架描述正确的有: A. NodeManager 是每个节点上的资源和任务管理器。这个描述是正确的,NodeManager是YARN集群中每个节点上的代理节点管理器,负责节点的资源管理和监控,以及启动和停止容器。 B. ApplicationMaster负责与 RM 调度器协商以获取资源。这个描述也是正确的,ApplicationMaster是YARN应用程序的协调器,负责与ResourceManager协商获取资源,以及与NodeManager协调启动和停止容器。 C. ResourceManager 负责整个集群的资源管理和分配。这个描述也是正确的,ResourceManager是YARN集群的核心组件,负责整个集群的资源管理和分配。 D. NodeManager定时向 ResourceManager 汇报本节点资源的使用情况和Container 的运行状态。这个描述是正确的,NodeManager是每个节点的管理器,需要定期向ResourceManager上报本地资源使用情况和容器的运行状态。 因此,所有选项都是正确的。"
  73. I/O设备虚拟化模式包括( )。

  74. A:I/O半虚拟化 B:内存储器虚拟化 C:I/O直通虚拟化 D:I/O全虚拟化
    AI参考:I/O设备虚拟化模式包括:I/O半虚拟化、I/O直通虚拟化和I/O全虚拟化。 因此,选项A、C和D是正确的。B选项提到的内存储器虚拟化与I/O设备虚拟化不同,它主要涉及将物理内存映射到虚拟机中的过程,与I/O设备虚拟化无关。"
  75. 关于数据的潜在价值,说法正确的是( )。

  76. A:判断数据的价值需要考虑到未来它可能被使用的各种方式,而非仅仅考虑其目前的用途。 B:在基本用途完成后,数据的价值仍然存在,只是处于休眠状态。 C:数据的价值是其所有可能用途的总和。 D:数据的真实价值就像漂浮在海洋中的冰山,第一眼看到的只是冰山一角,绝大部分隐藏在表面之下。

  77. 下列关于Spark计算框架描述正确的有( )。

  78. A:类似Hadoop MapReduce的通用并行框架,是基于内存计算的大数据并行计算框架。 B:可用于构建大型的、低延迟的数据分析应用程序。 C:Spark 运算比 Hadoop 的 MapReduce 框架慢。 D:由加州大学伯克利分校 AMP 实验室 (Algorithms, Machines, and People Lab) 开发。
    AI参考:关于Spark计算框架描述正确的有: * 类似Hadoop MapReduce的通用并行框架,是基于内存计算的大数据并行计算框架。 * 可用于构建大型的、低延迟的数据分析应用程序。 * 由加州大学伯克利分校 AMP 实验室(Algorithms, Machines, and People Lab)开发。 因此,选项A、B、D是正确的。选项C是错误的,因为Spark运算在某些场景下比Hadoop的MapReduce框架更快。"
  79. Hbase数据模型中物理视图描述正确的是( )。

  80. A:Region按大小分割的,当增大到一个阀值的时候,region就会等分为两个新的region。 B:Table 在行的方向上分割为多个Region。 C:Table中的所有行都按照row key的字典序排列。 D:Region是HBase中分布式存储和负载均衡的最小单元。
    AI参考:正确选项是:B,D HBase数据模型中物理视图描述正确的是: B: Table 在行的方向上分割为多个Region。 D: Region是HBase中分布式存储和负载均衡的最小单元。 解释: A选项错误,HBase中的Region并不一定按大小分割,它的大小主要取决于HFile的大小,当HFile的大小达到一定阀值时,就会将这个Region分裂成两个新的Region。 C选项错误,HBase中的Region并不是按照row key的字典序排列的,它只是一个命名规则,与排序无关。 因此,B和D选项是正确的描述HBase数据模型中物理视图的部分。"

温馨提示支付 ¥1.30 元后可查看付费内容,请先翻页预览!
点赞(1) dxwkbang
返回
顶部