1. 以下说法正确的是( )。

  2. 答案:HDFS是一易于扩展的分布式文件系统###HDFS运行在大量普通廉价机器上,提供容错机制###HDFS源自于Google的GFS论文###HDFS为大量用户提供性能不错的文件存取服务
  3. 下列关于YARN框架描述正确的有( )。

  4. 答案:ApplicationMaster负责与 RM 调度器协商以获取资源。###ResourceManager 负责整个集群的资源管理和分配。###NodeManager 是每个节点上的资源和任务管理器。###NodeManager定时向 ResourceManager 汇报本节点资源的使用情况和Container 的运行状态。
  5. 云计算通过网络,借助( )等先进的商业模式把强大的计算能力分布到终端用户手中。

  6. 答案:PaaS###IaaS###SaaS###MSP
  7. 基于SDN的网络架构可以更容易地实现网络虚拟化理由是( )

  8. 答案:高利用率###快速故障修复###平滑升级###弹性计算###SDN提供网络拓扑统一视图
  9. 以下属于Microsoft公司的云计算组件是( )。

  10. 答案:通信协议 RemoteFX 和 RDP 8 版###云计算管理平台System Center 2016###虚拟化平台Hyper-V Container###虚拟化平台Windows Server Container
  11. 以下属于IaaS 管理工具的有( )。

  12. 答案:CloudPlatform###CloudStack###OpenStack###Helion Eucalyptus
  13. Hbase数据模型中物理视图描述正确的是( )。

  14. 答案:Region是HBase中分布式存储和负载均衡的最小单元。###Region按大小分割的,当增大到一个阀值的时候,region就会等分为两个新的region。###Table中的所有行都按照row key的字典序排列。###Table 在行的方向上分割为多个Region。
  15. 下列关于Spark计算框架描述正确的有( )。

  16. 答案:可用于构建大型的、低延迟的数据分析应用程序。###由加州大学伯克利分校 AMP 实验室 (Algorithms, Machines, and People Lab) 开发。###类似Hadoop MapReduce的通用并行框架,是基于内存计算的大数据并行计算框架。
  17. 下列关于Spark Streaming描述正确的有( )。

  18. 答案:可以实现高吞吐量的,具备容错机制的实时流数据处理。###是构建在Spark RDD之上的一款流处理工具。###是Spark核心(Spark Core)API的一个扩展。
  19. 字节跳动对 YARN 的定制主要实现( )。

  20. 答案:物理资源分配率提升和使用率提升。###稳定性提升。###异地多活,全球统一的 YARN UI 界面。###多种负载场景优化。
  21. 以下属于大数据框架技术底层资源管理的是( )。

  22. 答案:YARN###Mesos
  23. NFV依赖SDN(软件定义网络)原理,把网络操作分成( )
  24. 根据虚拟机监控器在虚拟化平台中的位置分为3种模型( )。
  25. Hadoop2.x和Hadoop3.x区别包括( )。
  26. 下列不属于Strom特性的是( )。
  27. 下列不属于YARN的组件是( )。
  28. 下列属于Spark核心(Spark Core)的基础核心功能( )。
  29. 下列描述中错误的是( )。
  30. 根据OverLay的载体不同VXLAN的OverLay分为3种,下列分类不正确的是( )。
  31. 关于硬件辅助虚拟化技术叙述错误的是( )。
  32. 智慧城市的构建,不包含( )。
  33. Standby NameNode在架构中是NameNode的热备,当Active NameNode出现故障时,快速切换为新的 ActiveName Node。( )
  34. 2007年 Hadoop诞生,Hadoop是一个大数据计算框架,提供海量数据存储(HDFS)、查询(HBase)和计算(MapReduce)能力。( )
  35. Flume是一流数据采集框架,适合采集互联网用户行为数据。Kafka日志采集框架,主要在日志系统采集各类数据。( )
  36. 2017年12月Hadoop 3.0版本加入了通用YARN资源管理器,MapReduce和HDFS有效解耦。( )
  37. 虚拟机要运行在虚拟机软件(虚拟机监控器)里,而虚拟机软件运行在物理机上。( )
  38. sqoop2架构中,引入了sqoop Server,便于集中化的管理接口访问、Connector和元数据。( )
  39. 2007 年 1 月,Sun 公司发布了开源虚拟化软件 VirtualBox。同年 Xen 被 Citrix(思杰)收购。( )
  40. 云计算是从网格计算演化而来的,能够随需应变的提供资源。( )
  41. 消息处理者Bolt既可以处理Tuple,也可以将处理后Tuple作为新的Streams发送给其他Bolt。( )
  42. Spark支持的集群部署方式: standalone、Spark on Mesos、Spark on YARN、 Spark和Hadoop一起部署。( )
  43. 大数据的定义是( )。
  44. 下列描述中正确的有( )。
  45. HDFS可靠性策略包括( )。
  46. 下列关于Mesos资源管理器描述正确的有( )。
  47. 大数据采集过程中或完成后数据的预处理包括( )。
  48. 下列关于HDFS架构中Client功能描述正确的有( )。
  49. Hbase基本架构中RegionServer容错实现是( )。
  50. HDFS的优点包括( )。
  51. 下列关于Flume数据采集框架描述正确的有( )。
  52. 下列属于在Spark核心框架的基础上提供的计算框架( )。
  53. 下列关于Mesos与Yarn区别描述正确是( )。
  54. 对于云计算消费者,云计算的优势有( )。
  55. 数据处理大致分为两类( )。
  56. Spark的RDD的基本特性有( )。
  57. 基于Hadoop架构设计一数据库产品Hbase原因有( )。
  58. Overlay主要技术标准有( )。
  59. 下列属于Spark SQL特点的是( )。
  60. Storm 的主要组件包括( )。
  61. 云交付的组成部分中,通信协议有( )。
  62. 大数据系统框架主要解决两个问题( )。
  63. 下列关于Message Queue功能描述正确的是( )。
  64. 在当今云计算、大数据盛行的时代,对数据库产品提出以下要求( )。
  65. 云计算的服务模式不包括( )。
  66. 在大数据时代,下列说法正确的是。( )
  67. 下列不属于Active Namenode节点功能的是( )。
  68. Amazon.com公司通过( )计算云,可以让用户通过Web Service 方式租用计算机来运行自己的计算机应用程序。
  69. 下列关于MapReduce计算框架描述不正确是( )。
  70. 下列属于Hadoop2.0和Hadoop3.0区别的是( )。
  71. 大数据不是要教机器像人一样思考。相反,它是( )。
  72. HDFS架构中存储实际数据块的节点是( )。
  73. 速率最大的协议是( )协议。
  74. 下列关于Message Queue定义正确的是( )。
  75. Mesos组件中NodeManager用来实现对整个集群的资源管理和调度。( )
  76. 半虚拟化技术是指虚拟机模拟了完整的底层硬件,包括处理器、物理内存、时钟、外设等。( )
  77. Apache Flink是一种可以处理批处理任务的流处理框架。用于对无界和有界数据流进行有状态计算。( )
  78. Overlay(叠加网络、覆盖网络)是通过在现有网络上叠加一个虚拟的逻辑网络,让原有网络尽量不做改造,通过定义的逻辑网络来实现业务逻辑,解决原有数据中心的网络问题。( )
  79. IaaS 云计算解决方案中,交付部分主要解决如何让远端的用户使用虚拟机的问题。( )
  80. VMM或Hypervisor称为虚拟机监控器,负责为虚拟机统一分配CPU、内存和外设,调度虚拟资源。( )
  81. 发布-订阅模式是将消息持久化到一个队列中,有一个或多个消费者消费队列中的数据,但是一条消息只能被消费一次。( )
  82. 大数据系统硬件架构底层的资源包括存储资源、计算资源,通过网络资源实现连接。( )
  83. 加州大学伯克利分校给云计算的定义是指数据中心中的硬件和系统软件。( )
  84. NoSQL数据库是一种基于内存的数据库,并且提供一定的持久化功能。( )
  85. 一般的企业大数据实践应用,通用架构的底层都会是数据源和数据采集转换装载层。( )
  86. 传统数据密集型行业积极探索和布局大数据应用表现在( )。
  87. 大数据预测能够分析和挖掘出人们不知道或没有注意到的模式,确定判断事件必然会发生。( )
  88. 借助于图形化的手段,可以清晰、快捷有效的传达与沟通信息。( )
  89. 数据可视化工具分为( )。
  90. 从用户的角度,数据可视化可以让用户快速抓住要点信息,让关键的数据点从人类的眼睛快速通往心灵深处。( )
  91. 数据可视化常用方式包括( )。
  92. 市场上有许多专业的可视化工具,包括零编程拖拽类、专业图表类、软件开发工具类等。( )
  93. 下列关于数据仓库工具Hive架构描述正确的是( )。
  94. Hive的本质是将SQL语句转换为MapReduce任务运行,使不熟悉MapReduce的用户很方便地利用HQL处理和计算 HDFS 上的结构化的数据。( )
  95. 下列关于数据仓库工具Hive描述正确的是( )。
  96. Hive 的存储结构包括数据库、表、视图、分区和表数据等。( )
  97. Hive内部表(table)删除后,HDFS上的文件没有删除, 只是把文件删除,删除元数据,不删除数据。( )
  98. 在当今云计算、大数据盛行的时代,关系型数据库性能遇到瓶颈,瓶颈的源头一般是在磁盘的I/O上。( )
  99. 下列哪些数据库产品是NoSQL数据库( )。
  100. 若要在 HBase 上使用 SQL,则需要联合使用 Apache Phonenix,或者联合使用 Hive 和 HBase。( )
  101. NoSQL数据库同时具备了高性能、可扩展性强、高可用等优点。( )
  102. HBase存储模式是基于列存储的,每个column family存储在HDFS上的一个单独文件中。( )
  103. 下列关于Hbase描述正确的是( )。
  104. Storm将Spouts和Bolts组成的网络抽象成topology(类似 Job),它可以被提交到Storm集群执行。( )
  105. Storm是Twitter开源的分布式实时大数据处理框架,被业界称为实时版Hadoop。( )
  106. Storm使用ZooKeeper来协调集群内的各种配置使得Storm的集群可以很容易的扩展。( )
  107. 下列Storm工作流程描述正确的是( )。
  108. 下列对Storm集群结构描述正确的是( )。
  109. 在 RDD 的计算过程中,不需立刻去存储计算出的数据本身, 只要记录每个 RDD 是经过哪些转化操作得来的。( )
  110. Spark运行架构包括( )。
  111. Spark运行在YARN上要比运行在Mesos上更加灵活和自然,Spark官方推荐采用这种模式。( )
  112. Spark可运行于独立的集群模式中,或者运行于Hadoop中,也可运行于Amazon EC2等云环境中,并且可以访问HDFS、Cassandra、HBase、Hive等多种数据源。( )
  113. 下列关于Spark使用场景描述正确的有( )。
  114. 下列关于Spark GraphX图计算描述正确的有( )。
  115. Spark支持使用Scala、Java、Python和R语言进行编程。( )
  116. MapReduce计算框架具有数据本地性特性,本地性可避免跨节点或机架数据传输,提高运行效率。( )
  117. 下列关于MapReduce2.0架构描述正确的有( )。
  118. MapReduce 2.0将 JobTracker 两个主要的功能资源管理和任务调度/监控分离成单独的组件。( )
  119. 如果任务运行在它将处理的数据所在的节点, 则称该任务具有“数据本地性”。( )
  120. 下列适合MapReduce应用场景的是( )。
  121. 下列关于Kafka描述正确的有( )。
  122. 下列关于Flume架构描述正确的有( )。
  123. 下列关于数据迁移工具Sqoop描述正确的有( )。
  124. 大数据的处理流程的第一步就是大数据的采集与预处理。( )
  125. 各行业海量的数据中,大约20%左右属于结构化的数据,80%的数据属于广泛存在于社交网络、物联网、电子商务等领域的非结构化数据。( )
  126. 常用大数据采集途径有( )。
  127. 发布-订阅消息传递模式是将消息持久化到一个topic中。消费者可以订阅一个或多个topic,消费者可以消费该topic中所有的数据,同一条数据可以被多个消费者消费。( )
  128. Spark是一种包含流处理能力的下一代批处理框架。主要应用在广告、报表、推荐系统等业务上。( )
  129. 下列关于YARN描述正确的有( )。
  130. MapReduce、Storm、Spark、Tez 等计算框架都可以整合在 YARN 上运行,只要他们各自的框架中有符合YARN规范的资源请求机制即可。( )
  131. 下列基于Yarn的计算框架描述正确是( )。
  132. Mesos是一个开源的资源管理系统,可以对集群中的资源做弹性管理,目前twitter, apple等公司在大量使用Mesos管理集群资源。( )
  133. YARN基于ZooKeeper实现HA,主提供服务,备同步主的信息。主挂掉,备立即做切换接替主进行服务。( )
  134. Mesos组件中Framework Scheduler组件是实现单个应用程序的管理和资源二次调度。( )
  135. 字节跳动公司产品对 YARN 的定制应用描述正确是( )。
  136. YARN采用双层调度框架,ResourceManager将资源分配给AppMaster,AppMaster将资源进一步分配给各个Task。( )
  137. YARN 天生是为批处理而设计的,很多地方与流式或模型训练场景并不匹配,为了给批处理、流式、模型训练三大场景更好的体验,字节跳动对YARN做一些定制工作。( )
  138. HDFS文件被切分成固定大小的数据块,为实现高吞吐率,默认数据块大小为128MB。( )
  139. HDFS不支持多用户写入,也无法进行文件随机修改。仅支持以append的方式,即通过追加的方式添加到文件结尾处。( )
  140. 传统的NFS不是一种典型的分布式系统,虽然它的文件的确放在远端(单一)的服务器上面。( )
  141. HDFS文件不仅支持追加,还支持文件任意offset的修改。( )
  142. HDFS不适合的场景( )。
  143. Hadoop2.0和Hadoop3.0区别包括( )。
  144. Hadoop 2.0版本加入了通用YARN资源管理器,用以协调各个组件对系统资源的利用,合理分配集群CPU、内存资源。( )
  145. Hadoop 3.0版本中HDFS支持纠删码,纠删码相比于副本机制节省了一半以上的存储空间,普通副本机制需要3倍存储空间而这种机制只需1.4倍即可。( )
  146. Hadoop1.0和Hadoop2.0区别包括( )。
  147. Hadoop2.0版本中,MapReduce2.0只是一个计算框架,具体资源调度全部交给Yarn框架。( )
  148. 通用的大数据分析系统的核心设计理念包括并行化、规模经济、虚拟化。( )
  149. 大数据的科学价值和社会价值正是体现在( )。
  150. 大数据的处理流程涉及( )。
  151. 大数据4V特点是( )。
  152. 在大数据时代,我们需要设立一个不一样的隐私保护模式,这个模式应该着重于( )为其行为承担责任。
  153. Hadoop MapReduce、Spark属于离线计算框架技术。( )
  154. 大数据框架技术中消息系统技术有:Kafka、StormMQ、ZeroMQ、RabbitMQ。( )
  155. 一般地,SaaS 云管理软件包含两大部分:一是 SaaS 业务门户,二是 SaaS 管理门户。( )
  156. 虚拟化平台软件有哪些( )。
  157. 以下属于PaaS 管理工具的有( )。
  158. IaaS 云计算解决方案中,虚拟化平台(硬件资源、虚拟软件)主要解决如何运行虚拟机的问题。( )
  159. SaaS云管理工具与业务关联性大,目前没有统一的标准版产品。( )
  160. 软件定义网络(SDN)特点( )。
  161. OpenFlow组件包括( )。
  162. 网络虚拟化是一种网络技术,可以在物理拓扑上创建虚拟网络。基于SDN的网络架构可以更容易地实现网络虚拟化。( )
  163. 软件定义网络 (SDN)将网络管理与底层网络基础设施分离开来,允许管理员动态调整整个网络的流量,以满足不断变化的需求。( )
  164. 根据OverLay的载体不同,VXLAN的OverLay分为( )3种。
  165. Ceph计算模式是一种完全无中心架构( )
  166. 根据存储虚拟化实现的位置,可将存储虚拟化分为( )。
  167. 存储虚拟化是指将存储资源集中到一个大容量的资源池并实行单点统一管理,无需中断应用即可改变存储系统和数据迁移。( )
  168. 开放系统的存储类型分为内置存储和外挂存储,其中外挂存储可分为( )。
  169. 根据实现方式,可将存储虚拟化分为( )。
  170. 虚拟化是一项技术,而云是一种环境或服务。( )
  171. 虚拟化的主要功能是把单个资源抽象成多个给用户使用,而云计算则是帮助不同部门或公司访问一个自动置备的资源池。( )
  172. 个人PC上使用比较多的虚拟化工具有( )。
  173. 虚拟技术特性有( )。
  174. 虚拟化的益处包括( )。
  175. 虚拟化技术主要用于云计算物理资源的池化,物理资源不包括( )。
  176. 云计算是一种计算模式,能够提供随时随地、便捷的、随需应变的网络接入,访问可配置的计算资源共享池。( )
  177. 云计算的劣势有( )。
  178. 云计算部署模型有( )。
  179. 云计算的服务模式包括( )。
  180. 云计算是把有形的产品(网络设备、服务器、存储设备、各种软件等)转化为服务产品(IaaS,PaaS,SaaS),并通过网络让人们远程在线使用。( )
  181. 日常我们用到的云服务器、钉钉办公软件、百度网盘等应用都是云计算服务厂商提供的云计算服务。( )
  182. 下列哪些应用属于大数据技术的应用( )。
温馨提示支付 ¥5.00 元后可查看付费内容,请先翻页预览!
点赞(7) dxwkbang
返回
顶部