1. 大数据的计量单位已经越过TB级别发展到ZB,甚至更高的级别来衡量了。( )

  2. 答案:对
  3. 使用Hadoop中的MapReduce编程模型非常简单,只需要定义好map和reduce函数的输入和输出键值对的类型即可。( )

  4. 答案:对
  5. 关于hdfs元数据,Edits编辑日志中记录了文件系统的所有操作。( )

  6. 答案:错
  7. 数据应用层主要采用了大数据采集技术,实现对数据的ETL操作。( )

  8. 答案:错
  9. Map的主要工作是将多个任务的计算结果进行汇总。( )

  10. 答案:错
  11. hive中包含数据库、表、分区、桶四类数据模型。( )

  12. 答案:错
  13. MapReduce设计的一个理念就是“计算向数据靠拢”,而不是“数据向计算靠拢”,因为,移动数据需要大量的网络传输开销。( )

  14. 答案:对
  15. 内部表的数据有Hive自身管理,外部表的数据有HDFS管理。( )

  16. 答案:对
  17. Hadoop框架是用Java实现的,MapReduce应用程序则一定要用Java来写。( )

  18. 答案:错
  19. Region服务器是HBase中最核心的模块。( )

  20. 答案:对
  21. HDFS是整个Hadoop体系的基础,负责数据的存储与管理。( )

  22. 答案:对
  23. Hadoop的核心主要是指HDFS和MapReduce。( )
  24. Client与HRegionServer进行数据读写类操作。( )
  25. Hive将元数据保存在关系数据库中,大大减少了在查询过程中执行语义检查的时间。( )
  26. HDFS是分布式文件系统,其命名空间包括块、目录和文件。( )
  27. HBase是四维坐标(即行键、列族、列、时间戳)定位数据。( )
  28. Hive中数据表info更名为info1,其实现命令如下:hive > alter table info rename to info1 ;( )
  29. Hive中show tables命令用来显示数据表名称。( )
  30. HDFS只设置唯一一个名称节点带来的局限性包括( )。
  31. 关于HBase特性,是下列选项中的哪些?( )
  32. 使用Apache Sqoop的主要好处有哪些?( )
  33. 以下( )属于Sqoop的命令。
  34. 下面关于Zookeeper功能的描述正确的是( )。
  35. 除了键入sqoop语法之外,还可以使用指定sqoop-(toolname)语法的别名脚本,sqoop提供了以下哪些脚本( )
  36. 关于HBase Region进行的管理控制,分别为下列中哪些选项?( )。
  37. 下面关于Hive存储的文件格式描述正确的是( )
  38. HDFS中的NameNode节点用于存放元数据,数据内容包含( )。
  39. Hive中向数据表添加数据的主要方式有( )。
  40. 下面关于Hive的索引描述不正确的是( )。
  41. MapReduce程序执行的阶段主要有:( )
  42. 在HBase中,关于Region描述,下列选项中哪些是正确的( )
  43. Hadoop MapReduce计算的流程是( )。
  44. 下列不属于Hadoop特点的是( )。
  45. 关于Sqoop的说法,不正确的是?( )
  46. 当Zookeeper的节点数据发生变更时,被触发的事件是( )。
  47. ( )是Zookeeper集群工作的核心,也是事务性请求(写操作)的唯一调度和处理者。
  48. Sqoop的底层实现是?( )
  49. Znode有两种类型,分别是( )和永久节点。
  50. Hive是由哪家公司开源的( )。
  51. 在Hadoop体系中,分布式文件系统是指( )
  52. Hive是为了解决哪类问题( )
  53. 大数据的文件系统是( )。
  54. MapReduce体系结构主要由TaskTracker、Task、JobTracker和( )组成。
  55. 在词频统计中,对于文本行"hello hadoop hello world",经过WordCount的Reduce函数处理后的结果是( )。
  56. 下列关于传统并行计算框架(比如MPI)和MapReduce并行计算框架比较错误的是( )。
  57. 下面哪个配置是在mapred-site、xml中配置的( )。
  58. shuffle和sort输出的key实现了下面哪个接口( )
  59. OutputFormat是MapReduce输出的基类,所有的MapReduce输出都实现OutputFormat接口。( )
  60. Sqoop本质上是使用MR程序进行数据迁移的工具。( )
  61. Hive中desc new_info命令用来显示当前数据表字段结构。( )
  62. 安装Hadoop时,配置项”dfs、replication”是配置在文件core-site、xml( )。
  63. HDFS集群开始启动时,其处于安全模式,可以进行读操作,不能进行写操作。( )
  64. 大数据技术是一系列技术的总称,它是集合了数据采集与传输、数据存储、数据处理与分析、数据挖掘、数据可视化等技术,是一个庞大而复杂的技术体系。( )
  65. Zookeeper的选举机制,实际上是采用算法FastLeaderElection,投票数大于半数则胜出的机制。( )
  66. 设置免密登录需要先用ssh-keygen生成一对密钥( )。
  67. Watcher事件类型(EventType)常见的表示事件类型枚举属性及属性含义( )
  68. 下列成员属于MapReduce体系结构中的有:( )
  69. Hadoop有3大核心组件分别是( )。
  70. YARN作为Hadoop的资源管理器,它的引入为集群带来了哪些好处?( )
  71. 下面关于Hive SQL编译描述不正确的是( )
  72. HDFS的适用性和局限性,以下说法正确的是( )。
  73. 以下对名称节点理解正确的是( )。
  74. Client使用HBase RPC机制与哪些组件进行通信?( )
  75. Watcher机制主要包括( )
  76. HDFS中第二名称节点的作用是( )。
  77. 端口9870默认是Hadoop3、X哪个服务的端口?( )。
  78. Zookeeper是由( )组成的树。
  79. HDFS集群采用主从结构,节点主要包括( )和数据节点。
  80. 如何查看sqoop命令列表?( )
  81. 对MapReduce的体系结构,以下说法错误的是( )。
  82. Sqoop的作用是?( )
  83. Sqoop中的( )命令是将数据导入到集群中。
  84. 在使用MapReduce程序WordCount进行词频统计时,对于文本行“hello hadoop hello world”,经过WordCount程序的Map函数处理后直接输出的中间结果,应该是下面哪种形式( )。
  85. 下列说法中,关于Zookeeper说法错误的是( )。
  86. HBase 语言大小写不敏感。( )
  87. 在Hadoop中每个应用程序被表示成一个作业,每个作业又被分成多个任务,JobTracker的负责作业的分解、状态监控以及资源管理。( )
  88. 非全新集群选举时是优中选优,保证Leader是Zookeeper集群中数据最完整、最可靠的一台服务器。( )
  89. Hive的数据库、表、分区在HDFS的表现形式是文件夹。( )
  90. 下列选项中,属于Zookeeper集群的角色有( )。
  91. Hive 中主要包括4 种数据模型,分别为哪些选项?( )。
  92. 以下( )哪些项属于sqoop2优点。
  93. HBase表的索引结构,包含下列哪些选项( )
  94. 关于HBase表的单元格描述,下面哪些是正确的( )
  95. 关于MapReduce过程中的split阶段,说法正确的是:( )
  96. 下面关于Hive内外表描述不正确的是( )
  97. 编写MapReduce程序时,下列叙述错误的是( )。
  98. 通过执行( )命令,查看该节点的Zookeeper角色
  99. HBase表中关于列族描述,下列选项哪个是不正确?( )
  100. 一旦NameNode关闭,就无法访问Hadoop集群的是( )
  101. sqoop安装完成后,查看sqoop版本的命令是?( )
  102. 如何查看当前sqoop中都有哪些job? ( )
  103. Znode的类型在创建时被指定,创建后仍能改变。( )
  104. HBase是面向行的存储模式。( )
  105. 关于MapReduce的shuffle过程,叙述正确的是( )。
  106. HBase的主要组件有3个,是下列选项中的哪些?( )
  107. 以下对数据节点理解正确的是( )。
  108. 格式化文件系统指令( )。
  109. 下列概念正确的有( )
  110. 下面哪些是MapReduce的计划的主要配置参数?( )
  111. 执行sqoop help会有以下哪些帮助项?( )
  112. Sqoop是连接传统关系型数据库和Hadoop的桥梁。包括( )两个方面。
  113. 当Zookeeper客户端连接认证失败,此时客户端和服务器的连接状态就是( )说明认证失败。
  114. 在实验集群的master节点使用jps命令查看进程时,终端出现以下哪项能说明Hadoop主节点启动成功? ( )
  115. Watch机制有4个特点:一次性触发、分布式锁、异步发送、先注册再触发( )
  116. 起初的Hadoop是使用Java语言开发的。( )
  117. Hadoop集群配置文件中,配置HDFS的属性的是以下哪一项( )。
  118. Client 端上传文件的时候下列哪项正确?( )
  119. Hive有什么好处( )
  120. HBase 是一个构建在Hadoop文件系统之上的面向列的数据库管理系统。( )
  121. 安装完全分布式Apache Hadoop的核心配置文件有?( )
  122. YARN主要负责大数据计算管理中的( )。
  123. 以下哪一项属于 Hadoop 可以运行的模式( )。
  124. 对HDFS内的文件进行操作,以下说法正确的是( )。
  125. hdfs系统不支持数据的修改。( )
  126. Sqoop的使用者需要以下哪些先决条件知识( )
  127. Zookeeper的顺序性主要分为两种,分别是( )和偏序。
  128. HBase表中单元格中的值是( )
  129. HDFS具有高延迟性。它不适用于低延迟的数据访问。( )
  130. HDFS与传统数据存储对比,主要特点包含( )。
  131. Zookeeper作为一个分布式应用提供一致性服务的软件,提供的功能( )
  132. Hadoop中,MapReduce负责提供对数据的计算结果的汇总的是( )。
  133. 以下( )属于Sqoop的特点。
  134. 传统关系型数据库数据定位是二维坐标,即行和列。( )
  135. –append参数是将数据追加到HDFS上一个已存在的数据集上。( )
  136. ResourceManager(RM)负责对各NodeManager上的资源进行统一管理和调度。( )。
  137. hadoopdfsadmin –report 命令用于检测HDFS损坏块。( )
  138. HQL语言大小写敏感,但内容分大小写。( )
  139. Hadoop环境变量中的HADOOP_HEAPSIZE用于设置所有 Hadoop守护线程的内存。它默认是200 GB。( )。
  140. HDFS有着高容错性的特点。( )
  141. 当客户端断开连接,此时客户端和服务器的连接就是SyncConnected状态,说明连接失败。( )
  142. 客户端连接HBase依赖于Zookeeper,HBase存储依赖于Hadoop Client。( )
  143. hcatalog是hive对外的一个统一存储格式的接口,使用hcatalog对接到hive的数据不需要担心数据在hive中的存储格式和存储位置。( )
  144. SQL语言大小写不敏感。( )
  145. Client与HMaster进行通信进行管理类操作( )
  146. HDFS的namenode保存了一个文件包括哪些数据块,分布在哪些数据节点上,这些信息也存储在硬盘上。( )
  147. Hive是数据库工具。( )
  148. drop 内部表时,会删除hdfs上的文件夹和元数据。( )
  149. 因为 HDFS 有多个副本,所以NameNode是不存在单点问题的。( )
  150. 大数据主要具有四个特征:即大量(Volume)、多样(Variety)、高速(Velocity)和价值(Value),也就是所谓的“4V”特征。( )
  151. Hadoop实现了一个分布式文件系统,简称HDFS。( )。
  152. Hadoop集群配置文件中配置Yarn运行所需的环境变量的是hdfs-site、xml。( )。
  153. 修改~/、bashrc文件保存后,修改的内容能立即生效( )。
  154. HBase通过行键、列族、列限定符和时间戳来确定一个单元格数据。( )
  155. Zookeeper具有全局数据一致性、高容错性、无序性、原子性以及实时性。( )
  156. SecondaryNameNode应与NameNode部署到一个节点( )。
  157. 查看Linux ip的命令是ifconfig( )。
  158. 由于Zookeeper集群的运行不需要Java环境支持,所以不需要提前安装JDK。( )
  159. InputFormat接口决定了输入文件如何被Hadoop分块。InputFormat能够从一个job中得到一个list集合。( )
  160. 两个键值对<“hello”,1>和<“hello”,1>x,如果对其进行归并(merge),会得到<“hello”,内容已经隐藏,点击付费后查看>,如果对其进行合并(combine),会得到<“hello”,2>。( )
  161. Zookeeper提供的getChildren()方法可以用于获取指定节点下的所有子节点列表。( )
  162. 数据收集层是大数据技术和应用的目标。通常包括信息检索、关联分析等功能。( )
  163. NameNode 本地磁盘保存了Block的位置信息。( )
  164. 在Hive进行表删除操作时,要区分内部表与外部表,下面描述正确的选项有哪些? 删除内部表时:。( )等。
  165. 选举机制类型( )
  166. 以下关于sqoop-import的作用描述正确的有( )
  167. 下面关于Hive数据模型描述正确的是( )
  168. Zookeeper采用了Watch机制来实现分布式数据的( )功能
  169. 在设置Linux环境中,关闭防火墙的代码有哪些( )。
  170. Yarn它主要由两大核心模块构成,分别是( )。
  171. Hadoop存储系统HDFS的体系结构的设计目标包含( )。
  172. 下面关于传统关系型数据库的特性描述,正确的有哪些?( )
  173. 下列关于hadoop集群启动中的所有进程及其作用,正确的有( )
  174. 第一代Hadoop存在的问题( )。
  175. 一个完整的mapreduce程序在分布式运行时有三类实例进程,是哪三个?( )
  176. 关于MapReduce程序,下列说法正确的有:( )
  177. 以下HDFS相关的shell命令不正确的是( )。
  178. 下列说法中,关于zoo.cfg配置文件中的参数server.1=hadoop01:2888:3888说法正确的是( )。
  179. Hive驱动器主要包括哪些选项?( )
  180. MapReduce中的JobTracker拆分为两个独立任务,这两个任务分别是( )。
  181. Zookeeper 使用 WatchedEvent 对象来封装服务端事件并传递。该对象包含了每个事件的( )基本属性
  182. 关于HBase表的列限定符描述,下面哪些是正确的( )
  183. YARN服务组件包括( )
  184. Hadoop的生态系统组件之—Sqoop的功能是?( )
  185. Sqoop工具是通过( )进行导入导出数据的。
  186. Zookeeper中的数据存储结构和标准文件系统非常类似,两者采用的层次结构是( )。
  187. Hadoop 集群的运行模式?( )。
  188. Hive与传统SQL数据库对比,下面描述不正确的是( )
  189. 为了保证Leader选举能够通过半数以上台服务器选举支持,因此Zookeeper集群搭建的服务器为( )。
  190. 下列哪个层主要采用了大数据采集技术,实现对数据的处理?( )
  191. 下面选项中,与Zookeeper功能类似的框架是( )?
  192. 下面中不属于Hive中的元数据信息( )
  193. 在默认情况下,HDFS块的大小为( )。
  194. 关于Hadoop MapReduce的叙述错误的是( )。
  195. 不是hadoop主要组成部分的是:( )。
  196. 从下列选项中,选择命令用于删除整行操作( )。
  197. 从下列选项中,选择命令以查询表中指定列( )
  198. 下列哪个程序通常与NameNode在一个节点启动? ( )。
  199. 下面关于Hive格式描述正确的是( )。
  200. 以下哪种不是 Hive支持的数据类型( )
  201. HBase是哪个技术的开源实现( )。
  202. 目前,Hadoop的最高版本是哪个?( )。
  203. NoSQL可划分为多种存储数据库,下列选项哪个不属于NoSql( )
  204. Hive的元数据存储在derby和 MySQL中有什么区别( )
  205. MapReduce为了保证任务的正常执行,采用重复执行和( )等多种容错机制。
  206. 下列用来存放部署Hadoop集群服务器的机架的是( )
  207. 以下哪种是HBase支持的数据类型( )
  208. 通过将以下什么工具与Hadoop集群整合后,可以查看Hadoop集群中每个Master/Slave节点的运行状态?( )。
  209. HBase是哪个公司开发的( )。
  210. 下面关于Hive和传统数据库的比较描述正确的是( )
  211. HBase依赖于Hadoop中的( )提供强大的计算能力。
  212. 下列对Sqoop描述正确的是?( )
  213. Sqoop实现向hdfs系统导入数据使用的命令是( )
  214. 下列选择参数是sqoop指令的是( )
  215. 关于Map和Reduce两个阶段描述正确的是( )。
  216. Sqoop不支持下列哪种数据库( )
  217. Map任务作为MapReduce工作流程的前半部分,它主要经历了5个阶段,分别是Copy阶段、Merge阶段、Sort阶段、Reduce阶段和Write阶段。( )
  218. Partition主要作用就是将map的结果发送到相应的reduce。这就对partition有两个要求( )。
  219. sqoop的迁移的方式就是把sqoop的迁移命令转换成( )
  220. HBase中的显示命名空间名称的命令是:list_namespace。( )
  221. 在HBase表中添加数据的命令,是下列选项中的哪个?( )
  222. 对HBase表中数据进行全表查看的命令,是下列选项中的哪个?( )
  223. HBase表名区分大小写,所有的字符串都必须包含在单引号里( )
  224. 在HBase表中按行键查询数据的命令,是下列选项中的哪个?( )
  225. HBase是一种键值类型的NoSql数据库 。( )
  226. HBase 依靠( )来存储底层数据的。
  227. 关于HBase的相关描述,下面哪些是正确的?( )
  228. 关于HBase的逻辑表描述,下面选项中正确的是( )
  229. HBase来源于IBM Bigtable ( )
  230. 下列关于Hive的描述,正确的有哪些?( )。
  231. Hive在删除内部表时,内部表的元数据被删除,数据本身不删除( )
  232. Hive能够用来进行海量数据的存储、查询和离线分析。( )
  233. HiveQL和SQL的一个不同之处在于Partition操作。( )
  234. Hive定义了简单的类似SQL的语言,称为( )。
  235. Hive是基于( )
  236. 从下列选项中,选出不是Hive基本类型的选项。( )
  237. 按粒度大小的顺序,Hive数据被分为数据库,数据表,分区和桶。( )
  238. Hive默认分桶的数量是( )。
  239. Hive是建立在( )之上的数据仓库。
  240. ZooKeeper是一个封闭源码的分布式应用程序协调服务,它是由Google的Chubby开源实现,是Hadoop和Hbase的重要组件。( )
  241. 下列选项中,用于获取Zookeeper所包含的信息的Shell命令是( )。
  242. Zookeeper中,Watcher机制的特点包含( )。
  243. 安装Hadoop时,发现50070对应的页面无法打开,可以通过下面哪个命令查看某个端口(TCP或UDP)是否在监听?( )
  244. Zookeeper特点 ( )
  245. Namenode在启动时自动进入安全模式,在安全模式阶段,说法错误的是( )
  246. 临时节点允许拥有子节点。( )
  247. 在Hadoop中负责运算的组件是( )
  248. Hadoop的框架最核心的设计就是:HDFS和MapReduce。( )
  249. HDFS为海量的数据提供了存储,而MapReduce为海量的数据提供了计算。( )
  250. 在MapReduce中,下面哪个阶段是并行进行的( )
  251. ReduceTask工作过程包含下面哪些阶段( )。
  252. 在Hadoop中,下面哪个是默认的InputFormat类型,它将每行内容作为新值,而将字节偏移量作为key( )
  253. 关于combiner描述正确的是( )。
  254. Map阶段,溢出的数据写入磁盘之前,线程会根据ReduceTask的数量进行数据分区,一个Reduce任务对应一个分区的数据。( )
  255. Google公司设计MapReduce的初衷主要是为了解决其搜索引擎中大规模网页数据的并行化处理。( )
  256. 在MapReduce中,下面哪个数据流的顺序是正确的( )
  257. 下列属于HDFS缺点的是( )
  258. HDFS对于服务器性能要求很高,必须构建在高成本的机器上。( )
  259. 下列属于HDFS集群的主服务器的是( )
  260. NameNode收到客户端的请求后,检查数据操作权限并判断上传的文件是否已存在,如果已存在,则拒绝客户端的上传。( )
  261. HDFS 中的block默认保存几个备份。( )
  262. HDFS是一个易于扩展的分布式文件系统。( )
  263. 命令hadoop fs -ls / 的功能是( )
  264. 下列不属于NameNode的功能的是( )
  265. 客户端向( )发出写文件请求?
  266. 在HDFS中,我们只能使用Shell命令来管理和操作文件系统。( )
  267. Hadoop 支持数据的随机读写。( )
  268. Hadoop配置文件所在目录是哪个?( )
  269. 下面哪个目录保存了Hadoop集群的命令(比如启动Hadoop)?( )
  270. Hadoop 默认调度器策略为FIFO ( )
  271. HDFS配置文件和配置Yarn运行所需的环境变量是以下哪两个文件( )
  272. 完成Hadoop集群主节点hadoop01的配置后,还需要将系统环境配置文件、JDK安装目录和Hadoop安装目录分发到其他子节点hadoop02和hadoop03上,具体指令( )
  273. Nagios不可以监控Hadoop集群,因为它不提供Hadoop支持。( )
  274. 下列哪个属性是hdfs-site.xml中的配置?( )
  275. 重启网卡服务是systemctl restart network( )
  276. Hadoop完全分布模式配置免密登录是要?( )
  277. 1、起初的Hadoop是什么语言开发的?( )
  278. 大数据处理分为两类:批量处理(即离线处理)和实时处理(即在线处理)。( )
  279. 下列( )是整个Hadoop体系的基础,负责数据的存储与管理?
  280. 数据的种类不仅包括文字、图片,还包含了视频、语音、地图定位信息、网络日志信息等。( )
  281. 下列哪个层主要采用了大数据采集技术,实现对数据的ETL操作?( )
  282. 下列属于Hadoop核心的是( )
  283. 怎样级别的数据称得上是海量数据?( )
  284. 大数据的“4V”特征是指什么( )
  285. HDFS是Hadoop的核心之一,主要实现分布式计算功能。( )
  286. Hadoop已经正式成为、Apache顶级开源项目,俨然已经处于大数据处理技术的核心地位。( )
  287. yarn集群是负责集群( )和运算资源管理的分布式集群。
  288. 目前典型的大数据文件系统有( )。
  289. 大数据存储是指把不同来源、不同格式及不同类型的大规模数据在逻辑上或物理上有机的集中,存储在分布式存储系统中,以提高数据的可靠性和可扩展性。( )
  290. 分布式数据存储策略可分为ACID和( )两类
  291. HDFS是一个( )
  292. mapreduce不是一个集群,而是一个编程框架( )
  293. Hadoop集群主要包含以上哪三个模块:( )
  294. mapreduce是一个分离再合并的集群。( )
  295. Hadoop集群旨在用于分布式计算环境中( )和分析大量非结构化数据。
  296. Hadoop集群具有很高的抗故障能力,因为每个数据块都复制到其他节点上,以确保在单个节点发生故障时不会丢失数据。 ( )
温馨提示支付 ¥5.00 元后可查看付费内容,请先翻页预览!
点赞(2) dxwkbang
返回
顶部