1. Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统。( )

  2. 答案:对
  3. .Spark集群相比于Spark RDD API,Spark SQL对结构化数据的操作更加高效和方便。( )

  4. 答案:对
  5. Spark on Yarn模式提交任务后,会依次进行6个过程:①启动SparkContext;②任务构建成DAG图;③executor向SparkContext进行注册;④向Yarn申请executor资源;⑤进行Stage划分与TaskSet生成;⑥Task发送给executor执行。( )

  6. 答案:错
  7. Hadoop特Spark MLlib是机器学习的算法包,包含了机器学习的一些常用的算法和处理工具。( )

  8. 答案:对
  9. YARN既是资源管理调度框架,也是一个计算框架。

  10. 答案:错
  11. 第二名称节点(Secondary NameNode)是HDFS架构中的一个组成部分,它是用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间。( )

  12. 答案:对
  13. .Hadoop的特点包括高可靠性、高扩展性、高效性、高容错性、高成本。( )

  14. 答案:错
  15. 在一个基本的 Hadoop 集群中,DataNode 主要负责 存储被拆分的数据块?( )

  16. 答案:对
  17. 在Hadoop中,安装完全分布式Apache Hadoop的核心配置文件有core-site.xml、hdfs-site.xml、yarn-site.xml和mapred-site.xml。( )

  18. 答案:对
  19. Hadoop的两大核心是HDFS和MapReduce,HDFS用来存储数据,MapReduce用来处理数据。( )

  20. 答案:对
  21. 分布式文件系统HDFS是谷歌分布式文件系统GFS(Google File System)的一种开源实现。( )

  22. 答案:对
  23. Spark SQL目前暂时不支持Lisp语言( )
  24. 进行基于Hadoop的MapReduce编程环境配置时,必须要的步骤包括配置SSH、配置Java环境变量、配置Eclipse和配置Hadoop环境变量。( )
  25. Hive是一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储。( )
  26. Hadoop框架是用Java实现的,MapReduce应用程序则一定要用Java来写。
  27. Hadoop项目包括( )
  28. 下列关于Scala的说法正确的是:( )
  29. MapReduce 相较于传统的并行计算框架有什么优势?( )
  30. 下列说法中,哪些选项描述正确?( )
  31. 关于SecondaryNameNode的说法错误的是( )
  32. 下列关于传统并行计算框架(比如MPI)和MapReduce并行计算框架比较正确的是( )
  33. 对新一代资源管理调度框架YARN的理解正确的是:( )
  34. Spark支持的分布式布署方式中哪个是( )。
  35. 启动HDFS集群时,( )
  36. MapReduce 体系结构主要由以下那几部分构成?( )
  37. 在一个基本的 Hadoop 集群中,DataNode 主要负责什么( )
  38. 以下哪项不属于Hadoop运行的模式( )
  39. Spark中的Executor是( )
  40. 以下名词解释不正确的是( )
  41. Spark SQL目前暂时不支持下列哪种语言( )
  42. HDFS的优点不包括( )
  43. 在HDFS根目录下创建一个文件夹/test,且/test文件夹内还包含一个文件夹dir,正确的shell命令是( )
  44. 下列关于 Scala 特性的描述,错误的是哪一项?( )
  45. 下面哪个程序负责分布式文件系统HDFS的数据存储( )
  46. 在 Hadoop 生态系统中,Kafka 主要解决 Hadoop 中存在哪些的问题?( )
  47. HDFS中的文件块默认保存几份( )
  48. 以下哪项通常是搭建Hadoop集群面临的瓶颈( )
  49. 在 HDFS 中,NameNode 的主要功能是什么?( )
  50. 第三次信息化浪潮的标志是( )
  51. 在一个基本的 Hadoop 集群中,SecondaryNameNode 主要负责什么( )
  52. 以下不属于Hadoop生态圈的组件是( )
  53. 下列关于 MapReduce 工作流程,哪个描述是正确的( )
  54. 上传一个大小为500MB的文件data.txt,到Hadoop2.6搭建的集群上。这个文件会占用多少个HDFS文件块?( )。
  55. 以下哪些组件不是Hadoop的生态系统的组件( )
  56. 在 Hadoop 项目结构中,MapReduce 指的是什么( )
  57. Kafka中的最小消息单元是什么?( )
  58. Kafka的消费者可以在消费时指定从哪个偏移量开始消费消息,这个偏移量可以是: ( )
  59. Kafka使用什么作为消息的唯一标识符? ( )
  60. Kafka中的ISR是指什么? ( )
  61. Kafka的副本有什么作用? ( )
  62. Kafka支持哪些消息保证机制? ( )
  63. Flume主要用于哪些场景? ( )
  64. Flume Agent的三个核心组件是Source、Channel和Sink。 ( )
  65. Flume内部数据传输的基本单元是Byte。( )
  66. Flume中,用于存储数据的组件是什么?( )
  67. 设计Flume架构时,Sink组件的数据可以流向一个新的Agent的Channel组件。( )
  68. Flume中,可以使用哪个选项来指定配置文件的路径?( )
  69. Hive是一个基于Hadoop的数据仓库工具,依赖HDFS存储数据,依赖MapReduce处理数据。( )
  70. Hive不支持索引。( )
  71. 以下不属于Hive的复合数据类型是( )
  72. 下列选项中,修改数据表属性的语法格式中用于修改数据表属性操作的子句是 ( )
  73. 以下不属于Hive的原始数据类型是( )
  74. 下列对HBase的理解正确的是:( )
  75. 下列对HBase数据模型的描述错误的是( )
  76. 关于HBase Shell命令解释错误的是( )
  77. HBase是一个行式分布式数据库,是Hadoop生态系统中的一个组件( )
  78. HBase是一种什么数据库( )
  79. HBase和传统关系型数据库的区别在于哪些方面:( )
  80. MapReduce 的作业主要包括什么?( )
  81. Hadoop框架是用Java实现的,因此MapReduce应用也必须要用Java编程语言完成。( )
  82. Spark的计算模式也属于MapReduce,但编程模型比Hadoop MapReduce更灵活。( )
  83. MapReduce集群一般使用大量低端服务器,因此节点硬件失效和软件出错是常态。( )
  84. 在 MapReduce 工作流程中,所有的数据交换都是通过 MapReduce 框架自身去实现的( )
  85. 传当前目录下的本地文件file.txt到分布式文件系统HDFS的“/path”目录下的Shell命令是( )
  86. 在 Hadoop 项目结构中,HDFS 指的是什么( )
  87. 以下哪个命令无法用来操作HDFS文件( )
  88. 假设已经配置好环境变量,启动Hadoop和关闭Hadoop的命令分别是( )
  89. 对HDFS通信协议的理解正确的是:( )
  90. JobTracker 主要包括哪三大功能?( )
  91. 以下哪个不是Hadoop的特性( )
  92. HDFS的命名空间不包含( )
  93. 以下对名称节点理解不正确的是( )
  94. 以下对数据节点理解不正确的是( )
  95. 以下哪个不是大数据时代新兴的技术( )
  96. 大数据产业指什么( )
  97. Hadoop 框架中最核心的设计是什么( )
温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(6) dxwkbang
返回
顶部