- Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统。( )
- .Spark集群相比于Spark RDD API,Spark SQL对结构化数据的操作更加高效和方便。( )
- Spark on Yarn模式提交任务后,会依次进行6个过程:①启动SparkContext;②任务构建成DAG图;③executor向SparkContext进行注册;④向Yarn申请executor资源;⑤进行Stage划分与TaskSet生成;⑥Task发送给executor执行。( )
- Hadoop特Spark MLlib是机器学习的算法包,包含了机器学习的一些常用的算法和处理工具。( )
- YARN既是资源管理调度框架,也是一个计算框架。
- 第二名称节点(Secondary NameNode)是HDFS架构中的一个组成部分,它是用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间。( )
- .Hadoop的特点包括高可靠性、高扩展性、高效性、高容错性、高成本。( )
- 在一个基本的 Hadoop 集群中,DataNode 主要负责 存储被拆分的数据块?( )
- 在Hadoop中,安装完全分布式Apache Hadoop的核心配置文件有core-site.xml、hdfs-site.xml、yarn-site.xml和mapred-site.xml。( )
- Hadoop的两大核心是HDFS和MapReduce,HDFS用来存储数据,MapReduce用来处理数据。( )
- 分布式文件系统HDFS是谷歌分布式文件系统GFS(Google File System)的一种开源实现。( )
- Spark SQL目前暂时不支持Lisp语言( )
- 进行基于Hadoop的MapReduce编程环境配置时,必须要的步骤包括配置SSH、配置Java环境变量、配置Eclipse和配置Hadoop环境变量。( )
- Hive是一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储。( )
- Hadoop框架是用Java实现的,MapReduce应用程序则一定要用Java来写。
- Hadoop项目包括( )
- 下列关于Scala的说法正确的是:( )
- MapReduce 相较于传统的并行计算框架有什么优势?( )
- 下列说法中,哪些选项描述正确?( )
- 关于SecondaryNameNode的说法错误的是( )
- 下列关于传统并行计算框架(比如MPI)和MapReduce并行计算框架比较正确的是( )
- 对新一代资源管理调度框架YARN的理解正确的是:( )
- Spark支持的分布式布署方式中哪个是( )。
- 启动HDFS集群时,( )
- MapReduce 体系结构主要由以下那几部分构成?( )
- 在一个基本的 Hadoop 集群中,DataNode 主要负责什么( )
- 以下哪项不属于Hadoop运行的模式( )
- Spark中的Executor是( )
- 以下名词解释不正确的是( )
- Spark SQL目前暂时不支持下列哪种语言( )
- HDFS的优点不包括( )
- 在HDFS根目录下创建一个文件夹/test,且/test文件夹内还包含一个文件夹dir,正确的shell命令是( )
- 下列关于 Scala 特性的描述,错误的是哪一项?( )
- 下面哪个程序负责分布式文件系统HDFS的数据存储( )
- 在 Hadoop 生态系统中,Kafka 主要解决 Hadoop 中存在哪些的问题?( )
- HDFS中的文件块默认保存几份( )
- 以下哪项通常是搭建Hadoop集群面临的瓶颈( )
- 在 HDFS 中,NameNode 的主要功能是什么?( )
- 第三次信息化浪潮的标志是( )
- 在一个基本的 Hadoop 集群中,SecondaryNameNode 主要负责什么( )
- 以下不属于Hadoop生态圈的组件是( )
- 下列关于 MapReduce 工作流程,哪个描述是正确的( )
- 上传一个大小为500MB的文件data.txt,到Hadoop2.6搭建的集群上。这个文件会占用多少个HDFS文件块?( )。
- 以下哪些组件不是Hadoop的生态系统的组件( )
- 在 Hadoop 项目结构中,MapReduce 指的是什么( )
- Kafka中的最小消息单元是什么?( )
- Kafka的消费者可以在消费时指定从哪个偏移量开始消费消息,这个偏移量可以是: ( )
- Kafka使用什么作为消息的唯一标识符? ( )
- Kafka中的ISR是指什么? ( )
- Kafka的副本有什么作用? ( )
- Kafka支持哪些消息保证机制? ( )
- Flume主要用于哪些场景? ( )
- Flume Agent的三个核心组件是Source、Channel和Sink。 ( )
- Flume内部数据传输的基本单元是Byte。( )
- Flume中,用于存储数据的组件是什么?( )
- 设计Flume架构时,Sink组件的数据可以流向一个新的Agent的Channel组件。( )
- Flume中,可以使用哪个选项来指定配置文件的路径?( )
- Hive是一个基于Hadoop的数据仓库工具,依赖HDFS存储数据,依赖MapReduce处理数据。( )
- Hive不支持索引。( )
- 以下不属于Hive的复合数据类型是( )
- 下列选项中,修改数据表属性的语法格式中用于修改数据表属性操作的子句是 ( )
- 以下不属于Hive的原始数据类型是( )
- 下列对HBase的理解正确的是:( )
- 下列对HBase数据模型的描述错误的是( )
- 关于HBase Shell命令解释错误的是( )
- HBase是一个行式分布式数据库,是Hadoop生态系统中的一个组件( )
- HBase是一种什么数据库( )
- HBase和传统关系型数据库的区别在于哪些方面:( )
- MapReduce 的作业主要包括什么?( )
- Hadoop框架是用Java实现的,因此MapReduce应用也必须要用Java编程语言完成。( )
- Spark的计算模式也属于MapReduce,但编程模型比Hadoop MapReduce更灵活。( )
- MapReduce集群一般使用大量低端服务器,因此节点硬件失效和软件出错是常态。( )
- 在 MapReduce 工作流程中,所有的数据交换都是通过 MapReduce 框架自身去实现的( )
- 传当前目录下的本地文件file.txt到分布式文件系统HDFS的“/path”目录下的Shell命令是( )
- 在 Hadoop 项目结构中,HDFS 指的是什么( )
- 以下哪个命令无法用来操作HDFS文件( )
- 假设已经配置好环境变量,启动Hadoop和关闭Hadoop的命令分别是( )
- 对HDFS通信协议的理解正确的是:( )
- JobTracker 主要包括哪三大功能?( )
- 以下哪个不是Hadoop的特性( )
- HDFS的命名空间不包含( )
- 以下对名称节点理解不正确的是( )
- 以下对数据节点理解不正确的是( )
- 以下哪个不是大数据时代新兴的技术( )
- 大数据产业指什么( )
- Hadoop 框架中最核心的设计是什么( )
答案:对
答案:对
答案:错
答案:对
答案:错
答案:对
答案:错
答案:对
答案:对
答案:对
答案:对
温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!