- 大数据的计量单位已经越过TB级别发展到ZB,甚至更高的级别来衡量了。( )
- 使用Hadoop中的MapReduce编程模型非常简单,只需要定义好map和reduce函数的输入和输出键值对的类型即可。( )
- 关于hdfs元数据,Edits编辑日志中记录了文件系统的所有操作。( )
- 数据应用层主要采用了大数据采集技术,实现对数据的ETL操作。( )
- Map的主要工作是将多个任务的计算结果进行汇总。( )
- hive中包含数据库、表、分区、桶四类数据模型。( )
- MapReduce设计的一个理念就是“计算向数据靠拢”,而不是“数据向计算靠拢”,因为,移动数据需要大量的网络传输开销。( )
- 内部表的数据有Hive自身管理,外部表的数据有HDFS管理。( )
- Hadoop框架是用Java实现的,MapReduce应用程序则一定要用Java来写。( )
- Region服务器是HBase中最核心的模块。( )
- HDFS是整个Hadoop体系的基础,负责数据的存储与管理。( )
- Hadoop的核心主要是指HDFS和MapReduce。( )
- Client与HRegionServer进行数据读写类操作。( )
- Hive将元数据保存在关系数据库中,大大减少了在查询过程中执行语义检查的时间。( )
- HDFS是分布式文件系统,其命名空间包括块、目录和文件。( )
- HBase是四维坐标(即行键、列族、列、时间戳)定位数据。( )
- Hive中数据表info更名为info1,其实现命令如下:hive > alter table info rename to info1 ;( )
- Hive中show tables命令用来显示数据表名称。( )
- HDFS只设置唯一一个名称节点带来的局限性包括( )。
- 关于HBase特性,是下列选项中的哪些?( )
- 使用Apache Sqoop的主要好处有哪些?( )
- 以下( )属于Sqoop的命令。
- 下面关于Zookeeper功能的描述正确的是( )。
- 除了键入sqoop语法之外,还可以使用指定sqoop-(toolname)语法的别名脚本,sqoop提供了以下哪些脚本( )
- 关于HBase Region进行的管理控制,分别为下列中哪些选项?( )。
- 下面关于Hive存储的文件格式描述正确的是( )
- HDFS中的NameNode节点用于存放元数据,数据内容包含( )。
- Hive中向数据表添加数据的主要方式有( )。
- 下面关于Hive的索引描述不正确的是( )。
- MapReduce程序执行的阶段主要有:( )
- 在HBase中,关于Region描述,下列选项中哪些是正确的( )
- Hadoop MapReduce计算的流程是( )。
- 下列不属于Hadoop特点的是( )。
- 关于Sqoop的说法,不正确的是?( )
- 当Zookeeper的节点数据发生变更时,被触发的事件是( )。
- ( )是Zookeeper集群工作的核心,也是事务性请求(写操作)的唯一调度和处理者。
- Sqoop的底层实现是?( )
- Znode有两种类型,分别是( )和永久节点。
- Hive是由哪家公司开源的( )。
- 在Hadoop体系中,分布式文件系统是指( )
- Hive是为了解决哪类问题( )
- 大数据的文件系统是( )。
- MapReduce体系结构主要由TaskTracker、Task、JobTracker和( )组成。
- 在词频统计中,对于文本行"hello hadoop hello world",经过WordCount的Reduce函数处理后的结果是( )。
- 下列关于传统并行计算框架(比如MPI)和MapReduce并行计算框架比较错误的是( )。
- 下面哪个配置是在mapred-site、xml中配置的( )。
- shuffle和sort输出的key实现了下面哪个接口( )
- OutputFormat是MapReduce输出的基类,所有的MapReduce输出都实现OutputFormat接口。( )
- Sqoop本质上是使用MR程序进行数据迁移的工具。( )
- Hive中desc new_info命令用来显示当前数据表字段结构。( )
- 安装Hadoop时,配置项”dfs、replication”是配置在文件core-site、xml( )。
- HDFS集群开始启动时,其处于安全模式,可以进行读操作,不能进行写操作。( )
- 大数据技术是一系列技术的总称,它是集合了数据采集与传输、数据存储、数据处理与分析、数据挖掘、数据可视化等技术,是一个庞大而复杂的技术体系。( )
- Zookeeper的选举机制,实际上是采用算法FastLeaderElection,投票数大于半数则胜出的机制。( )
- 设置免密登录需要先用ssh-keygen生成一对密钥( )。
- Watcher事件类型(EventType)常见的表示事件类型枚举属性及属性含义( )
- 下列成员属于MapReduce体系结构中的有:( )
- Hadoop有3大核心组件分别是( )。
- YARN作为Hadoop的资源管理器,它的引入为集群带来了哪些好处?( )
- 下面关于Hive SQL编译描述不正确的是( )
- HDFS的适用性和局限性,以下说法正确的是( )。
- 以下对名称节点理解正确的是( )。
- Client使用HBase RPC机制与哪些组件进行通信?( )
- Watcher机制主要包括( )
- HDFS中第二名称节点的作用是( )。
- 端口9870默认是Hadoop3、X哪个服务的端口?( )。
- Zookeeper是由( )组成的树。
- HDFS集群采用主从结构,节点主要包括( )和数据节点。
- 如何查看sqoop命令列表?( )
- 对MapReduce的体系结构,以下说法错误的是( )。
- Sqoop的作用是?( )
- Sqoop中的( )命令是将数据导入到集群中。
- 在使用MapReduce程序WordCount进行词频统计时,对于文本行“hello hadoop hello world”,经过WordCount程序的Map函数处理后直接输出的中间结果,应该是下面哪种形式( )。
- 下列说法中,关于Zookeeper说法错误的是( )。
- HBase 语言大小写不敏感。( )
- 在Hadoop中每个应用程序被表示成一个作业,每个作业又被分成多个任务,JobTracker的负责作业的分解、状态监控以及资源管理。( )
- 非全新集群选举时是优中选优,保证Leader是Zookeeper集群中数据最完整、最可靠的一台服务器。( )
- Hive的数据库、表、分区在HDFS的表现形式是文件夹。( )
- 下列选项中,属于Zookeeper集群的角色有( )。
- Hive 中主要包括4 种数据模型,分别为哪些选项?( )。
- 以下( )哪些项属于sqoop2优点。
- HBase表的索引结构,包含下列哪些选项( )
- 关于HBase表的单元格描述,下面哪些是正确的( )
- 关于MapReduce过程中的split阶段,说法正确的是:( )
- 下面关于Hive内外表描述不正确的是( )
- 编写MapReduce程序时,下列叙述错误的是( )。
- 通过执行( )命令,查看该节点的Zookeeper角色
- HBase表中关于列族描述,下列选项哪个是不正确?( )
- 一旦NameNode关闭,就无法访问Hadoop集群的是( )
- sqoop安装完成后,查看sqoop版本的命令是?( )
- 如何查看当前sqoop中都有哪些job? ( )
- Znode的类型在创建时被指定,创建后仍能改变。( )
- HBase是面向行的存储模式。( )
- 关于MapReduce的shuffle过程,叙述正确的是( )。
- HBase的主要组件有3个,是下列选项中的哪些?( )
- 以下对数据节点理解正确的是( )。
- 格式化文件系统指令( )。
- 下列概念正确的有( )
- 下面哪些是MapReduce的计划的主要配置参数?( )
- 执行sqoop help会有以下哪些帮助项?( )
- Sqoop是连接传统关系型数据库和Hadoop的桥梁。包括( )两个方面。
- 当Zookeeper客户端连接认证失败,此时客户端和服务器的连接状态就是( )说明认证失败。
- 在实验集群的master节点使用jps命令查看进程时,终端出现以下哪项能说明Hadoop主节点启动成功? ( )
- Watch机制有4个特点:一次性触发、分布式锁、异步发送、先注册再触发( )
- 起初的Hadoop是使用Java语言开发的。( )
- Hadoop集群配置文件中,配置HDFS的属性的是以下哪一项( )。
- Client 端上传文件的时候下列哪项正确?( )
- Hive有什么好处( )
- HBase 是一个构建在Hadoop文件系统之上的面向列的数据库管理系统。( )
- 安装完全分布式Apache Hadoop的核心配置文件有?( )
- YARN主要负责大数据计算管理中的( )。
- 以下哪一项属于 Hadoop 可以运行的模式( )。
- 对HDFS内的文件进行操作,以下说法正确的是( )。
- hdfs系统不支持数据的修改。( )
- Sqoop的使用者需要以下哪些先决条件知识( )
- Zookeeper的顺序性主要分为两种,分别是( )和偏序。
- HBase表中单元格中的值是( )
- HDFS具有高延迟性。它不适用于低延迟的数据访问。( )
- HDFS与传统数据存储对比,主要特点包含( )。
- Zookeeper作为一个分布式应用提供一致性服务的软件,提供的功能( )
- Hadoop中,MapReduce负责提供对数据的计算结果的汇总的是( )。
- 以下( )属于Sqoop的特点。
- 传统关系型数据库数据定位是二维坐标,即行和列。( )
- –append参数是将数据追加到HDFS上一个已存在的数据集上。( )
- ResourceManager(RM)负责对各NodeManager上的资源进行统一管理和调度。( )。
- hadoopdfsadmin –report 命令用于检测HDFS损坏块。( )
- HQL语言大小写敏感,但内容分大小写。( )
- Hadoop环境变量中的HADOOP_HEAPSIZE用于设置所有 Hadoop守护线程的内存。它默认是200 GB。( )。
- HDFS有着高容错性的特点。( )
- 当客户端断开连接,此时客户端和服务器的连接就是SyncConnected状态,说明连接失败。( )
- 客户端连接HBase依赖于Zookeeper,HBase存储依赖于Hadoop Client。( )
- hcatalog是hive对外的一个统一存储格式的接口,使用hcatalog对接到hive的数据不需要担心数据在hive中的存储格式和存储位置。( )
- SQL语言大小写不敏感。( )
- Client与HMaster进行通信进行管理类操作( )
- HDFS的namenode保存了一个文件包括哪些数据块,分布在哪些数据节点上,这些信息也存储在硬盘上。( )
- Hive是数据库工具。( )
- drop 内部表时,会删除hdfs上的文件夹和元数据。( )
- 因为 HDFS 有多个副本,所以NameNode是不存在单点问题的。( )
- 大数据主要具有四个特征:即大量(Volume)、多样(Variety)、高速(Velocity)和价值(Value),也就是所谓的“4V”特征。( )
- Hadoop实现了一个分布式文件系统,简称HDFS。( )。
- Hadoop集群配置文件中配置Yarn运行所需的环境变量的是hdfs-site、xml。( )。
- 修改~/、bashrc文件保存后,修改的内容能立即生效( )。
- HBase通过行键、列族、列限定符和时间戳来确定一个单元格数据。( )
- Zookeeper具有全局数据一致性、高容错性、无序性、原子性以及实时性。( )
- SecondaryNameNode应与NameNode部署到一个节点( )。
- 查看Linux ip的命令是ifconfig( )。
- 由于Zookeeper集群的运行不需要Java环境支持,所以不需要提前安装JDK。( )
- InputFormat接口决定了输入文件如何被Hadoop分块。InputFormat能够从一个job中得到一个list集合。( )
- 两个键值对<“hello”,1>和<“hello”,1>x,如果对其进行归并(merge),会得到<“hello”,内容已经隐藏,点击付费后查看>,如果对其进行合并(combine),会得到<“hello”,2>。( )
- Zookeeper提供的getChildren()方法可以用于获取指定节点下的所有子节点列表。( )
- 数据收集层是大数据技术和应用的目标。通常包括信息检索、关联分析等功能。( )
- NameNode 本地磁盘保存了Block的位置信息。( )
- 在Hive进行表删除操作时,要区分内部表与外部表,下面描述正确的选项有哪些? 删除内部表时:。( )等。
- 选举机制类型( )
- 以下关于sqoop-import的作用描述正确的有( )
- 下面关于Hive数据模型描述正确的是( )
- Zookeeper采用了Watch机制来实现分布式数据的( )功能
- 在设置Linux环境中,关闭防火墙的代码有哪些( )。
- Yarn它主要由两大核心模块构成,分别是( )。
- Hadoop存储系统HDFS的体系结构的设计目标包含( )。
- 下面关于传统关系型数据库的特性描述,正确的有哪些?( )
- 下列关于hadoop集群启动中的所有进程及其作用,正确的有( )
- 第一代Hadoop存在的问题( )。
- 一个完整的mapreduce程序在分布式运行时有三类实例进程,是哪三个?( )
- 关于MapReduce程序,下列说法正确的有:( )
- 以下HDFS相关的shell命令不正确的是( )。
- 下列说法中,关于zoo.cfg配置文件中的参数server.1=hadoop01:2888:3888说法正确的是( )。
- Hive驱动器主要包括哪些选项?( )
- MapReduce中的JobTracker拆分为两个独立任务,这两个任务分别是( )。
- Zookeeper 使用 WatchedEvent 对象来封装服务端事件并传递。该对象包含了每个事件的( )基本属性
- 关于HBase表的列限定符描述,下面哪些是正确的( )
- YARN服务组件包括( )
- Hadoop的生态系统组件之—Sqoop的功能是?( )
- Sqoop工具是通过( )进行导入导出数据的。
- Zookeeper中的数据存储结构和标准文件系统非常类似,两者采用的层次结构是( )。
- Hadoop 集群的运行模式?( )。
- Hive与传统SQL数据库对比,下面描述不正确的是( )
- 为了保证Leader选举能够通过半数以上台服务器选举支持,因此Zookeeper集群搭建的服务器为( )。
- 下列哪个层主要采用了大数据采集技术,实现对数据的处理?( )
- 下面选项中,与Zookeeper功能类似的框架是( )?
- 下面中不属于Hive中的元数据信息( )
- 在默认情况下,HDFS块的大小为( )。
- 关于Hadoop MapReduce的叙述错误的是( )。
- 不是hadoop主要组成部分的是:( )。
- 从下列选项中,选择命令用于删除整行操作( )。
- 从下列选项中,选择命令以查询表中指定列( )
- 下列哪个程序通常与NameNode在一个节点启动? ( )。
- 下面关于Hive格式描述正确的是( )。
- 以下哪种不是 Hive支持的数据类型( )
- HBase是哪个技术的开源实现( )。
- 目前,Hadoop的最高版本是哪个?( )。
- NoSQL可划分为多种存储数据库,下列选项哪个不属于NoSql( )
- Hive的元数据存储在derby和 MySQL中有什么区别( )
- MapReduce为了保证任务的正常执行,采用重复执行和( )等多种容错机制。
- 下列用来存放部署Hadoop集群服务器的机架的是( )
- 以下哪种是HBase支持的数据类型( )
- 通过将以下什么工具与Hadoop集群整合后,可以查看Hadoop集群中每个Master/Slave节点的运行状态?( )。
- HBase是哪个公司开发的( )。
- 下面关于Hive和传统数据库的比较描述正确的是( )
- HBase依赖于Hadoop中的( )提供强大的计算能力。
- 下列对Sqoop描述正确的是?( )
- Sqoop实现向hdfs系统导入数据使用的命令是( )
- 下列选择参数是sqoop指令的是( )
- 关于Map和Reduce两个阶段描述正确的是( )。
- Sqoop不支持下列哪种数据库( )
- Map任务作为MapReduce工作流程的前半部分,它主要经历了5个阶段,分别是Copy阶段、Merge阶段、Sort阶段、Reduce阶段和Write阶段。( )
- Partition主要作用就是将map的结果发送到相应的reduce。这就对partition有两个要求( )。
- sqoop的迁移的方式就是把sqoop的迁移命令转换成( )
- HBase中的显示命名空间名称的命令是:list_namespace。( )
- 在HBase表中添加数据的命令,是下列选项中的哪个?( )
- 对HBase表中数据进行全表查看的命令,是下列选项中的哪个?( )
- HBase表名区分大小写,所有的字符串都必须包含在单引号里( )
- 在HBase表中按行键查询数据的命令,是下列选项中的哪个?( )
- HBase是一种键值类型的NoSql数据库 。( )
- HBase 依靠( )来存储底层数据的。
- 关于HBase的相关描述,下面哪些是正确的?( )
- 关于HBase的逻辑表描述,下面选项中正确的是( )
- HBase来源于IBM Bigtable ( )
- 下列关于Hive的描述,正确的有哪些?( )。
- Hive在删除内部表时,内部表的元数据被删除,数据本身不删除( )
- Hive能够用来进行海量数据的存储、查询和离线分析。( )
- HiveQL和SQL的一个不同之处在于Partition操作。( )
- Hive定义了简单的类似SQL的语言,称为( )。
- Hive是基于( )
- 从下列选项中,选出不是Hive基本类型的选项。( )
- 按粒度大小的顺序,Hive数据被分为数据库,数据表,分区和桶。( )
- Hive默认分桶的数量是( )。
- Hive是建立在( )之上的数据仓库。
- ZooKeeper是一个封闭源码的分布式应用程序协调服务,它是由Google的Chubby开源实现,是Hadoop和Hbase的重要组件。( )
- 下列选项中,用于获取Zookeeper所包含的信息的Shell命令是( )。
- Zookeeper中,Watcher机制的特点包含( )。
- 安装Hadoop时,发现50070对应的页面无法打开,可以通过下面哪个命令查看某个端口(TCP或UDP)是否在监听?( )
- Zookeeper特点 ( )
- Namenode在启动时自动进入安全模式,在安全模式阶段,说法错误的是( )
- 临时节点允许拥有子节点。( )
- 在Hadoop中负责运算的组件是( )
- Hadoop的框架最核心的设计就是:HDFS和MapReduce。( )
- HDFS为海量的数据提供了存储,而MapReduce为海量的数据提供了计算。( )
- 在MapReduce中,下面哪个阶段是并行进行的( )
- ReduceTask工作过程包含下面哪些阶段( )。
- 在Hadoop中,下面哪个是默认的InputFormat类型,它将每行内容作为新值,而将字节偏移量作为key( )
- 关于combiner描述正确的是( )。
- Map阶段,溢出的数据写入磁盘之前,线程会根据ReduceTask的数量进行数据分区,一个Reduce任务对应一个分区的数据。( )
- Google公司设计MapReduce的初衷主要是为了解决其搜索引擎中大规模网页数据的并行化处理。( )
- 在MapReduce中,下面哪个数据流的顺序是正确的( )
- 下列属于HDFS缺点的是( )
- HDFS对于服务器性能要求很高,必须构建在高成本的机器上。( )
- 下列属于HDFS集群的主服务器的是( )
- NameNode收到客户端的请求后,检查数据操作权限并判断上传的文件是否已存在,如果已存在,则拒绝客户端的上传。( )
- HDFS 中的block默认保存几个备份。( )
- HDFS是一个易于扩展的分布式文件系统。( )
- 命令hadoop fs -ls / 的功能是( )
- 下列不属于NameNode的功能的是( )
- 客户端向( )发出写文件请求?
- 在HDFS中,我们只能使用Shell命令来管理和操作文件系统。( )
- Hadoop 支持数据的随机读写。( )
- Hadoop配置文件所在目录是哪个?( )
- 下面哪个目录保存了Hadoop集群的命令(比如启动Hadoop)?( )
- Hadoop 默认调度器策略为FIFO ( )
- HDFS配置文件和配置Yarn运行所需的环境变量是以下哪两个文件( )
- 完成Hadoop集群主节点hadoop01的配置后,还需要将系统环境配置文件、JDK安装目录和Hadoop安装目录分发到其他子节点hadoop02和hadoop03上,具体指令( )
- Nagios不可以监控Hadoop集群,因为它不提供Hadoop支持。( )
- 下列哪个属性是hdfs-site.xml中的配置?( )
- 重启网卡服务是systemctl restart network( )
- Hadoop完全分布模式配置免密登录是要?( )
- 1、起初的Hadoop是什么语言开发的?( )
- 大数据处理分为两类:批量处理(即离线处理)和实时处理(即在线处理)。( )
- 下列( )是整个Hadoop体系的基础,负责数据的存储与管理?
- 数据的种类不仅包括文字、图片,还包含了视频、语音、地图定位信息、网络日志信息等。( )
- 下列哪个层主要采用了大数据采集技术,实现对数据的ETL操作?( )
- 下列属于Hadoop核心的是( )
- 怎样级别的数据称得上是海量数据?( )
- 大数据的“4V”特征是指什么( )
- HDFS是Hadoop的核心之一,主要实现分布式计算功能。( )
- Hadoop已经正式成为、Apache顶级开源项目,俨然已经处于大数据处理技术的核心地位。( )
- yarn集群是负责集群( )和运算资源管理的分布式集群。
- 目前典型的大数据文件系统有( )。
- 大数据存储是指把不同来源、不同格式及不同类型的大规模数据在逻辑上或物理上有机的集中,存储在分布式存储系统中,以提高数据的可靠性和可扩展性。( )
- 分布式数据存储策略可分为ACID和( )两类
- HDFS是一个( )
- mapreduce不是一个集群,而是一个编程框架( )
- Hadoop集群主要包含以上哪三个模块:( )
- mapreduce是一个分离再合并的集群。( )
- Hadoop集群旨在用于分布式计算环境中( )和分析大量非结构化数据。
- Hadoop集群具有很高的抗故障能力,因为每个数据块都复制到其他节点上,以确保在单个节点发生故障时不会丢失数据。 ( )
答案:对
答案:对
答案:错
答案:错
答案:错
答案:错
答案:对
答案:对
答案:错
答案:对
答案:对
温馨提示支付 ¥5.00 元后可查看付费内容,请先翻页预览!