1. zookeeper集群使用的协议( )。

  2. 答案:ZAB协议
  3. 在spark生态组件中,哪个产品可用于复杂的批量数据处理( )。

  4. 答案:spark core
  5. 下列通常是集群最主要的瓶颈是:( )

  6. 答案:磁盘I/O
  7. 在ps命令中什么参数是用来显示所有用户的进程的?( )

  8. 答案:a
  9. 在Hadoop集群中,负责海量数据的存储和分析的组件是___B______。

  10. 答案:HBase
  11. ssh服务端的进程名为( )

  12. 答案:sshd
  13. 以下哪项不属于大数据思维的涵盖内容( ):

  14. 答案:通过采样的手段获取目标群体的统计特性
  15. Hadoop的NameNode负责____A_____。

  16. 答案:管理HDFS的数据块
  17. 关于ZKFC故障转移控制器,说法正确的是( )。A .当集群启动时,主备节点的概念是很模糊的,当ZKFC检查到任意一个节点是健康状态,直接将其设置为主节点。

  18. 答案:当zkfc检查到两个NN节点是健康状态,发起投票机制选出一个主节点,一个备用节点,并修改主备节点的状态。
  19. 显示一个文件最后几行的命令是:( )

  20. 答案:tail
  21. HDFS是Hadoop提供的_____A____。

  22. 答案:分布式文件系统
  23. 如何在文件中查找显示所有以"*"打头的行?( )
  24. 下面哪条命令可以把f1.txt复制为f2.txt?( )
  25. 关于hadoop MapReduce分片(split)的概念,下列说法不正确的是( )
  26. 在Hadoop中,可以使用___C______进行流式数据处理。
  27. 在Hadoop中,可以使用_____C____执行高级数据查询。
  28. HBase默认使用什么作为其底层文件存储系统?( )
  29. Zookeeper角色分配不包括( )
  30. 在Hadoop中,可以使用____C_____进行消息传递。
  31. 在思维方式方面,不是大数据显著影响的是( )。
  32. RDD可以从hadoop兼容的文件系统生成,生成之后通过调用RDD算子对RDD的数据进行部分更新。( )
  33. 在Hadoop集群中,HBase负责数据的增删改查。 ( )
  34. Hbase的最小存储单元不是Region而是一个Cell单元。( )
  35. 假设HDFS 在写入数据是只存 2 份,那么在写入过程中, HDFS Client 先将数据写入Datanode1,再将数据写入Datanode2。( )
  36. 对高价值高度聚合的信息和知识的批次处理是大数据行业主要商业诉求.( )
  37. Hadoop 集群具体来说包含两个集群:HDFS集群和YARN集群,两者逻辑上分离,但物理上常在一起( )
  38. 在Hadoop中,可以使用Kafka进行实时数据处理。 ( )
  39. 在HDFS NameNode中Fslmage中并没有记录具体的记录块在哪些数据节点上存储的,是通过数据节点和名称节点在运行时不断通过沟通而实时维护这些信息的, 而这些信息都是存储到内存单中去了。( )
  40. HBase中Compaction的目的是减少同一个Region,同一个ColumnFamily下的文件数目。( )
  41. Hadoop中的HDFS是用来处理非结构化数据的。 ( )
  42. Hadoop的NameNode负责存储HDFS的文件。 ( )
  43. 大数据不是万能的,所以我们要将大数据方法结合传统的推理预测方法,才得到一个更加精确的结果。( )
  44. HDFS系统不支持数据的修改。( )
  45. HDFS集群中的数据节点一般是一个节点运行一个数据节点进程,负责处理文件系统客户端的读/写请求,在名称节点的统一调度下进行数据块的创建、删除和复制等操作。( )
  46. 一个 Java 源程序文件中只能定义一个 public 类。( )
  47. spark是由C编程语言实现的。( )
  48. Yarn-client 和Yarn-cluster 主要区是Application Master 进程的区别.( )
  49. 使用Shell命令insert对HBase中的一张表进行数据添加操作。( )
  50. Spark 是基于内存的计算,所有 Spark 程序运行过程中的数据只能存储在内存中。( )
  51. 在Hadoop中,可以使用Flume进行消息传递。 ( )
  52. Hadoop是一种分布式计算平台。 ( )
  53. 对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。( )
  54. MapReduce是分布式并行计算框架,其计算模式属于流计算,实时性好。( )
  55. 因为HDFS有多个副本,所以NameNode是不存在单点问题的。( )
  56. Flume 传输数据过程中,sink 取走数据并写入目的地后,会将 event 从channe中刪除。( )
  57. HBase是Hadoop中的关系型数据库。 ( )
  58. Hadoop集群中的任务调度和资源管理是由HBase完成的。 ( )
  59. 每个 map 槽就是一个线程。( )
  60. Hadoop支持数据的随机写。( )
  61. Hadoop是一种关系型数据库。 ( )
  62. 配置Hadoop时,JAVA_HOME包含在( )
  63. 基于 Hadoop 开源大数据平台主要提供了针对数据分布式计算和存储能力,如下属于分布式存储组件的有( )。
  64. Hadoop 自身具有严格的权限管理和安全措施保障集群正常运行。( )
  65. Hadoop及其生态系统,可以部署在( )。
  66. Hadoop的三种安装模式包括以下哪种( )。
  67. Spark Streaming 计算基于DStream 将流式计算分解成一系列短小的批处理作业。( )
  68. spark 的 master 和 worker 通过什么方式进行通信的( )。
  69. Spark 任务的每个 stage 可划分为 job,划分的标记是 shuffle。( )
  70. Spark 任务的 Executor 可以执行多个 task。( )
  71. Spark 和 Hadoop 都不适用于迭代计算的场景。( )
  72. 下列不属于非关系型数据库的是( )。
  73. 以下属于Hive SQL 中DDL数据定义语言的是( )。
  74. Hive 是一种数据仓库处理工具,使用类sql 的HivesqlL 语言实现数据查询功能,所有Hive 的数据都存储在HDFS 中。( )
  75. Hive 中的这条命令“LOAD DATA LOCAL  INPATH '/opt/college/person.csv' OVERWRITE  into  table person;”是个什么类型的操作 (      )。
  76. HIVE的元数据可存储在哪里( )。
  77. Hive 中的这条命令“drop table person;”是什么含义(  )
  78. 关于hive 建表基本描述正确的是( )。
  79. 加载数据到 Hive 表,哪种方式不正确( )。
  80. 对hive中表数据操作描述正确的是( )。
  81. 对于Hive 中关于普通表和外部表描述不正确的是( )。
  82. Hadoop是当前大数据平台的事实标准,下列对Hadoop的描述中正确的是( )。
  83. MapReduce与HBase的关系,( )描述是正确的。
  84. MapReduce程序对数据的处理主要分为下列哪些过程( )。
  85. MapReduce 的 input split 一定是一个 block。( )
  86. Mapreduce 过程中,以下属于Shuffle 机制的是( )。
  87. HBase依赖( )技术框架提供消息通信机制。
  88. 下列( )选项是安装HBase前所必须安装的。
  89. Hadoop 的 HBase 主要特点有哪些( )
  90. HBase 的数据文件 HFile 中一个 Keyvalue 格式包含哪些信息( )。
  91. HBase系统用于记录Region相关信息的表,具体的表包含( )。
  92. 以下哪个不是HDFS的守护进程( )。
  93. 下列关于HDFS的描述正确的是( )
  94. HDfS中的block默认保存几份( )。
  95. 下列哪个属性是hdfs-site.xml中的配置( )。
  96. HDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是( )。
  97. Hadoop生态系统中,被作为ETL使用的软件是( )。
  98. Hadoop作为分布式计算技术的杰出代表,其主要特征包括( )。
  99. 以下命令组成错误的是( )。
  100. 想要修改集群的备份数量,可以修改哪个( )。
  101. 关于Hadoop单机模式和伪分布式模式的说法,正确的是( )。
  102. ( )在许多情况下,能够达到99.999%的可用性。
  103. 解压.tar.gz结尾的HBase压缩包使用的Linux命令是( )。
  104. 下列对大数据特点的说法中,错误的是( )。
  105. 大数据的战略意义是实现数据的增值。大数据的显著特征主要表现在:数据体量巨大、( )。
  106. 大数据与云计算之间的关系是( )。
  107. Hadoop平台构建项目重点内容( )。
温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(4) dxwkbang
返回
顶部