提示:内容已经过期谨慎付费,点击上方查看最新答案

林业大数据与人工智能

  1. 以下哪一个组件负责Hadoop协作服务?( )

  2. A:HBase B:Zookeeper C:YARN D:MapReduce
    AI参考:选项 B:Zookeeper 负责Hadoop协作服务。Zookeeper是一个为分布式应用提供协作服务的组件,它用于维护集群中的配置信息、提供服务发现和协调服务。在Hadoop生态系统中,Zookeeper被广泛应用于协同资源管理、任务分配、数据一致性等方面。它与Hadoop的其他组件如YARN、HDFS、MapReduce等有良好的交互性。因此,正确答案是B:Zookeeper。'
  3. 在实验集群的master节点使用jps命令查看进程时,终端出现以下哪项能说明Hadoop主节点启动成功?( )

  4. A:Namenode,Datanode, secondaryNameNode B:Namenode,JobTracker, secondaryNameNode C:Namenode,Datanode, TaskTracker D:Namenode,Datanode, HMaster
    答案:Namenode,JobTracker,secondaryNameNode
  5. Hadoop是由什么语言实现的?( )。

  6. A:Python B:Perl C:C语言 D:Java
    答案:JavaAI参考:答案:D:Java。Hadoop是一个用Java实现的分布式计算系统,用于存储、处理和分析大规模数据集。Python、Perl和C语言虽然也可以编写类似的分布式计算系统,但它们并不是Hadoop的原始实现语言。因此,答案为D。'
  7. 设计分布式数据仓库hive的数据表时,为取样更高效,一般可以对表中的连续字段进行( )操作。

  8. A:分桶 B:索引 C:分区 D:分表
    答案:分桶
  9. 以下哪项内容不属于HDFS中划分的系统节点角色?( )

  10. A:数据节点(DataNode) B:GateWay(网关) C:名称节点(NameNode) D:Client(客户端)
    AI参考:正确选项是:D:Client(客户端)。HDFS中划分的系统节点角色包括数据节点(DataNode)、名称节点(NameNode)和网关(GateWay)。数据节点负责存储数据,名称节点负责管理文件系统命名空间和数据块的元数据。客户端是用于与HDFS进行交互的程序或系统,但它不属于划分的系统节点角色。因此,选项D是正确的答案。'
  11. 大数据时代,数据使用的关键是( )。

  12. A:数据分析 B:数据再利用 C:数据收集 D:数据存储
    答案:数据再利用
  13. 8GFS是( )。

  14. A:Group File System B:Google File System C:Groud Filter System D:Good File System
    AI参考:正确答案是B:Google File System。8GFS是Google开发的通用分布式文件系统,故选B。'
  15. HBase数据库的BlockCache缓存的数据块中,哪一项不一定能提高效率? ( )

  16. A:表 B:HFile index C:–ROOT–表 D:.MET E:普通的数据块
    AI参考:正确答案是:C:–ROOT–表。HBase数据库的BlockCache缓存的数据块中,表、HFile index、.META和普通的数据块都能提高效率,因为它们都是缓存数据的一部分,可以提高访问速度和效率。但是,–ROOT–表并不一定是缓存的一部分,因此不能提高效率。它主要用于维护和管理HBase的元数据,通常不是直接用于存储数据块的表。因此,答案是C:–ROOT–表。'
  17. Hadoop2.x默认数据块大小为( )。

  18. A:64M B:32M C:256M D:128M
    AI参考:正确答案是D:128M。Hadoop2.x默认数据块大小为128MB。因此,答案为D。'
  19. 大数据元年是( )2013被称为大数据元年:数据就是资源。

  20. A:2012 B:2013 C:2010 D:2011
    AI参考:正确答案是B:2013。大数据元年是2013年。数据就是资源,数据挖掘和数据分析成为了企业竞争的重要手段之一。在大数据时代,数据已经成为了企业决策的重要依据,企业需要不断地挖掘和分析数据,以获取更多的商业机会和竞争优势。因此,大数据元年被定义为大数据技术应用和商业实践的开始之年。'
  21. 大数据采集过程中,针对数据质量问题按数据源的多少和所属层次,可以分为( )。

  22. A:多数据源实例层 B:单数据源定义层 C:多数据源定义层 D:单数据源实例层
    AI参考:正确选项为【多数据源定义层】。在大数据采集过程中,针对数据质量问题,可以按照数据源的多少和所属层次,将其分为单数据源定义层和多数据源定义层。其中,单数据源定义层是指只有一个数据源的数据层,通常用于描述某个特定领域或场景下的数据集;而多数据源定义层则是指由多个数据源共同构成的数据层,这些数据源可能来自不同的领域或场景,具有不同的数据格式和质量标准。因此,在大数据采集过程中,针对数据质量问题,需要根据数据源的多少和所属层次,选择合适的分类方式,以便更好地管理和利用数据。'
  23. 三次信息化浪潮的标志分别是( )。

  24. A:微型计算机 B:人工智能 C:互联网 D:云计算、大数据、物联网
    AI参考:正确选项为:互联网、云计算、大数据、物联网。三次信息化浪潮的标志分别是互联网、云计算、大数据和物联网。第一次信息化浪潮是以计算机的普及应用为标志,实现了信息处理的高效化和自动化;第二次信息化浪潮是以数据库技术的成熟为标志,实现了信息的存储和管理;第三次信息化浪潮则是以互联网、云计算、大数据和物联网等技术的广泛应用为标志,实现了信息的共享和互联互通,使得信息传递更加快速和便捷。因此,选项C、D是正确的。而选项A和B虽然也是信息化浪潮的重要标志之一,但它们并不是三次信息化浪潮的标志。'
  25. 常用的系统日志的采集工具有( )。

  26. A:Scribe B:Chukwa C:Kafaka • E MQ D:Flume
    AI参考:正确答案是:ABD。常用的系统日志采集工具有Scribe、Flume、Chukwa、Kafka等。1. Scribe:是Google开发的一个分布式日志收集系统,用于收集分布在各个节点上的日志数据,然后发送到日志中心进行统一处理。2. Flume:是一个分布式的日志收集系统,可以将分布在系统各节点上的数据日志收集到一个中央目录中。3. Chukwa:Apache开源的一个用于大数据环境的监控系统,能够有效地处理大型分布式系统的实时日志和跟踪信息,用来收集、组织并解析日志信息,并通过图形化界面提供实时的系统监控和历史数据分析。4. Kafka:是一个高吞吐量的分布式发布订阅消息系统,它可以处理消费者在网站中的所有动作流数据。因此,本题答案为ABD选项。'
  27. 数据再利用的意义在于( )。

  28. A:实现数据重组的创新价值 B:利用数据可扩展性拓宽业务领域 C:挖掘数据的潜在价值 D:优化存储设备、降低设备成本
    AI参考:正确选项为ABCD。数据再利用的意义在于实现数据重组的创新价值、利用数据可扩展性拓宽业务领域、挖掘数据的潜在价值、优化存储设备、降低设备成本。通过数据再利用,可以发现数据的潜在价值,提高数据的利用率,从而为企业带来更多的收益和价值。同时,数据再利用还可以优化存储设备,降低设备成本,提高企业的经济效益。因此,ABCD都是数据再利用的意义所在。'
  29. Yarn的主要思想是将MRv1版Job Tracker的哪两大功能拆分成哪两个独立的进程?( )

  30. A:系统管理 B:资源管理 C:安全管理 D:任务调度
    AI参考:正确答案是【B、资源管理】和【D、任务调度】。Yarn的主要思想是将MRv1版Job Tracker的资源管理和任务调度两大功能拆分成两个独立的进程。因此,选项B和D是正确的答案。选项A和C不是Yarn的主要思想,而是与其相关的其他功能或安全措施。'
  31. 下列关于脏数据的说法中,正确的是( )。

  32. A:编码不统一 B:格式不规范 C:数据不完整 D:意义不明确 E:与实际业务关系不大
    AI参考:正确答案是:ABCDE。脏数据(Dirty Data)是应用程序或系统在使用或传输数据时由于多种原因导致的无法正确处理或被正确使用,以及用户使用过程中出现的一系列问题数据。因此,脏数据包括编码不统一、格式不规范、数据不完整、意义不明确、与实际业务关系不大等选项。ABCDE均为正确选项。需要注意的是,实际业务中往往根据不同的需求进行适当的判断,而非固定标准。故此答案为ABCDE均为正确选项。'
  33. 大数据预处理的过程包括( )。

  34. A:数据规约 B:数据转换 C:数据清洗 D:数据集成 E:数据集市
    AI参考:正确选项为:A、B、C。大数据预处理的过程包括数据规约、数据转换和数据清洗,主要目的是消除数据中的重复信息、纠正数据中的错误、去除噪声和缺失值等,从而为数据的进一步分析和挖掘提供高质量的数据基础。而数据集成、数据集市不是大数据预处理的过程。因此,正确选项为A、B、C。D选项“数据集成”在大数据处理中不是核心环节,一般仅作为数据处理流程中的一部分,主要用于合并或抽取不同的数据源,提高数据的一致性和完整性。E选项“数据集市”主要用于满足特定需求的数据分析,并不是大数据预处理的核心过程。因此,选项A、B、C为正确选项。'
  35. Hadoop主要解决 ( )。

  36. A:海量数据存储 B:海量数据加载 C:海量数据分析 D:海量数据清洗
    AI参考:正确选项为A、C。Hadoop是一个分布式计算框架,主要用于处理海量的数据存储和数据分析,而不需要预先对数据进行清洗。因此,选项B和D虽然也是Hadoop的应用场景之一,但不是其主要解决的问题。'
  37. 大数据的主要来源包括( )。

  38. A:科学实验系统 B:车联网系统你 C:信息管理系统 D:物联网系统 E:网络信息系统
    AI参考:正确选项为:D、物联网系统、E、网络信息系统。大数据的主要来源包括物联网系统、网络信息系统等。这些系统可以产生大量的数据,通过分析和处理这些数据,可以发现新的知识,提升效率,优化决策。其他选项如科学实验系统、信息管理系统等也可以产生数据,但它们的数据量相对较小,不是大数据的主要来源。因此,答案为D、物联网系统、E、网络信息系统。'
  39. 互联网数据具有的特点有( )。

  40. A:实时化 B:多样化 C:大量化 D:集中化 E:快速化
    AI参考:互联网数据具有的特点有:实时化、多样化、大量化、快速化。选项中,实时化、多样化、快速化都符合互联网数据的特点。而集中化通常用于描述数据存储和处理的方式,与互联网数据的自然特点关系不大。因此,选项B、C、E是正确答案。'
  41. Hadoop 支持数据的随机读写。(hbase支持,hadoop不支持)。( )

  42. A:错 B:对
    答案:错误
  43. Storm属于大数据计算模式批处理计算计算中的一种。( )

  44. A:对 B:错
    AI参考:答案:B:错。Storm属于大数据计算模式中的实时计算,它不用于批处理计算。所以Storm不属于批处理计算计算中的一种。'
  45. MapReduce计算过程中,相同的key默认会被发送到同一个reduce task处理。( )

  46. A:对 B:错
    答案:正确
  47. 链式MapReduce计算中,对任意一个MapReduce作业,Map和Reduce阶段可以有无限个Mapper,但Reducer只能有一个。( )

  48. A:错 B:对
    答案:对
  49. MapReduce 的 input split 一定是一个 block。 ( )

  50. A:对 B:错
    答案:错误
  51. “刷脸”技术是人工智能与大数据的典型结合案例。


  52. A:对 B:错
    AI参考:正确答案是B:错。刷脸技术主要是基于人脸识别技术,而人脸识别技术主要是通过图像处理和模式识别来实现的,与大数据和人工智能关系不大。因此,“刷脸”技术不是人工智能与大数据的典型结合案例。'
  53. HDFS的缺陷是低延迟数据访问、大文件存取和并发写入/文件随机修改。 ( )

  54. A:对 B:错
    AI参考:答案是B:错。HDFS的缺陷不是低延迟数据访问、大文件存取和并发写入/文件随机修改。HDFS的主要缺陷包括:1. 写入者无法控制读取者的访问权限,导致数据安全性较差。2. 大文件或大量数据的存储会导致节点存储和计算压力过大,可能导致节点性能下降甚至宕机。3. 只能按照文件名进行定位,不能按数据块定位,不适合处理大规模小文件的存储和访问。4. HDFS集群中任一NameNode失效都会导致整个集群不可用,扩展性差。因此,不能说HDFS的缺陷是低延迟数据访问、大文件存取和并发写入/文件随机修改。所以,这个说法是错误的。'
  55. 私有云的数据中心由第三方的云计算供应商提供,供应商帮助企业管理基础设施(例如硬件,网络,等等)。( )

  56. A:对 B:错
    AI参考:答案是B:错。私有云的数据中心通常由企业自己管理,而不是由第三方云计算供应商提供和管理基础设施。私有云通常用于企业内部的数据中心,以提供安全、可控的计算和存储资源。供应商可能提供云服务,但通常只是提供软件和工具,帮助企业管理和使用这些资源。因此,这个陈述是不准确的。'
  57. 在修改ntp的配置文件中,不可以修改授权本网段的访问权限。


  58. A:错 B:对
    AI参考:答案是【B:对】。在修改ntp的配置文件中,通常可以修改授权本网段的访问权限,以允许该网段内的设备访问ntp服务器。因此,这个说法是正确的。'
  59. HBase对于空(NULL)的列,不需要占用存储空间。( )

  60. A:对 B:错
    答案:错误
  61. 物联网的核心和基础是互联网( )

  62. A:对 B:错
    答案:互联网AI参考:物联网的核心和基础是互联网,这个说法是正确的。物联网(IoT)是一个基于互联网的连接设备网络,通过这些设备,物体可以与互联网进行通信,交换数据和信息。因此,物联网的核心和基础确实是互联网。答案是A:“对”。'
  63. hadoop已经发展了三个版本,第二、三个版本最大的特色是增加了YARN及NameNode HA?( )

  64. A:错 B:对
    AI参考:答案:B。Hadoop发展至今,已经历了三个版本,分别为Hadoop 0.2.X版本、Hadoop 1.0版本以及当前的Hadoop 2.0版本。在Hadoop 2.0版本中,新增了YARN(Yet Another Resource Negotiator,一种用于处理各种计算资源分配和管理的框架),而NameNode HA(High Availability,NameNode的高可用性)也得到了加强。因此,第二、三个版本最大的特色是增加了YARN及NameNode HA。所以这道题的答案是B,是对的。'
  65. Hive支持多种不同长度的整型和浮点型数据类型,不支持布尔类型。( )

  66. A:错 B:对
    AI参考:B:对Hive支持多种不同长度的整型和浮点型数据类型,包括int、bigint、smallint、float、double等,但不支持布尔类型。因此,本题判断正确,答案为B。'
  67. MapReduce适于PB级别以上的海量数据在线处理。( )

  68. A:错 B:对
    答案:错
  69. Hadoop是一个Apache基金会开发的分布式系统基础架构。( )

  70. A:错 B:对
    答案:Hadoop
  71. Spark属于大数据计算模式批处理计算计算中的一种。( )

  72. A:错 B:对
    AI参考:答案:B:对。Spark是一种大数据计算模式,属于大数据计算中的一种,可以进行批处理计算。'
  73. 大数据未来发展趋势,包括数据资源化。( )

  74. A:错 B:对
    答案:数据生态系统复合化程度加强;基于大数据的智能化;与云计算.物联网的深度结合;数据的资源化AI参考:答案是B:对。大数据未来发展趋势包括数据资源化,这是大数据领域的一个重要趋势。随着数据量的不断增加和数据类型的不断丰富,大数据正在逐渐成为企业和社会的重要资源,被广泛应用于各个领域,如金融、医疗、教育、交通等。因此,大数据未来发展趋势是数据资源化,选项B是正确的。选项A则与此不符,因此是错误的。'
  75. HDFS的全称是Hadoop Distributed File System,是一个分布式文件存储系统。( )

  76. A:错 B:对
    答案:流式数据访问
  77. 微软的Bing,Windows Live,Microsoft Business Productivity Online等产品属于软件即服务(SaaS)类型。 ( )

  78. A:错 B:对
    答案:邮件客户端AI参考:答案是B:对。微软的Bing搜索引擎、Windows Live套件和Microsoft Business Productivity Online等产品都是基于云计算的服务,属于软件即服务(SaaS)类型。这些服务通过互联网提供软件应用,用户无需购买和安装软件,只需通过网络访问即可使用。因此,这个问题的答案是肯定的,即正确选项为B。'
  79. Hive属于大数据计算模式图计算中的一种。( )

  80. A:错 B:对
    AI参考:答案是B:对。Hive是一种基于Hadoop的数据仓库工具,用于大规模数据的处理和查询。它基于Hadoop的MapReduce框架进行分布式计算,能够处理大规模数据集,并且具有易用的SQL-like查询语言。因此,Hive属于大数据计算模式图计算中的一种。'

点赞(1) dxwkbang
返回
顶部