提示:内容已经过期谨慎付费,点击上方查看最新答案

农业大数据

  1. 考虑值集{12 24 33 2 4 55 68 26},其四分位数极差是:( )

  2. A:24 B:55 C:31 D:3
    答案:31
  3. 下列关于聚类挖掘技术的说法中,错误的是( )。

  4. A:要求同类数据的内容相似度尽可能小 B:要求不同类数据的内容相似度尽可能小与分类挖掘技术相似的是,都是要对数据进行分类处理 C:不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别
    答案:要求同类数据的内容相似度尽可能小AI参考:关于聚类挖掘技术,下列说法中错误的是B:要求不同类数据的内容相似度尽可能小。聚类挖掘技术是一种无监督的分类技术,它与分类挖掘技术相似,都是在对数据进行处理时,根据数据本身性质将数据自动分成不同的类别,不同类数据的内容相似度尽可能小与分类挖掘技术的分类要求是相反的。在聚类挖掘技术中,同类数据的内容相似度尽可能小,这样才能保证数据在各个类别中的聚集性。因此,B选项中的说法是错误的。'
  5. 什么是KDD? ( )

  6. A:数据挖掘与知识发现 B:动态知识发现 C:领域知识发现 D:文档知识发现
    AI参考:正确答案是A:数据挖掘与知识发现。KDD是数据挖掘与知识发现的简称,因此选项A正确。B、C、D选项都不符合KDD的含义。'
  7. 以下关于人工神经网络(ANN)的描述错误的有 ( )。

  8. A:至少含有一个隐藏层的多层神经网络 B:训练ANN是一个很耗时的过程 C:神经网络对训练数据中的噪声非常鲁棒 D:可以处理冗余特征
    答案:神经网络对训练数据中的噪声非常鲁棒
  9. HDFS1.0 默认 Block Size大小是多少( )。

  10. A:256MB B:64MB C:128MB D:32MB
    答案:64MB
  11. 美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的( )。

  12. A:在分析方法上更注重相关分析而不是因果分析 B:在分析效果上更追究效率而不是绝对精确 C:在数据基础上倾向于全体数据而不是抽样数据 D:在数据规模上强调相对数据而不是绝对数据
    答案:相关分析而非因果分析  
  13. 当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?( )

  14. A:关联分析 B:分类 C:聚类 D:隐马尔可夫链

  15. 下面哪个属于映射数据到新的空间的方法? ( )

  16. A:渐进抽样 B:维归约 C:特征加权 D:傅立叶变换

  17. 配置Hadoop时,JAVA_HOME包含在哪一个配置文件中( ) 。

  18. A:hadoop-env.sh B:hadoop-site.xml C:configuration.xs D:hadoop-default.xml

  19. 当前大数据技术的基础是由( )首先提出的。

  20. A:阿里巴巴 B:微软 C:百度 D:谷歌

  21. 当前社会中,最为突出的大数据环境是( )。

  22. A:自然资源 B:综合国力 C:物联网 D:互联网

  23. 下列关于普查的缺点的说法中,正确的是( )。 


  24. A:工作量较大,容易导致调查内容有限、产生重复和遗漏现象 B:误差不易被控制  C:评测结果不够稳定 D:对样本的依赖性比较强

  25. 大数据环境下的隐私担忧,主要表现为( )。


  26. A:病毒侵入 B:恶意广告的推送 C:用户画像的生成 D:个人信息的被识别与暴露

  27. 考虑这么一种情况:一个对象碰巧与另一个对象相对接近,但属于不同的类,因为这两个对象一般不会共享许多近邻,所以应该选择( )的相似度计算方法。

  28. A:余弦距离 B:直接相似度 C:平方欧几里德距离 D:共享最近邻

  29. 以下不属于“智慧地球”六大行动方案的是(  )


  30. A:智慧的城市 B:智慧的电力  C:智慧的教育  D:智慧的医疗
    AI参考:正确选项是【智慧的教育】。智慧地球的六大行动方案包括:智慧的城市、智慧的电力、智慧的医疗、智慧的交通、智慧的金融和智慧的教育。其中,智慧的教育主要关注教育信息化、智能化等方面的发展,通过利用物联网、大数据、云计算等信息技术,提高教育资源的利用效率,促进教育公平,提高教育质量。因此,智慧的教育不属于“智慧地球”的六大行动方案。'
  31. 以下哪些算法是分类算法( )?

  32. A:C4.5 B:EM C:DBSCAN D:K-Mean

  33. 以下是哪一个聚类算法的算法流程:①构造k-最近邻图。②使用多层图划分算法划分图。③repeat:合并关于相对互连性和相对接近性而言,最好地保持簇的自相似性的簇。④until:不再有可以合并的簇。( )。

  34. A:MST B:OPOSSUM C:Chameleon D:Jarvis-Patrick(JP)

  35. 关于K均值和DBSCAN的比较,以下说法不正确的是( )。

  36. A:K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇。 B:K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象。 C:K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念。 D:K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇。

  37. 概念分层图是 ( )图。

  38. A:有向无环 B:有向有环 C:无向有环 D:无向无环

  39. 使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务?( )

  40. A:建模描述 B:寻找模式和规则 C:预测建模 D:探索性数据分析

  41. 大数据人才整体上需要具备( )等核心知识。

  42. A:市场运营管理知识 B:马克思主义哲学知识 C:计算机相关知识 D:数学与统计知识 E:在特定业务领域的知识

  43. 大数据的应用能够实现一场新的革命,提高综合管理水平的原因是( )。

  44. A:从粗放化管理走向精细化管理 B:从被动反应走向主动预见型管理 C:从柜台式管理走向全天候管理 D:从单兵作战走向联合共享型管理

  45. 下面哪些属于可视化高维数据技术 ( )

  46. A:平行坐标系 B:散布图 C:矩阵 D:星形坐标 E:Chernoff脸

  47. 当前,大数据产业发展的特点是( )。

  48. A:规模较小 B:增速缓慢 C:规模较大 D:增速很快 E:多产业交叉融合

  49. 主流的服务器虚拟化技术包括( )。

  50. A:VirtualBox B:KVM C:Xen D:Hyper-V

  51. 通过数据挖掘过程所推倒出的关系和摘要经常被称为:( )

  52. A:模范 B:模具 C:模式 D:模型

  53. 数据挖掘的预测建模任务主要包括哪几大类问题? ( )

  54. A:回归 B:模式匹配 C:模式发现 D:分类

  55. 下面属于数据集的一般特性的有:( )

  56. A:相异性 B:维度 C:分辨率 D:连续性 E:稀疏性
    AI参考:正确选项为:ABDE。数据集的一般特性包括:1. 相异性:数据集中存在不同的个体或样本,具有不同的属性或特征,这是数据集的基本特性。2. 维度:数据集的维度指的是数据集的复杂程度,即数据集包含的属性或特征的数量。3. 连续性:数据集中的数值可以取任意值,没有离散值或缺失值,这是数据集的连续性特性。4. 稀疏性:在某些情况下,数据集中存在大量的空值或缺失值,这是数据集的稀疏性特性。选项C分辨率不属于数据集的一般特性。'
  57. 对于数据挖掘中的原始数据,存在的问题有: ( )

  58. A:维度高 B:含噪声 C:不一致 D:重复 E:不完整

  59. 在现实世界的数据中,元组在某些属性上缺少值是常有的。描述处理该问题的各种方法有: ( )

  60. A:使用一个全局常量填充空缺值 B:使用最可能的值填充空缺值 C:使用与给定元组属同一类的所有样本的平均值 D:使用属性的平均值填充空缺值 E:忽略元组

  61. 数据挖掘算法的组件包括:( )

  62. A:数据管理策略 B:评分函数 C:优化和搜索方法 D:模型或模型结构

  63. 在网络爬虫的爬行策略中,应用最为基础的是( )。

  64. A:反向链接策略 B:广度优先遍历策略 C:大站优先策略 D:深度优先遍历策略 E:高度优先遍历策略

  65. 贝叶斯信念网络(BBN)有如下哪些特点( )

  66. A:贝叶斯网络不适合处理不完整的数据 B:构造网络费时费力 C:对模型的过分问题非常鲁棒 D:网络结构确定后,添加变量相当麻烦

  67. 在评价不平衡类问题分类的度量方法有( )几种。

  68. A:F1度量 B:真正率(ture positive rate,TPR) C:召回率(recall) D:精度(precision)

  69. ( )都属于分裂的层次聚类算法。

  70. A:Chameleon B:二分K均值 C:MST D:组平均

  71. 图挖掘技术在社会网络分析中扮演了重要的角色。( )

  72. A:对 B:错

  73. 利用先验原理可以帮助减少频繁项集产生时需要探查的候选项个数。( )

  74. A:错 B:对

  75. 分类和回归都可用于预测,分类的输出是离散的类别值,而回归的输出是连续数值。( )

  76. A:错 B:对

  77. SVM是这样一个分类器,他寻找具有最小边缘的超平面,因此它也经常被称为最小边缘分类器(minimal margin classifier)。 ( )

  78. A:对 B:错

  79. 云计算就是软件在云端无所不在、无限强大的计算,也叫网络化计算或网格计算。( )

  80. A:对 B:错

  81. MapReduce计算过程中,相同的key默认会被发送到同一个reduce task处理。( )

  82. A:错 B:对

  83. 聚类分析可以看作是一种非监督的分类。( )

  84. A:错 B:对

  85. 商业智能系统与一般交易系统之间在系统设计上的主要区别在于:后者把结构强加于商务之上,一旦系统设计完毕,其程序和规则不会轻易改变;而前者则是一个学习型系统,能自动适应商务不断变化的要求。( )

  86. A:错 B:对

  87. DSS主要是基于数据仓库.联机数据分析和数据挖掘技术的应用。( )

  88. A:对 B:错

  89. 聚类(clustering)是这样的过程:它找出描述并区分数据类或概念的模型(或函数),以便能够使用模型预测类标记未知的对象类。 ( )

  90. A:对 B:错

  91. 噪声和伪像是数据错误这一相同表述的两种叫法。( )

  92. A:错 B:对

  93. Bayes法是一种在已知后验概率与类条件概率的情况下的模式分类方法,待分样本的分类结果取决于各类域中样本的全体。 ( )

  94. A:对 B:错

  95. 特征提取技术并不依赖于特定的领域。( )

  96. A:对 B:错

  97. 在噪声数据中,波动数据比离群点数据偏离整体水平更大。( )

  98. A:对 B:错

  99. 数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。 ( )

  100. A:错 B:对

温馨提示支付 ¥2.15 元后可查看付费内容,请先翻页预览!
点赞(1) dxwkbang
返回
顶部