1. 如果某一变量的无效值和缺失值很多,而且该变量对于所研究的问题不是特别重要,则可以考虑将该变量删除。

  2. 答案:对
  3. 现代的人工智能已经具备了像国际象棋大师们洞察棋局的能力。

  4. 答案:错
  5. 池化层的一个主要作用是缓解卷积层对位置的过度敏感性。

  6. 答案:对
  7. 特征空间上的间隔最大的线性分类器只有一个。

  8. 答案:对
  9. 在AlhpaGo中,落子决策网络通过每个落子后可能的结局预测下一步应该落在哪个位置胜率更大。

  10. 答案:对
  11. 多元回归分析预测法,是指通过对两个或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。

  12. 答案:对
  13. Stacking 通常考虑的是异质弱学习器(不同的学习算法被组合在一起),而bagging 和 boosting 主要考虑的是同质弱学习器。

  14. 答案:对
  15. Apriori算法具有这样一条性质:任一频繁项集的所有非空子集也必须是频繁的。

  16. 答案:对
  17. 符号计算是一种智能化的计算,处理的是符号。

  18. 答案:对
  19. 所有的程序都需要深度学习技术。

  20. 答案:错
  21. 遗传算法中个体就是模拟生物个体而对问题中的对象(一般就是问题的解)的一种称呼,一个个体也就是搜索空间中的一个点。

  22. 答案:对
  23. 池化层的输出通道数跟输入通道数相同。
  24. 人工智能的目标是希望计算机拥有像人一样的智力能力,可以替代人类实现识别、认知、分类和决策等多种功能。
  25. HDFS是一个并行处理大数据集的编程模型。
  26. 机器学习模型建立过程其实是一个参数学习与调优的过程。
  27. 人脸识别可以应用在安防领域。
  28. 基于层次的聚类算法包括( )。
  29. MapReduce分布式并行编程使程序员只关注( )的实现。
  30. Apriori算法采用( )方式来找出所有的频繁项集。
  31. 对数据对象之间的相似性进行衡量,基本分为( )。
  32. 一元线性回归的显著性检验包括( )。
  33. 特征选择的方法包括( )。
  34. K-Means算法的计算步骤包括( )。
  35. 对于企业存储设备而言,根据存储实现方式,可将数据存储划分为( )。
  36. 无参的特征值归约包括( )。
  37. 参入mapreduce作业执行涉及的独立实体b包括( )。
  38. 将数据转换或统一呈适合于挖掘的形式,涉及的内容包括( )。
  39. 将目标函数转换成适应度函数一般应遵循的原则包括( )。
  40. 代替无效值和缺失值的最简单方法包括( )。
  41. 常用的分类算法包括( )。
  42. 遗传算法中首要解决的问题( )。
  43. ( )是一种采用局部最优策略的决策树构建算法,它同时也是许多决策树算法的基础。
  44. ( )特点是数据占据存储空间大,在网络的传输中占据大量带宽资源。
  45. LDA是一种( )的降维技术,也就是说它的数据集的每个样本是有类别输出的。
  46. Combiner和Reducer类都指向继承于Reducer的内部类( )。
  47. ( )通常考虑的是异质弱学习器,并行地学习它们,并通过训练一个元模型将它们组合起来,根据不同弱模型的预测结果输出一个最终的预测结果。
  48. 网络附加存储的英文缩写是(    )。
  49. 决策树学习的关键一步是( )。
  50. VGG构建深度模型是通过重复使用( )。
  51. C4.5决策树学习算法以( )为准则划分属性。
  52. ( )相当于高维空间中向量所表示的点与点之间的距离。
  53. 早期的数据在企业数据的语境里,主要是( )。
  54. 人工智能最基本的研究内容( )。
  55. ( )采用自顶向下的方法,从一个包含全部数据点的聚类开始,将根结点分裂成一些子聚类,每个子聚类再递归向下分裂,知道出现只有一个数据点的单结点聚类出现(每个聚类只含有一个数据点)为止。
  56. 在实例中用于训练svm模型的函数是( )。
  57. 利用自然语言处理人工智能方法可实现电子病历非结构化智能信息提取。
  58. 医疗人工智能快速发展的要素包括()。
  59. 医疗大数据的独有特性包括()。
  60. 医院综合信息应用平台可实现()。
  61. 基于医院大数据中心,可实现数据共享和挖掘应用。
  62. 对于商品数量多、出货频率快的物流中心,()就意味着工作效率和效益。
  63. 前置仓的市场定位,是()之间的市场空白。
  64. 智慧物流是以互联网+为核心,以物联网、大数据、()及“三网融合”等为技术支撑的。
  65. 前置仓优点包括()。
  66. 前置仓缺点包括()。
  67. D.W检验就是误差序列的自相关检验。
  68. 皮尔森相关系数是一种最简单的,能帮助理解特征和响应变量之间关系的方法,该方法衡量的是变量之间的非线性相关性。
  69. 集成性特性是数据仓库和操作型数据库的根本区别。
  70. 聚类是发现数据集中数据之间的相关关系,对数据进行分组,组内的相似性越小,组间的差别越大,则聚类的效果越差。
  71. 特征选择是选取已有属性的子集来进行建模的一种方式。
  72. 多元分类希望预测的目标有多个选项,好像在做选择题。
  73. 集成性是指数据仓库会将不同来源数据库中的数据汇总到一起。
  74. 回归分析希望预测的目标是连续的值,好像在做计算题。
  75. 填充可以增加输出的高和宽,常用来使输出与输入具有相同的高和宽。
  76. 旨在组合弱学习器的元算法包括( )。
  77. AlphaGo 主要分为两大部分,分别是( )。
  78. 常用的数据采集方法包括( )。
  79. 最初提出的AS版本包括( )。
  80. 遗传算法中常见的交叉操作主要有以下几种( )。
  81. 数据规约包括( )。
  82. 特征选择的目的(   )。
  83. 相似系数度量包含( )。
  84. 遗传算法有以下优点( )。
  85. ( )是一种消极学习方法,它不需要建立模型,然而测试样例的开销很大,因为需要逐个计算测试样例和训练样例之间的相似度。
  86. ( )思想是通过将这些弱学习器的偏置和/或方差结合起来,从而创建一个强学习器,从而获得更好的性能。
  87. ( )方法的思想是对每一维特征“打分”,即给每一维的特征赋予权重,这样的权重就代表着该特征的重要性,然后依据权重排序。
  88. 音频数据比较具有代表性的是( )格式的数据
  89. ( )是一种数据分析形式,它提取刻画重要数据类的模型。
  90. ( )是指在决策树生成过程中,对每个结点在划分前进行估计,若当前结点的划分不能带来决策树泛化性能的提升,则停止划分并将当前结点标记为叶结点。
  91. 蚁群算法是随机搜索算法。
  92. Computer => antivirus_software , 其中 support=2%, confidence=60%,表示的意思是所有的商品交易中有2%的顾客买了电脑,并且购买电脑的顾客中有60%也购买了杀毒软件。
  93. 蚁群算法执行过程中,核心操作步骤是更新信息素。
  94. 数据可视化是指把数据通过直观的可视化的方式展示给用户。
  95. 二元分类属于有监督学习。
  96. 遗传算法中种群就是模拟生物种群而由若干个体组成的群体,它一般是整个搜索空间的一个很小的子集。
  97. 感知与交流是指计算机对外部信息的直接感知和人机之间、智能体之间的直接信息交流。
  98. 深度学习无法自动将简单特征组合成复杂特征。
  99. PCA 原理中,找出第一个主成分的方向,也就是数据方差最大的方向。
  100. 填充是在输入四个角的位置填充元素255。
  101. 机器翻译无法表达出人类独有的感情。
  102. 两个等长的字符串s1和s2之间的汉明距离定义为将其中一个变为另一个所需要做的最小替换次数。
  103. 数据工程是指面向不同计算平台和应用环境,使用信息系统设计开发和评价的工程化技术和方法。
  104. 基尼系数越小,则数据集D的纯度越高。
  105. 皮尔森相关系数方法衡量的是变量之间的线性相关性。
  106. 由于Apriori算法使用逐层搜索技术,给定候选k项集后,只需检查它们的(k-1)个子集是否频繁。
  107. 机器翻译是利用计算机把一种自然语言转变成另一种自然语言的过程,用以完成这一过程的软件系统叫做机器翻译系统。
  108. 线性判别式分析也叫做Fisher线性判别。
  109. 一个像素由红绿蓝三个值构成。
  110. 最大池化取池化窗口中输入元素的最大值作为输出。
  111. 数据可视化技术基本概念包括( )。
  112. 数据平滑技术包括( )。
  113. 下列选项属于语音识别的主要应用的是( )。
  114. 深度学习在自然语言处理应用的应用有( )。
  115. Hadoop的运行模式包括( )。
  116. 人工智能的研究领域包括( )。
  117. 理解大数据的层面包括( )。
  118. 分类规则的质量可以用( )来度量。
  119. 属于模拟人脑的机器学习的方法是( )。
  120. 人脸识别的应用领域可以是( )。
  121. 生成对抗网络的应用领域有( )。
  122. Hadoop 生态圈的组件包括(   )。
  123. 机器学习模型在部署前需要经过两个部分的工作( )。
  124. 遗传算法中常见的变异操作主要有以下几种( )。
  125. 数据降维主要目的包括( )。
  126. 特征分类包括( )。
  127. 有监督学习的分类( )。
  128. 处理缺失值的方法包括( )。
  129. 机器学习中常见的算法( )。
  130. 特征归约的步骤包括( )。
  131. 一元线性回归平方和占总平方和的比例称为( )。
  132. ( )是决策树学习算法中对付“过拟合”的主要手段。
  133. 人工智能的英文缩写是( )。
  134. 借助某种存储工具或媒介对采集到的数据进行持久化的保存是指( )。
  135. 大部分自然科学的本质( )。
  136. 蚁群算法的英文缩写是( )。
  137. 在降维技术方面,PCA的中文含义是( )。
  138. 在实例中可用于读入数据文件的函数是( )。
  139. ( )是一种构建分类模型的非参数方法。换句话说,它不要求任何先验假设,不假定类和其他的属性服从一定的概率分布。
  140. 定义支持商业流程所需要的数据要求的过程( )。
  141. ( )是HDFS中的工作节点,它负责存储数据块。
  142. ( )是认知的必经途径,也是被广泛认同和传播的基线。
  143. 大数据的英文缩写是( )。
  144. ( )方法的思想是在模型既定的情况下学习出对提高模型准确性最好的特征。也就是在确定模型的过程中,挑选出那些对模型的训练有重要意义的特征。
  145. 在一元线性回归中y的取值的波动称为( )。
  146. ( )提供了一种用图形模型来捕获特定领域的先验知识的方法。
  147. 在大数据组成中,数据的主要部分是( )。
  148. ID3决策树学习算法以( )为准则来选择划分属性。
  149. 分布式人工智能系统一般由多个( )组成。
  150. ( )是将数据集中划分成“类内的点都足够近,类间的点都足够远”的效果。
  151. Mapreduce的运行机制,按照时间顺序包括( )。
  152. Hadoop 是一个由( )开发的大数据分布式系统基础架构。
  153. ( )是在服务器集群上搭建Hadoop,更接近真实的生产环境。
  154. Hadoop 是一个数据管理系统,作为数据分析的核心,汇集了结构化和非结构化的数据。
  155. 名字节点保存源信息的种类有( )。
  156. 通常一个HDFS集群中包含( )。
  157. ( )角色就是定期的合并元数据信息文件和元数据操作日志。
  158. 使用MapReduce框架时,我们仅仅只是填写map和reduce部分的代码,其他的都交给mapreduce框架来处理。
  159. 使用MapReduce之前不一定要初始化Configuration。
  160. ( )是在单机上,模拟一个分布式的环境,具备Hadoop的所有功能。
  161. 深度学习无法应用在渔业养殖领域。
  162. 深度学习在CV领域的应用包括检测和分割。
  163. 感知机不能解决异或问题。
  164. 感受野是特征图上的一个点对应的输入图上的区域。
  165. VGG提出可以通过重复使用简单的基础模块来构建深度模型的思路。
  166. 机器翻译不会取代人工翻译。
  167. LSTM模型不能应用于自然语言处理。
  168. 机器学习是深度学习的一个分支。
  169. 卷积神经网络相邻两层之间只有部分节点相连。
  170. 100层以上的网络才叫深度网络。
  171. ( )方法的思想将子集的选择看作是一个搜索寻优问题,生成不同的组合,对组合进行评价,再与其他的组合进行比较。
  172. 关联规则A->B的支持度support=P(AB),指的是(   )。
  173. 置信度confidence=P(B|A)=P(AB)/P(A),指的是(   )。
  174. 关联规则是形如X→Y的蕴涵式,表示通过X可以推导“得到”Y。
  175. 在降维技术方面,LDA的中文含义是(   )。
  176. K-Means算法中选择较大的K值可以降低数据的误差,并不会增加过拟合的风险。
  177. LDA降维和PCA降维的不同之处包括(   )。
  178. ( )常考虑的是同质弱学习器,相互独立地并行学习这些弱学习器,并按照某种确定性的平均过程将它们组合起来。
  179. 关联规则的执行过程包括(   )。
  180. ( )采用自底向上的聚类方法,从最底层开始,每一次通过合并最相似的聚类来形成上一层次中的聚类,当全部数据点都合并到一个聚类时或者达到某个终止条件时结束,是大部分层次聚类采用的方法。
  181. 遗传算法在整个进化过程中的遗传操作不是随机的。
  182. 学习与发现是指机器的知识学习和规律发现。
  183. 遗传算法中最常用的一种编码方法( )。
  184. 遗传算法采用概率化的寻优方法,能自动获取和指导优化的搜索空间,自适应地调整搜索方向,不需要确定的规则。
  185. 遗传算法的局限性( )。
  186. 蚁群算法最早解决的问题是( )。
  187. 遗传算法中选择操作通过适应度选择优质个体而抛弃劣质个体,体现了“适者生存”的原理。
  188. 群智能算法与梯度方法及传统的演化算法相比,其优点在于( )。
  189. 蚁群算法是受自然界中真实蚁群算法的集体觅食行为的启发而发展起来的一种基于群体的模拟进化算法。
  190. 系统与建造包括( )。
  191. 企业的数据处理大致分为( )。
  192. 数据仓库特点包括( )。
  193. 数据分析,是指从海量的数据中利用数据挖掘的方法,获取有用的有价值的数据信息。
  194. 分箱方法包括( )。
  195. 最普通也是最常见的数据类型是( )。
  196. 将不同数据源的数据自动收集到一个装置中是指( )。
  197. 数据的多样性包括( )。
  198. 数据规约的途径包括( )。
  199. 直接附加存储的英文缩写是( )。
  200. 数据量测方法有( )。
  201. 大数据的最终价值体现(    )。
  202. 自然语言处理包括( )。
  203. 大数据具有4V特点包括( )。
  204. 人工智能起源于( )。
  205. 机器学习主要研究如何使计算机能够模拟或实现人类的学习功能。
  206. 被称为XCON的“专家系统”是由( )发明。
  207. 在分布式人工智能系统中,每一个Agent又是一个全自治系统。
  208. 模式识别就是通过计算机用数学技术方法来研究模式的自动处理和判读。
  209. 在大数据时代,经常使用的数据量衡量单位为TB。
  210. 在数据量单位中,1PB等于( )。
温馨提示支付 ¥5.00 元后可查看付费内容,请先翻页预览!
点赞(9) dxwkbang
返回
顶部