第三章单元测试
  1. 我们要进行数据预处理,是因为原始数据大多都是( )。

  2. A:“不可靠的” B:“混乱的” C:“海量的” D:“脏数据”
    答案:“脏数据”
  3. 数据规范化方法包括( )。

  4. A:数据集成 B:数据归约 C:最大最小规范化 D:数据泛化
  5. 假设12个销售价记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内( )。

  6. A:第四个 B:第一个 C:第二个 D:第三个
  7. 将原始数据进行集成、变换、维度归约、数值归约是在以下哪个步骤的任务( )。

  8. A:数据预处理 B:数据流挖掘 C:分类和预测 D:频繁模式挖掘
  9. 数据清理包括以下哪些处理( )。

  10. A:缺失值的处理 B:不一致数据的处理 C:重复数据的处理 D:噪声的处理
  11. 在现实世界的数据中,元组在某些属性上缺少值是常有的。描述处理该问题的各方法中正确的有( )。

  12. A:使用属性的平均值填充空缺值 B:忽略元组 C:使用与给定元组属同一类的所有样本的平均值 D:从数据中挑选一个数据填写
  13. 数据预处理的任务包括数据清理、数据集成、数据规约和数据泛化。( )

  14. A:对 B:错
  15. 噪声是指被测量的变量产生的错误或误差。( )

  16. A:错 B:对
  17. 数据归约就是指对数据集进行简化表示。( )

  18. A:错 B:对
  19. 在使用分箱法实现特征离散化时,可以用每个箱中的中位数或平均数替换箱中所有的值。( )

  20. A:对 B:错

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(3) dxwkbang
返回
顶部