第九章单元测试
  1. 数据挖掘结合了数据库、人工智能、机器学习、统计学、高性能计算、模式识别、神经网络、数据可视化、信息检索和空间数据分析等多个领域的理论和技术。( )

  2. A:对 B:错
    答案:对
  3. 关于数据挖掘下列说法不正确的是( )。

  4. A:数据挖掘需要数据库系统提供有效的存储、索引和查询处理支持。 B:数据挖掘并不需要并行、分布式计算 C:数据挖掘能够从海量信息中发现有价值的信息,并把数据转化成有组织的知识 D:数据挖掘是在大型数据存储库中,自动地发现有用信息的过程
  5. 一般数据挖掘的流程顺序,下列正确的是( )。
    ①选择数据挖掘的技术、功能和合适的算法; ②选择数据,数据清洗和预处理; ③了解应用领域,了解相关的知识和应用目标; ④寻找感兴趣的模式、模式评估、知识表示; ⑤创建目标数据集

  6. A:③→②→⑤→①→④ B:③→④→①→⑤→② C:③→⑤→②→①→④ D:⑤→④→②→①→③
  7. 知识发掘处理(Knowledge Discovery Process)的执行顺序,下列正确的是( )。
    ①数据清洗;②数据选择;③数据编码;④数据扩充;⑤数据挖掘

  8. A:②→①→④→③→⑤ B:④→①→③→②→⑤ C:①→②→③→④→⑤ D:④→③→①→②→⑤
  9. 数据准备方法是在评估模型性能之前对整个数据集进行处理,这会导致数据泄漏的问题,而在数据清洗过程中(缺失值、异常值),下列正确的是( )。


  10. A:运用训练数据集中变量的统计量对验证集中的变量进行数据清洗 B:均不对 C:运用验证数据集中变量的统计量对训练集中的变量进行数据清洗 D:运用验证数据集中变量的统计量对验证集中的变量进行数据清洗

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(2) dxwkbang
返回
顶部