第三章单元测试
- 我们要进行数据预处理,是因为原始数据大多都是( )。
- 数据规范化方法包括( )。
- 假设12个销售价记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内( )。
- 将原始数据进行集成、变换、维度归约、数值归约是在以下哪个步骤的任务( )。
- 数据清理包括以下哪些处理( )。
- 在现实世界的数据中,元组在某些属性上缺少值是常有的。描述处理该问题的各方法中正确的有( )。
- 数据预处理的任务包括数据清理、数据集成、数据规约和数据泛化。( )
- 噪声是指被测量的变量产生的错误或误差。( )
- 数据归约就是指对数据集进行简化表示。( )
- 在使用分箱法实现特征离散化时,可以用每个箱中的中位数或平均数替换箱中所有的值。( )
A:“不可靠的” B:“混乱的” C:“海量的” D:“脏数据”
答案:“脏数据”
A:数据集成 B:数据归约 C:最大最小规范化 D:数据泛化
A:第四个 B:第一个 C:第二个 D:第三个
A:数据预处理 B:数据流挖掘 C:分类和预测 D:频繁模式挖掘
A:缺失值的处理 B:不一致数据的处理 C:重复数据的处理 D:噪声的处理
A:使用属性的平均值填充空缺值 B:忽略元组 C:使用与给定元组属同一类的所有样本的平均值 D:从数据中挑选一个数据填写
A:对 B:错
A:错 B:对
A:错 B:对
A:对 B:错
温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!