第五章测试
1.数据质量问题的来源分为四类( )。
A:信息问题 B:流程问题 C:技术问题 D:管理问题
答案:ABCD
2.在描述人的信息中存在Germany的国家名,这种属于数据质量问题的( )
A:属性缺失 B:错置问题 C:嵌入问题 D:笔误或者拼写错误 3.数据清洗的动作包括( )
A:缺失值填充 B:冗余数据删除 C:异常值发现和修复 D:重复值 4.重复值的清洗流程分为( )。
A:需要先导出重复值 B:清除多余记录 C:类似的记录被合并到一个包含所有相关属性的记录中,保证没有冗余记录 D:识别(即匹配)关于同一真实世界实体的类似记录 5.处理缺失值常用的方法有( )。
A:可以直接删掉缺失值 B:用最大值进行填充 C:直接忽略哪些有缺失字段的记录,在数据分析的过程中不去使用即可 D:用最可能的值,去填充缺失的值

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(2) dxwkbang
返回
顶部