第二章
不完整数据的成因有( )。
答案:数据收集的时候就缺乏合适的值;数据收集时和数据分析时的不同考虑因素;人为/硬件/软件问题
处理空缺值的主要方法有( )。
答案:使用一个全局常量填补空缺值;忽略元组;使用属性的平均值填补空缺值。;使用与给定元组属同一类的所有样本的平均值。
给定一个数值属性,怎样才能平滑数据,去掉噪声?( )。
答案:分箱(binning);回归;聚类;计算机和人工检查结合
数据集成时需解决的三个基本问题为( )。
答案:模式集成的过程中涉及到的实体识别问题;冗余问题;数据集成过程中数值冲突的检测与处理
常用的数据转换方法有( )。
答案:数据概化;属性构造 ;平滑 ;聚集

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(0) dxwkbang
返回
顶部