第六章测试
1.常用的异常检测算法有哪些?
A:分类算法 B:基于聚类的方法 C:KNN(K-最近邻) D:高斯分布建模
答案:BCD
2.下面这些场景中哪些用到异常检?
A:使用传感器采集油气井的地球物理数据,构建预测模型预测油气井产量 B:利用公交车上手机位置数据,优化车辆调度和交通实时讯息 C:系统入侵异于正常用户登录行为检测入侵异常 D:从盗窃信用卡的人的购买行为不同于信用卡持有者分析信用卡欺诈 3.基于统计方法的异常检测有以下哪些局限性?
A:对于高维数据难以估算其真实分布 B:许多情况下数据对象的分布是未知的 C:大多数统计模型检验只是针对单个特征 D:高维空间里,数据是稀疏的,邻近度变得没意义 4.基于邻近度的异常检测算法的局限性有哪些?
A:对于高维数据难以估算其真实分布 B:对参数k选择敏感,如k太小,少量的邻近点导致离群点得分较低,而k太大,则点数少于k的数据点都可能成为离群点 C:参数k选择困难 D:高维空间里,数据是稀疏的,邻近度变得没意义 5.以下哪个场景用到基于统计方法的异常检测?
A:高维空间里,数据是稀疏的 B:正常数据出现在高密度邻域,异常数据位于稀疏邻域 C:正常数据出现在随机模型的高概率区域,异常数据则位于随机模型的低概率区域 D:正常数据出现在高密度邻域,异常数据则远离其最近邻 6.下面哪个是基于密度的方法算法的局限性?
A:不能处理不同密度区域的数据集 B:参数k选择困难 C:许多情况下数据对象的分布是未知的 D:对于高维数据难以估算其真实分布 7.高维空间里,数据是稀疏的,我们会用到以下哪种异常检测的方法
A:支持向量机 B:基于统计方法 C:基于邻近度的方法 D:基于密度的方法 8.异常检测(Anomaly detection)是发现与大部分其他对象不同的对象,所以又成为离群点检测
A:对 B:错 9.数据分析任务通常是去掉离群点,离群点是没有意义的点
A:对 B:错 10.在基于邻近度的方法中,离群点的定义不包括以下哪个?
A:在距离D内,最近邻点数少于P的数据点为离群点 B:到第K个最近邻的距离最大的前n个数据点为离群点 C:到K个最近邻平均距离最大的前n个数据点为离群点 D:一个对象的离群点得分是该对象周围密度的逆

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(8) dxwkbang
返回
顶部