第十五章测试
1.在有监督学习中, 我们如何使用聚类方法? ( )
A:我们可以先创建聚类类别, 然后在每个类别上用监督学习分别进行学习
B:我们不可以使用聚类“类别id”作为一个新的特征项, 然后再用监督学习分别进行学习
C:我们可以使用聚类“类别id”作为一个新的特征项, 然后再用监督学习分别进行学习
D:在进行监督学习之前, 我们不能新建聚类类别

答案:AC
2.以下描述错误的是?( )
A:决策树是一种较好的分类算法
B:在决策树中,随着树中节点变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题
C:在聚类分析中,簇内的相似性越大,簇间的差别越大,聚类的效果越好
D:聚类分析可以看做是一种非监督的分类
3.以下属于聚类算法的是( )。
A:决策树
B:Apriori
C:KNN
D:K-Means
4.这些数据特性都是对聚类分析具有很强影响的。( )
A:规模
B:噪声和离群点
C:高维性
D:稀疏性
5.数据挖掘的挖掘方法包括:( )
A:聚类分析
B:回归分析
C:决策树算法
D:神经网络
6.在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。( )
A:错 B:对 7.聚类分析可以看作是一种非监督的分类。( )
A:错 B:对 8.K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。( )
A:错 B:对 9.如果一个对象不强属于任何簇,那么该对象是基于聚类的离群点。( )
A:错 B:对 10.聚类(clustering)是这样的过程:它找出描述并区分数据类或概念的模型(或函数),以便能够使用模型预测类标记未知的对象类。 ( )
A:错 B:对

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(21) dxwkbang
返回
顶部