第四章测试
1.以下哪些数据的特征会对聚类有影响?
A:高维性 B:离群点 C:样本规模 D:噪声
答案:ABCD
2.有关聚类算法不正确的说法是?
A:必须给出聚类的组数 B:把分析的样本根据距离分组 C:聚类是分类的基础 D:聚类算法可以找出每组样本不同的特征 3.聚类是一类重要的机器学习算法,以下哪些场景不属于聚类问题?
A:根据学生的成绩,给出学生的名次。 B:判断一个网络访问是否为入侵访问。 C:某网商对客户的购物行为进行分析,从而分析不同组用户的偏好。 D:对数据库的论文根据内容主题的不同做划分。 4.对联通客户进行分组,以便根据各组的特点,策划不同的营销方案,需要客户哪些数据?
A:收入数据 B:家庭男女组成 C:客户长途市话以及漫游等通话数据 D:客户人口数据 5.下列说法错误的是?
A:k均值算法的计算耗时与初始假设聚类中心的位置有关 B:聚类分析可以看作是一种非监督的样本分组过程 C:在聚类分析中,簇之间的相似性越大,簇内样本的差别越大,聚类的效果就越好 D:k均值算法是一种常用的聚类算法,簇的个数算法不能自动确定 6.有关聚类的算法,正确的说法有以下哪些?
A:自底向上的层次聚类算法对样本的输入顺序比较敏感。 B:聚类的结果要考虑业务的可解释性。 C:类似Kmeans基于划分的聚类与基于层次的聚类都是样本的距离为划分基础。 D:聚类的簇密度指样本的个数多少。 7.有关k-means下列说法正确的是?
A:可以确定样本属性的重要性 B:适合任意数据集的分组 C:聚类的结果与初始选择的假设聚类中心有关 D:可以处理凸型分布数据的聚类 8.根据用户使用移动运营商的数据,可以为他们设计合适的套餐,使用哪种挖掘方法比较合适?
A:回归分析 B:神经网络 C:聚类 D:关联分析 9.对于Kmeans而言,不同的初始聚类中心选择可能导致不同的聚类结果。
A:对 B:错 10.在kmeans的训练过程中,可以选择不同的k值,比较使绝对误差标准较小的k值,结合聚类业务的可解释性,从而选择合适的k值。
A:错 B:对

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(8) dxwkbang
返回
顶部