大数据分析与预测技术章节测试课后答案2024春

212 阅读 0 评论 8 点赞

第四章测试

1.以下哪些数据的特征会对聚类有影响？
A:高维性 B:离群点 C:样本规模 D:噪声
答案:ABCD
2.有关聚类算法不正确的说法是？
A:必须给出聚类的组数 B:把分析的样本根据距离分组 C:聚类是分类的基础 D:聚类算法可以找出每组样本不同的特征

3.聚类是一类重要的机器学习算法，以下哪些场景不属于聚类问题？
A:根据学生的成绩，给出学生的名次。 B:判断一个网络访问是否为入侵访问。 C:某网商对客户的购物行为进行分析，从而分析不同组用户的偏好。 D:对数据库的论文根据内容主题的不同做划分。

4.对联通客户进行分组，以便根据各组的特点，策划不同的营销方案，需要客户哪些数据？
A:收入数据 B:家庭男女组成 C:客户长途市话以及漫游等通话数据 D:客户人口数据

5.下列说法错误的是？
A:k均值算法的计算耗时与初始假设聚类中心的位置有关 B:聚类分析可以看作是一种非监督的样本分组过程 C:在聚类分析中，簇之间的相似性越大，簇内样本的差别越大，聚类的效果就越好 D:k均值算法是一种常用的聚类算法，簇的个数算法不能自动确定

6.有关聚类的算法，正确的说法有以下哪些？
A:自底向上的层次聚类算法对样本的输入顺序比较敏感。 B:聚类的结果要考虑业务的可解释性。 C:类似Kmeans基于划分的聚类与基于层次的聚类都是样本的距离为划分基础。 D:聚类的簇密度指样本的个数多少。

7.有关k-means下列说法正确的是？
A:可以确定样本属性的重要性 B:适合任意数据集的分组 C:聚类的结果与初始选择的假设聚类中心有关 D:可以处理凸型分布数据的聚类

8.根据用户使用移动运营商的数据，可以为他们设计合适的套餐，使用哪种挖掘方法比较合适？
A:回归分析 B:神经网络 C:聚类 D:关联分析

9.对于Kmeans而言，不同的初始聚类中心选择可能导致不同的聚类结果。
A:对 B:错

10.在kmeans的训练过程中，可以选择不同的k值，比较使绝对误差标准较小的k值，结合聚类业务的可解释性，从而选择合适的k值。
A:错 B:对

温馨提示支付 ￥3.00 元后可查看付费内容,请先翻页预览!

微信支付

点赞(8) dxwkbang