第四章单元测试
  1. 以下哪些数据的特征会对聚类有影响?

  2. A:高维性 B:噪声 C:离群点 D:样本规模
    答案:高维性###噪声###离群点###样本规模
  3. 有关聚类算法不正确的说法是?

  4. A:聚类是分类的基础 B:聚类算法可以找出每组样本不同的特征 C:必须给出聚类的组数 D:把分析的样本根据距离分组
  5. 聚类是一类重要的机器学习算法,以下哪些场景不属于聚类问题?

  6. A:某网商对客户的购物行为进行分析,从而分析不同组用户的偏好。 B:对数据库的论文根据内容主题的不同做划分。 C:判断一个网络访问是否为入侵访问。 D:根据学生的成绩,给出学生的名次。
  7. 对联通客户进行分组,以便根据各组的特点,策划不同的营销方案,需要客户哪些数据?

  8. A:家庭男女组成 B:客户长途市话以及漫游等通话数据 C:客户人口数据 D:收入数据
  9. 下列说法错误的是?

  10. A:聚类分析可以看作是一种非监督的样本分组过程 B:k均值算法的计算耗时与初始假设聚类中心的位置有关 C:k均值算法是一种常用的聚类算法,簇的个数算法不能自动确定 D:在聚类分析中,簇之间的相似性越大,簇内样本的差别越大,聚类的效果就越好
  11. 有关聚类的算法,正确的说法有以下哪些?

  12. A:类似Kmeans基于划分的聚类与基于层次的聚类都是样本的距离为划分基础。 B:自底向上的层次聚类算法对样本的输入顺序比较敏感。 C:聚类的结果要考虑业务的可解释性。 D:聚类的簇密度指样本的个数多少。
  13. 有关k-means下列说法正确的是?

  14. A:可以确定样本属性的重要性 B:聚类的结果与初始选择的假设聚类中心有关 C:可以处理凸型分布数据的聚类 D:适合任意数据集的分组
  15. 根据用户使用移动运营商的数据,可以为他们设计合适的套餐,使用哪种挖掘方法比较合适?

  16. A:聚类 B:关联分析 C:回归分析 D:神经网络
  17. 对于Kmeans而言,不同的初始聚类中心选择可能导致不同的聚类结果。

  18. A:错 B:对
  19. 在kmeans的训练过程中,可以选择不同的k值,比较使绝对误差标准较小的k值,结合聚类业务的可解释性,从而选择合适的k值。

  20. A:对 B:错

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(4) dxwkbang
返回
顶部