第四章单元测试
  1. 下述机器学习方法中可以用于降维的是


  2. A:决策树 B:PCA C:Kmeans聚类 D:KNN
    答案:PCA
  3. 如果研究者想探讨影响小麦亩产量的因素,采集了若干个样本的各个指标(温度、灌溉量、光照强度、施肥量),则下列哪种方法适合研究本问题?


  4. A:一元线性回归 B:PCA C:聚类分析 D:多元线性回归分析
    答案:多元线性回归分析

  5. 随机森林算法叙述正确的是



  6. A:采用投票法(少数服从多数)确定最终类别归属 B:随机选择训练样本(行采样) C:是一种集成学习算法 D:随机选择部分特征(列采样)
    答案:采用投票法(少数服从多数)确定最终类别归属###随机选择训练样本(行采样)###是一种集成学习算法###随机选择部分特征(列采样)
  7. 下列关于决策树算法的论述错误的是


  8. A:决策树基本思想是贪心算法,它以自顶(根节点)向下递推生成的方式构造决策树。 B:ID3算法的属性选择度量就是使用信息增益,选择最小信息增益的属性作为当前节点的测试属性。 C:条件熵H(Y|X)表示在已知特征X的条件下,类别Y的不确定性的度量 D:熵可用于描述信息的不确定性或混乱程度,信息的不确定性越大则熵越大,反之越小
    答案:ID3算法的属性选择度量就是使用信息增益,选择最小信息增益的属性作为当前节点的测试属性。
  9. 下列关于判别分析叙述正确的是


  10. A:Fishser线性判别分析的基本思想是投影 B: 利用已知类别的样本建立判别模型,对未知类别的样本进行分类 C:是多元分析中用于判别样本所属类型的一种统计分析方法 D:Fishser线性判别分析(Linear Discriminant analysis, LDA)由R.A.Fisher 于1936年提出
    答案:Fishser线性判别分析的基本思想是投影### 利用已知类别的样本建立判别模型,对未知类别的样本进行分类###是多元分析中用于判别样本所属类型的一种统计分析方法###Fishser线性判别分析(Linear Discriminant analysis, LDA)由R.A.Fisher 于1936年提出
  11. 朴素贝叶斯分类器的基本算法步骤包括


  12. A:比大小:计算后验概率,归入最大后验概率类 B:定问题:确定为分类(类标签已知)问题 C:算概率:计算所有朴素贝叶斯公式中的“零部件”概率
    答案:比大小:计算后验概率,归入最大后验概率类###定问题:确定为分类(类标签已知)问题###算概率:计算所有朴素贝叶斯公式中的“零部件”概率
  13. K最近邻(KNN)分类器的基本算法步骤包括


  14. A:算距离:给定测试对象,计算它与训练集中的每个对象的距离 B:找邻居:圈定距离最近的k个训练对象,作为测试对象的近邻  C:做分类:根据这k个近邻归属的主要类别,来对测试对象分类
    答案:算距离:给定测试对象,计算它与训练集中的每个对象的距离###找邻居:圈定距离最近的k个训练对象,作为测试对象的近邻 ###做分类:根据这k个近邻归属的主要类别,来对测试对象分类
  15. 本章机器学习高级话题中涉及的提升模型算法性能的策略包括调参、交叉验证和采用合理的评价指标。


  16. A:对 B:错
    答案:对

点赞(2) dxwkbang
返回
顶部