第四章测试
1.下述机器学习方法中可以用于降维的是
A:决策树 B:KNN C:PCA D:Kmeans聚类
答案:C
2.如果研究者想探讨影响小麦亩产量的因素,采集了若干个样本的各个指标(温度、灌溉量、光照强度、施肥量),则下列哪种方法适合研究本问题?
A:PCA B:聚类分析 C:多元线性回归分析 D:一元线性回归
答案:C
3.随机森林算法叙述正确的是
A:随机选择训练样本(行采样) B:采用投票法(少数服从多数)确定最终类别归属 C:随机选择部分特征(列采样) D:是一种集成学习算法
答案:ABCD
4.下列关于决策树算法的论述错误的是
A:ID3算法的属性选择度量就是使用信息增益,选择最小信息增益的属性作为当前节点的测试属性。 B:条件熵H(Y|X)表示在已知特征X的条件下,类别Y的不确定性的度量 C:决策树基本思想是贪心算法,它以自顶(根节点)向下递推生成的方式构造决策树。 D:熵可用于描述信息的不确定性或混乱程度,信息的不确定性越大则熵越大,反之越小
答案:A
5.下列关于判别分析叙述正确的是
A:是多元分析中用于判别样本所属类型的一种统计分析方法 B:Fishser线性判别分析的基本思想是投影 C: 利用已知类别的样本建立判别模型,对未知类别的样本进行分类 D:Fishser线性判别分析(Linear Discriminant analysis, LDA)由R.A.Fisher 于1936年提出
答案:ABCD
6.朴素贝叶斯分类器的基本算法步骤包括
A:定问题:确定为分类(类标签已知)问题 B:比大小:计算后验概率,归入最大后验概率类 C:算概率:计算所有朴素贝叶斯公式中的“零部件”概率
答案:ABC
7.K最近邻(KNN)分类器的基本算法步骤包括
A:算距离:给定测试对象,计算它与训练集中的每个对象的距离 B:找邻居:圈定距离最近的k个训练对象,作为测试对象的近邻  C:做分类:根据这k个近邻归属的主要类别,来对测试对象分类
答案:ABC
8.本章机器学习高级话题中涉及的提升模型算法性能的策略包括调参、交叉验证和采用合理的评价指标。
A:错 B:对
答案:B

点赞(7) dxwkbang
返回
顶部