R语言数据分析与挖掘答案2023

447 阅读 0 评论 22 点赞

第十四章测试

1.某超市研究销售纪录数据后发现，买啤酒的人很大概率也会购买尿布，这种属于数据挖掘的哪类问题？( )
A:聚类
B:自然语言处理
C:分类
D:关联规则发现

答案:D
2.Web内容挖掘实现技术（）
A:文本总结
B:关联规则
C:文本聚类
D:文本分类

3.以下哪些算法是分类算法（）
A:K-Mean
B:C4.5
C:DBSCAN
D:EM

4.以下哪些算法是基于规则的分类器 ( )
A:ANN
B:Naive Bayes
C:KNN
D:C4.5

5.对于SVM分类算法，待分样本集中的大部分样本不是支持向量，移去或者减少这些样本对分类结果没有影响。（）
A:错 B:对

6.分类规则的挖掘方法通常有：决策树法、贝叶斯法、人工神经网络法。( )
A:对 B:错

7.以下说法正确的是 :（）
A:如果增加模型复杂度，那么模型的训练错误率总是会降低
B:如果增加模型复杂度，那么模型的测试错误率总是会降低
C:我们不可以使用聚类“类别id”作为一个新的特征项，然后再用监督学习分别进行学习
D:一个机器学习模型，如果有较高准确率，总是说明这个分类器是好的

8.对于神经网络的说法, 下面正确的是 :（）
A:减少神经网络层数, 总是能减小测试数据集的分类错误率
B:都不对
C:增加神经网络层数, 可能会增加测试数据集的分类错误率
D:增加神经网络层数, 总是能减小训练数据集的分类错误率

9.对于一个分类任务，如果开始时神经网络的权重不是随机赋值的，二是都设成0，下面哪个叙述是正确的？（）
A:神经网络可以训练，但是所有的神经元最后都会变成识别同样的东西
B:其他选项都不对
C:神经网络不会开始训练，因为没有梯度改变
D:没啥问题，神经网络会正常开始训练

10.如下哪些不是最近邻分类器的特点。 ( )
A:分类一个测试样例开销很大
B:它使用具体的训练实例进行预测，不必维护源自数据的模型
C:可以生产任意形状的决策边界
D:最近邻分类器基于全局信息进行预测

11.

以下两种描述分别对应哪两种对分类算法的评价标准？()
(a)警察抓小偷，描述警察抓的人中有多少个是小偷的标准。
(b)描述有多少比例的小偷给警察抓了的标准。

Recall, ROC

Precision, Recall

Recall, Precision

温馨提示支付 ￥4.99 元后可查看付费内容,请先翻页预览!

微信支付