第十四章测试
1.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( )
A:聚类
B:自然语言处理
C:分类
D:关联规则发现

答案:D
2.Web内容挖掘实现技术( )
A:文本总结
B:关联规则
C:文本聚类
D:文本分类
3.以下哪些算法是分类算法 ( )
A:K-Mean
B:C4.5
C:DBSCAN
D:EM
4.以下哪些算法是基于规则的分类器 ( )
A:ANN
B:Naive Bayes
C:KNN
D:C4.5
5.对于SVM分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响。( )
A:错 B:对 6.分类规则的挖掘方法通常有:决策树法、贝叶斯法、人工神经网络法。( )
A:对 B:错 7.以下说法正确的是 :( )
A:如果增加模型复杂度, 那么模型的训练错误率总是会降低
B:如果增加模型复杂度, 那么模型的测试错误率总是会降低
C:我们不可以使用聚类“类别id”作为一个新的特征项, 然后再用监督学习分别进行学习
D:一个机器学习模型,如果有较高准确率,总是说明这个分类器是好的
8.对于神经网络的说法, 下面正确的是 :( )
A:减少神经网络层数, 总是能减小测试数据集的分类错误率
B:都不对
C:增加神经网络层数, 可能会增加测试数据集的分类错误率
D:增加神经网络层数, 总是能减小训练数据集的分类错误率
9.对于一个分类任务,如果开始时神经网络的权重不是随机赋值的,二是都设成0,下面哪个叙述是正确的?( )
A:神经网络可以训练,但是所有的神经元最后都会变成识别同样的东西
B:其他选项都不对
C:神经网络不会开始训练,因为没有梯度改变
D:没啥问题,神经网络会正常开始训练
10.如下哪些不是最近邻分类器的特点。 ( )
A:分类一个测试样例开销很大
B:它使用具体的训练实例进行预测,不必维护源自数据的模型
C:可以生产任意形状的决策边界
D:最近邻分类器基于全局信息进行预测
11.

以下两种描述分别对应哪两种对分类算法的评价标准?()
  (a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。
  (b)描述有多少比例的小偷给警察抓了的标准。



A:

 Recall, ROC


B:

Precision, Recall 


C:

 Recall, Precision


温馨提示支付 ¥4.99 元后可查看付费内容,请先翻页预览!
点赞(22) dxwkbang
返回
顶部