第十四章测试
1.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?( )
A:聚类
B:关联规则发现
C:分类
D:自然语言处理

答案:B
2.Web内容挖掘实现技术( )
A:文本聚类
B:文本总结
C:文本分类
D:关联规则
3.以下哪些算法是分类算法 ( )
A:K-Mean
B:EM
C:DBSCAN
D:C4.5
4.以下哪些算法是基于规则的分类器 ( )
A:Naive Bayes
B:KNN
C:C4.5
D:ANN
5.对于SVM分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响。( )
A:对 B:错 6.分类规则的挖掘方法通常有:决策树法、贝叶斯法、人工神经网络法。( )
A:对 B:错 7.以下说法正确的是 :( )
A:如果增加模型复杂度, 那么模型的训练错误率总是会降低
B:我们不可以使用聚类“类别id”作为一个新的特征项, 然后再用监督学习分别进行学习
C:如果增加模型复杂度, 那么模型的测试错误率总是会降低
D:一个机器学习模型,如果有较高准确率,总是说明这个分类器是好的
8.对于神经网络的说法, 下面正确的是 :( )
A:增加神经网络层数, 可能会增加测试数据集的分类错误率
B:都不对
C:增加神经网络层数, 总是能减小训练数据集的分类错误率
D:减少神经网络层数, 总是能减小测试数据集的分类错误率
9.对于一个分类任务,如果开始时神经网络的权重不是随机赋值的,二是都设成0,下面哪个叙述是正确的?( )
A:其他选项都不对
B:没啥问题,神经网络会正常开始训练
C:神经网络可以训练,但是所有的神经元最后都会变成识别同样的东西
D:神经网络不会开始训练,因为没有梯度改变
10.如下哪些不是最近邻分类器的特点。 ( )
A:可以生产任意形状的决策边界
B:分类一个测试样例开销很大
C:最近邻分类器基于全局信息进行预测
D:它使用具体的训练实例进行预测,不必维护源自数据的模型
11.

以下两种描述分别对应哪两种对分类算法的评价标准?()
  (a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。
  (b)描述有多少比例的小偷给警察抓了的标准。



A:

Precision, Recall 


B:

 Recall, ROC


C:

 Recall, Precision


温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(21) dxwkbang
返回
顶部