第八章 机器学习实验:以具体数据为例讲解机器学习的流程,包括数据业务理解、数据预处理、统计图描述统计分析、决策树、随机森林和支持向量机等知识点。8.1机器学习概述、数据业务理解:介绍adult数据的变量、变量类型,数据分析的主要任务。
8.2数据预处理:根据adult数据的特点,介绍部分数据预处理方法。
8.3描述统计分析:根据adult数据任务要求进行相关统计图等描述统计分析。
8.4决策树模型分析原理:介绍决策树算法原理。
8.5决策树模型分析操作演示:介绍决策树算法R软件操作演示。
8.6随机森林模型分析原理:介绍随机森林算法原理。
8.7随机森林模型分析操作演示:介绍随机森林分析R软件操作演示。
8.8支持向量机分析原理:介绍支持向量机分析原理。
8.9支持向量机分析操作演示:介绍支持向量机分析R软件操作演示。
8.1机器学习概述、数据业务理解:介绍adult数据的变量、变量类型,数据分析的主要任务。
8.2数据预处理:根据adult数据的特点,介绍部分数据预处理方法。
8.3描述统计分析:根据adult数据任务要求进行相关统计图等描述统计分析。
8.4决策树模型分析原理:介绍决策树算法原理。
8.5决策树模型分析操作演示:介绍决策树算法R软件操作演示。
8.6随机森林模型分析原理:介绍随机森林算法原理。
8.7随机森林模型分析操作演示:介绍随机森林分析R软件操作演示。
8.8支持向量机分析原理:介绍支持向量机分析原理。
8.9支持向量机分析操作演示:介绍支持向量机分析R软件操作演示。
[单选题]决策树学习算法主要包括①决策树的生成、②决策树的剪枝、③特征选择等3个部分,3个部分顺序正确的是( )
②①③

③①②

①②③

③②①

答案:③①②
[单选题]可以将所有含缺失值NA的观测都删去的函数是( )
na.pass

na.contiguous

na.omit

na.fail
[单选题]如图数据,研究是否批准贷款申请(“类别”变量)。经计算年龄、有工作、有自己的房子、信贷情况4个特征的信息增益依次为0.083、0.324、0.420和0.363,根据ID3决策树学习算法应该选择( )为划分标志。
信贷情况

有工作

有自己的房子

年龄
[单选题]如果一个 SVM 模型出现欠拟合,那么下列哪种方法能解决这一问题?( )
减小核系数(gamma参数)

减小惩罚参数 C 的值

同时减少惩罚参数 C的值和核系数(gamma参数)

增大惩罚参数 C 的值
[单选题]评估完模型之后,发现随机森林模型存在高偏差(high bias),应该如何解决?( )
上面说法都正确

增加样本数量

减少模型的特征数量

增加模型的特征数量
[单选题]假设我们使用原始的非线性可分的 Soft-SVM 优化目标函数。我们需要做什么来保证得到的模型是线性可分离的?( )
C = 1

C = 0

C 负无穷大

C 正无穷大
[多选题]下列哪些R包可以进行决策树分析( )
dplyr

Rmisc

party

rpart

tree
[判断题]CART决策树算法以信息增益率准则来选择划分属性。( )

[判断题]在训练完 SVM 之后,我们可以只保留支持向量,而舍去所有非支持向量。仍然不会影响模型分类能力。这句话是否正确?( )

[判断题]随机森林模型是使用随机特征子集来创建中间树的( )

[判断题]随机森林模型的中间树不是相互独立的( )

温馨提示支付 ¥1.00 元后可查看付费内容,请先翻页预览!
点赞(0) dxwkbang
返回
顶部