⬆️⬆️⬆️本课程2024最新同名章节期末答案⬆️⬆️

机器学习期末考试答案题库2024秋

所有课程章节/期末均有答案,可提供word版,点击联系客服✅

10 阅读 0 评论 2 点赞

三亚学院

机器学习教父Tom Mitchell提出的机器学习定义是：一个程序被认为能从经验E中学习，解决任务 T，达到性能度量值P，当且仅当，有了经验后，经过评判，程序在处理时的性能有所提升。____，____，____。

答案:E；P；T

机器学习=算法。

答案:12)machine-learning algorithm

训练集与测试集的划分对最终模型的确定无影响。（）

答案:错

支持向量是那些最接近决策平面的数据点。（）

答案:对

Dropout作用于每份小批量训练数据，由于其随机丢弃部分神经元的机制，相当于每次迭代都在训练不同结构的神经网络。（）

答案:对

决策树只能用于分类问题,不能用于回归问题。（）

答案:错

预剪枝是在决策树的构建过程中加入限制，比如控制叶子节点最少的样本个数，提前停止。（）

答案:对

回归函数A和B，如果A比B简单，则A一定会比B在测试集上表现好。（）

答案:错

逻辑回归是一个回归模型。（）

答案:错

SVM是分类模型。（）

内容已经隐藏，点击付费后查看

ROC是接收者操作特征曲线（receiver operating characteristic curve），ROC曲线越靠拢（0,1）点，越偏离45度对角线越差。（）

内容已经隐藏，点击付费后查看

在分类问题中，我们经常会遇到正负样本数据量不等的情况，比如正样本为10w条数据,负样本只有1w条数据，以下最合适的处理方法是（）。

内容已经隐藏，点击付费后查看

以下说法中正确的是（）。

内容已经隐藏，点击付费后查看

朴素贝叶斯对缺失值敏不敏感，为什么（）

内容已经隐藏，点击付费后查看

下列哪些假设是我们推导线性回归参数时遵循的?（）

内容已经隐藏，点击付费后查看

下列模型属于机器学习生成式模型的是（）。

内容已经隐藏，点击付费后查看

假定某同学使用Naive Bayesian（NB）分类模型时，不小心将训练数据的两个维度搞重复了，那么关于NB的说法中正确的是（）。

内容已经隐藏，点击付费后查看

影响聚类算法效果的主要原因有？（）

内容已经隐藏，点击付费后查看

下列哪些方法可以用来对高维数据进行降维？（）

内容已经隐藏，点击付费后查看

位势函数法的积累势函数K(x)的作用相当于Bayes判决中的（）。

内容已经隐藏，点击付费后查看

数据清理中，处理缺失值的方法是（）。

内容已经隐藏，点击付费后查看

下列哪个不属于常用的文本分类的特征选择算法？（）

内容已经隐藏，点击付费后查看

如果一个模型在训练集上正确率为99%，测试集上正确率为60%，则下面哪种处理方法是错误的？（）

内容已经隐藏，点击付费后查看

已知一组数据的协方差矩阵P,下面关于主分量说法错误的是（）。

内容已经隐藏，点击付费后查看

对于PCA说法正确的是1.我们必须在使用PCA前规范化数据2.我们应该选择使得模型有最大variance的主成分3.我们应该选择使得模型有最小variance的主成分4.我们可以使用PCA在低维度上做数据可视化（）。

内容已经隐藏，点击付费后查看

下面哪些可能是一个文本语料库的特征1.一个文档中的词频统计2.文档中单词的布尔特征3.词向量4.词性标记5.基本语法依赖6.整个文档（）。

内容已经隐藏，点击付费后查看

在spss的基础分析模块中，作用是“以行列表的形式揭示数据之间的关系”的是（）

内容已经隐藏，点击付费后查看

以下说法正确的是1.一个机器学习模型，如果有较高准确率，总是说明这个分类器是好的2.如果增加模型复杂度，那么模型的测试错误率总是会降低3.如果增加模型复杂度，那么模型的训练错误率总是会降低（）。

内容已经隐藏，点击付费后查看

SVM在下列那种情况下表现糟糕？（）

内容已经隐藏，点击付费后查看

印度电影《宝莱坞机器人之恋》中的机器人七弟采用的智能算法最有可能是以下哪一种？（）

内容已经隐藏，点击付费后查看

假定你使用了一个很大γ值的RBF核，这意味着（）。

内容已经隐藏，点击付费后查看

关于机器学习模型的评判指标，下面错误的是（）

内容已经隐藏，点击付费后查看

我们想在大数据集上训练决策树, 为了使用较少时间, 我们可以（）。

内容已经隐藏，点击付费后查看

下面哪个/些选项对 K 折交叉验证的描述是正确的？1.增大 K 将导致交叉验证结果时需要更多的时间2.更大的 K 值相比于小 K 值将对交叉验证结构有更高的信心3.如果 K=N，那么其称为留一交叉验证，其中 N 为验证集中的样本数量（）

内容已经隐藏，点击付费后查看

一般来说，下列哪种方法常用来预测连续独立变量？（）

内容已经隐藏，点击付费后查看

一元线性回归的基本假设不包括（）。

内容已经隐藏，点击付费后查看

文本信息检索的一个核心问题是文本相似度计算，将查询条件和文本之间的相似程度数值化，从而方便比较。当文档和查询都表示成向量时，可以利用向量的内积的大小近似地表示两个向量之间的相关程度。设有两个文档和查询抽取特征和去除停用词后分别是：文档d1: a、b、c、a、f、b、a、f、h文档d2: a、c查询q: a、c、a特征项集合为 {a、b、c、d、e、f、g、h}如果采用二值向量表示，那么利用内积法计算出q和d1、d2的相似度分别是（）。

内容已经隐藏，点击付费后查看

变量选择是用来选择最好的判别器子集，如果要考虑模型效率，我们应该做哪些变量选择的考虑？1.多个变量其实有相同的用处2.变量对于模型的解释有多大作用3.特征携带的信息4.交叉验证（）

内容已经隐藏，点击付费后查看

二分类任务中，有三个分类器h1,h2,h3，三个测试样本x1,x2,x3。假设1表示分类结果正确，0表示错误，h1在x1,x2,x3的结果分别(1,1,0)，h2,h3分别为(0,1,1)，(1,0,1)，按投票法集成三个分类器，下列说法正确的是（）。

内容已经隐藏，点击付费后查看

词向量描述正确的是（）。

内容已经隐藏，点击付费后查看

以下哪种决策树法可以用于求解回归问题（）

内容已经隐藏，点击付费后查看

下图是同一个SVM模型, 但是使用了不同的径向基核函数的gamma参数, 依次是g1, g2, g3 , 下面大小比较正确的是（C）。
（）。

内容已经隐藏，点击付费后查看

下列哪些不特别适合用来对高维数据进行降维？（）

内容已经隐藏，点击付费后查看

https://image.zhihuishu.com/zhs/doctrans/docx2html/202105/bfcba348d52244dfb44453d656c8643e.png

内容已经隐藏，点击付费后查看

你正在使用带有L1正则化的logistic回归做二分类，其中C是正则化参数，w1和w2是 x1和 x2的系数。当你把C值从0增加至非常大的值时，下面哪个选项是正确的？（）

内容已经隐藏，点击付费后查看

在HMM中,如果已知观察序列和产生观察序列的状态序列,那么可用以下哪种方法直接进行参数估计（）。

内容已经隐藏，点击付费后查看

数据科学家可能会同时使用多个算法（模型）进行预测，并且最后把这些算法的结果集成起来进行最后的预测（集成学习），以下对集成学习说法正确的是（）。

内容已经隐藏，点击付费后查看

朴素贝叶斯NB与逻辑回归LR的区别（）

内容已经隐藏，点击付费后查看

对于随机森林和GradientBoosting Trees, 下面说法正确的是1.在随机森林的单个树中, 树和树之间是有依赖的, 而GradientBoosting Trees中的单个树之间是没有依赖的2.这两个模型都使用随机特征子集, 来生成许多单个的树3.我们可以并行地生成GradientBoosting Trees单个树, 因为它们之间是没有依赖的, GradientBoosting Trees训练模型的表现总是比随机森林好（）。

内容已经隐藏，点击付费后查看

下面对集成学习模型中的弱学习者描述错误的是（）。

内容已经隐藏，点击付费后查看

温馨提示支付 ￥5.00 元后可查看付费内容,请先翻页预览!

微信支付

点赞(2) dxwkbang

本文分类：知到智慧树期末考试答案2024秋
本文标签：机器学习
浏览次数：10 次浏览
发布日期：2024-10-07 22:04:44

上一篇 > 基坑工程与边坡支护期末考试答案题库2024秋
下一篇 > 中国民间艺术的奇妙之旅期末考试答案题库2024秋