⬆️⬆️⬆️本课程2024最新同名章节期末答案⬆️⬆️

大数据分析与应用期末考试答案2023春

82 阅读 0 评论 1 点赞

提示:内容已经过期谨慎付费，点击上方查看最新答案

大数据分析与应用

数据挖掘一般无需预先设定好的主题，主要是在现有数据上进行基于各种算法的计算，实现一些（）的需求。

AI参考:正确选项是【A:高级别数据分析】。数据挖掘一般无需预先设定好的主题，主要是在现有数据上进行基于各种算法的计算，实现一些高级别数据分析的需求。数据挖掘通过对大量数据的分析，可以从数据中提取有价值的信息，从而满足高级别数据分析的需求。'

根据判定系数R2与F统计量的关系可知，当R2=1时有（）。

答案:F=∞

决策树算法是一种贪心算法，是（）的逐次搜索方式，逐渐产生决策树模型结构。（）。

答案:自顶向下AI参考:答案为D：由左至右。决策树算法是一种贪心算法，是按照由左至右的顺序逐次搜索方式，逐渐产生决策树模型结构。这意味着算法会尽可能地利用当前信息进行决策，并在后续步骤中根据新的信息进行必要的调整。因此，决策树的构建是从左到右的。'

置信度(confidence)是衡量兴趣度度量（）的指标。

答案:确定性

训练数据集中对象的属性分为哪两类？（）。

AI参考:正确选项：B:数据属性和类别属性。在训练数据集中，对象的属性通常分为数据属性和类别属性两类。数据属性是指与对象特征相关的数值型属性，如身高、体重、年龄等；类别属性则是指与对象特征相关的分类型属性，如性别、职业、颜色等。因此，选项B“数据属性和类别属性”是正确的。选项A中的“分类属性”和选项C中的“分化属性”并不准确，因为它们并不区分数据属性和类别属性的区别。选项D中的“分类属性和分类属性”则表述错误，因为分类属性本身就是类别属性的一个子集。'

系统性原理是指预测必须以系统的观点为指导，采用哪种方法实现预测的系统目标？( )。

答案:系统性原理AI参考:正确选项为A：系统分析。系统分析是预测必须以系统的观点为指导，采用的方法来实现预测的系统目标。它通过对系统的特征、目标、限制条件以及可能的未来结果等进行详尽的分析，并在此基础上通过定性、定量相结合的方法，选择满意的预测方案，以便达到充分利用资源、有效地实现系统目标的预期目的。因此，其他选项B、C、D虽然也与预测有关，但不是实现预测的系统目标的最佳方法。'

大数据分析并不是简单的数据分析的延伸，对大数据进行分析需要高性能的（）。

AI参考:正确选项是【A:计算架构和存储系统】。大数据分析需要高性能的计算架构和存储系统，因为大数据量通常非常大，需要高性能的硬件设备来处理和存储数据。计算架构指的是计算机系统的计算方式、处理器架构等，而存储系统则是指数据的存储方式、存储设备、存储容量等。因此，选项A是正确的答案。选项B、C、D虽然也涉及到了计算和存储，但是不够全面，不能涵盖大数据分析的全部需求。'

推荐系统的构成有哪些（）。

AI参考:正确答案是【C:其他三个选项均正确】。推荐系统的构成主要包括行为记录模块、推荐算法模块和其他功能模块。推荐系统的构建需要根据用户的历史行为和需求等信息，通过对数据进行分析和筛选，最终构建出一个满足用户需求和兴趣的推荐模型，以此来提供更好的个性化推荐服务。因此，除了推荐算法模块之外，行为记录模块和其他功能模块也是推荐系统的重要组成部分。所以选项C是正确的。选项A和D都不是构成推荐系统的核心要素。选项B虽然也是推荐系统的一部分，但是不能作为正确答案。'

下列说法中正确的是（）。

答案:运算符被重载时,它们的优先级与结合性不会改变

EM算法的引入是因为概率模型中包含（）。

AI参考:正确答案是A：隐变量。EM算法是一种迭代算法，用于估计概率模型中的参数。在概率模型中，通常包含一些隐变量，这些隐变量是模型中的未知参数，需要通过EM算法进行估计。EM算法通过迭代的方式，不断更新隐变量的值，直到达到一定的精度或迭代次数为止。因此，答案是A：EM算法的引入是因为概率模型中包含隐变量。'

使用聚类方法确定最相似用户群的时候，使用离目标用户（）一类用户的中心处的打分。

AI参考:使用聚类方法确定最相似用户群的时候，使用离目标用户最近一类用户的中心处的打分，因此选项C“最近”是正确答案。在聚类分析中，我们通常将数据划分为几个不同的组或类别，每个组内的数据点之间具有较高的相似性，而不同组之间的数据点则具有较大的差异性。为了确定最相似的用户群，我们需要计算每个用户与每个组中心的距离，并选择离目标用户最近的组的中心作为打分结果。因此，选项A“最远”和选项D“其他三个选项都不正确”都是不正确的。而选项B“不近不远”无法准确反映距离的实际情况，因此也不合适。所以，正确答案是C“最近”。'

预测的基本要素不包括以下哪点？（）。