⬆️⬆️⬆️本课程2024最新同名章节期末答案⬆️⬆️

数据科学导论（山东联盟）期末答案2023秋

52 阅读 0 评论 4 点赞

1.数据产品开发是数据科学的重要研究任务之一，关于数据产品开发正确的叙述（）。
A:数据产品开发更加强调的是数据加工的增值活动。 B:数据产品开发具有以数据为中心、多样性、层次性和增值性等特征。 C:数据产品开发能力也是数据科学家的核心竞争力。 D:数据科学的学习目的之一是提升自己的数据产品开发能力。
答案:数据产品开发具有以数据为中心、多样性、层次性和增值性等特征。###数据产品开发更加强调的是数据加工的增值活动。###数据产品开发能力也是数据科学家的核心竞争力。###数据科学的学习目的之一是提升自己的数据产品开发能力。
2.数据数据科学家的工作包括（）。
A:用多种高级算法对数据进行深层分析 B:基于数据的管理 C:洞悉数据背后的价值 D:开发能对数据进行整合、存储和提取的软件，并从软件的应用中获取数据。
答案:基于数据的管理; 洞悉数据背后的价值; 用多种高级算法对数据进行深层分析
3.从理论体系看,数据科学主要以（）为理论基础,其主要研究内容包括数据科学基础理论、数据加工、数据计算、数据管理、数据分析和数据产品开发。
A:机器学习 B:统计学 C:数据可视化 D:(某一)领域知识
答案:(某一)领域知识###数据可视化###机器学习###统计学
4.数据故事化的情景包括（）。
A:虚构情景 B:变换情景 C:移植情景 D:还原情景
答案:移植情景###虚构情景###还原情景
5.数据科学项目中的数据工程师负责（）
A:负责在具体的软/硬件上部署和实施数据科学家提出的方法与技术方案。 B:数据管理策略以及数据处理方法与技术方案的选择。 C:管理软硬件系统和基础设施。 D:数据产品的研发。
答案:数据科学家
6.列表（List）是 R 中最复杂的数据类型，可包含（）类型的数据。
A:数组 B:向量 C:数据框 D:矩阵
答案:向量; 矩阵; 数组; 数据框
7.数据加工的目的包括（）。
A:提升数据质量 B:提升数据计算量 C:降低数据计算的复杂度 D:提升数据处理的准确性
答案:提升数据处理的准确性###提升数据质量###降低数据计算的复杂度
8.关于KNN算法的叙述正确的是（）
A:算法的关键在于“计算新增数据特征与已有样本特征之间的相似度”。 B:K值是分类的类别值。 C:算法应用的前提条件是在训练集及其每个样本的分类标签信息为已知。 D:计算特征之间的相似度的方法有很多，最基本且最常用的方法就是距离法。
答案:算法的关键在于“计算新增数据特征与已有样本特征之间的相似度”。; 算法应用的前提条件是在训练集及其每个样本的分类标签信息为已知。; 计算特征之间的相似度的方法有很多，最基本且最常用的方法就是距离法。
9.机器学习是（）。
A:实现和优化机器的自我学习。 B:一种能够赋予机器学习的能力的方法。 C:计算机模拟人的学习行为，通过学习获取知识和技能的系统。 D:一个系统自我改进的过程。
答案:"AI参考:正确选项是【B,C】。机器学习是一种能够赋予机器学习的能力的方法，通过模拟人类学习行为，通过学习获取知识和技能的系统，是一种实现和优化机器的自我学习的方法。机器学习是计算机科学的一个分支，其目的是使机器能够从数据中学习并利用所学知识做出决策，无需明确编程即可执行预测和决策任务。机器学习的主要任务是通过构建适当的算法和模型来自动从数据中提取有用的信息，以优化机器的性能和适应不同的任务。因此，选项B和C都是正确的答案。选项A和D虽然也涉及到机器学习的一些方面，但不是机器学习的核心概念。"
10.数据可视化是（）
A:将数据映射成符合用户视觉感知的可见视图的过程。 B:一种洞察统计分析无法发现的结构和细节分析方法。 C:本质是视觉编码。 D:用来处理统计图形、抽象地理信息或概念模型的空间数据。
答案:"AI参考:正确选项是【多选题】 A:将数据映射成符合用户视觉感知的可见视图的过程。数据可视化是将数据转化为图形图像的过程，它通过视觉手段帮助用户更好地理解和分析数据，将数据映射成符合用户视觉感知的可见视图的过程。它是一种洞察统计分析无法发现的结构和细节分析方法，同时也可以用来处理统计图形、抽象地理信息或概念模型的空间数据。虽然它不是视觉编码的本质，但它确实涉及到了视觉编码这一过程。因此，选项A、B、D都是正确的解释。选项C虽然也是关于数据可视化的，但“本质是视觉编码”这一表述不够准确。"
11.数据科学需要解决的终极问题是将大数据放在一个完整的生态系统之中去认识与利用，建设“数据生态系统”。
A:错误 B:正确