⬆️⬆️⬆️本课程2024最新同名章节期末答案⬆️⬆️

Python数据科学方法与实践（山东联盟）章节测试课后答案2024秋

所有课程章节/期末均有答案,可提供word版,点击联系客服✅

17 阅读 0 评论 3 点赞

第四章单元测试

对pandas库的描述，以下说法错误的是（）。

答案:只支持一维和二维的数据处理分析

关于DataFrame对象的描述，以下不正确的是（）。

内容已经隐藏，点击付费后查看

关于Series对象的描述，以下不正确的是（）。

内容已经隐藏，点击付费后查看

DataFrame对象使用一种行列交叉的表格结构，则以下描述不正确的是（）。

内容已经隐藏，点击付费后查看

假设执行s=pd.Series(np.random.randn(5))语句，已经创建了一个Series对象，则以下允许的操作有（）。

内容已经隐藏，点击付费后查看

创建Series对象时，不可以作为其输入数据的是（）。

内容已经隐藏，点击付费后查看

若DataFrame对象是一个由10行4列组成的数值型数据集，则要使用DataFrame对象的sum函数统计每一行的总和，应设置参数（）。

内容已经隐藏，点击付费后查看

设df是一个由100行5列组成的DataFrame对象，其中第5列标识为“Species”，数据类型是字符串型，要统计该列中每个字符串的长度，以下表达式正确的是（）。

内容已经隐藏，点击付费后查看

假设一个DataFrame对象df的第1列标识为“Species”，由不同物种名称的字符串组成，要统计该列中不同类别物种的个数，以下表达式正确的是（）。

内容已经隐藏，点击付费后查看

假设df为已经创建的DataFrame对象，且其列标识分别为“A”、“B”、“C”、“D”，则语句df.sort_values(by=["B", "D"])的作用是（）。

内容已经隐藏，点击付费后查看

在进行数据预处理时，可以被pandas理解为缺失值的有（）。

内容已经隐藏，点击付费后查看

若DataFrame对象df中存在重复数据，执行该对象的drop_duplicates方法，则以下说法不正确的是（）。

内容已经隐藏，点击付费后查看

若DataFrame对象df存储的数据集中存在不同程度的缺失值NaN，则执行该对象的dropna方法删除这些缺失值时，以下说法正确的是（）。

内容已经隐藏，点击付费后查看

使用3σ原则检测数据集中的异常值时，其中的σ是指（）。

内容已经隐藏，点击付费后查看

以下属于二进制文件格式的有（）。

内容已经隐藏，点击付费后查看

在pandas库与时间相关的类中，带有时区信息，表示某个具体时间点的类是（）。

内容已经隐藏，点击付费后查看

在时间序列的处理和分析中，目前不考虑时区因素而作为国际通用时间标准的是（）。

内容已经隐藏，点击付费后查看

在Python环境中，汇编世界时区信息，且封装在pandas库中，为时区信息的使用带来极大便利的第三方库是（）。

内容已经隐藏，点击付费后查看

数据分类是有效提高大数据集分析时空效率的必要手段，则以下关于数据分类的说法不正确的是（）。

内容已经隐藏，点击付费后查看

使用DataFrame对象的sort_values方法对其中存储的数据进行排序时，以下允许的操作是（）

内容已经隐藏，点击付费后查看

使用DataFrame对象的concat()方法，可以将两个数据集合并成一个数据集。（）

内容已经隐藏，点击付费后查看

使用DataFrame对象的groupby()方法对数据进行分组得到的GroupBy对象包含所有分组计算的结果。（）

内容已经隐藏，点击付费后查看

使用Pandas的read_json()函数，在读取JSON格式文件的同时，可以解析文件中的数据内容。（）

内容已经隐藏，点击付费后查看

FuzzyWuzzy是Python环境下对字符串模糊匹配的第三方库，它默认使用Python的标准库difflib进行字符串匹配。（）

内容已经隐藏，点击付费后查看

对数据进行标准差标准化后，数据的值限定在[0,1]之间。（）

内容已经隐藏，点击付费后查看

使用层次化索引可以在低维上访问到DataFrame对象的高维元素。（）

内容已经隐藏，点击付费后查看

numpy库提供的Series对象即使只有一个轴，也能使用分层索引。（）

内容已经隐藏，点击付费后查看

使用DataFrame对象的unstack()方法，可以将其中的行转换为列，得到一个具有多层索引的Series对象。（）

内容已经隐藏，点击付费后查看

若两个数据子集的列数分别为n1、n2，则使用Pandas的merge方法按主键合并这两个数据子集时，合并后的结果数据集中的列数为n1+n2。（）

内容已经隐藏，点击付费后查看

可以将numpy的ndarray数组对象转换为pandas的Series对象。（）

内容已经隐藏，点击付费后查看

使用DataFrame对象的head方法，仅能查看数据集中前5行的数据。（）

内容已经隐藏，点击付费后查看

可以通过对DataFrame对象的shape属性重新赋值的方式改变其形状。（）

内容已经隐藏，点击付费后查看

使用DataFrame对象的reindex方法重构索引时，若该对象中原来没有索引标识“h”,则索引“h”对应的行将填充为NaN。（）

内容已经隐藏，点击付费后查看

使用DataFrame对象的iloc方法选取行数据时，只能使用整数形式的索引标识。（）

内容已经隐藏，点击付费后查看

Python的外部扩展库pandas不具有图表绘制的功能。（）

内容已经隐藏，点击付费后查看

在使用DataFrame对象的groupby方法进行分组计算时，若分组键是列标识的列表，则分组的结果会以层次化索引表示和存储。（）

内容已经隐藏，点击付费后查看

JSON格式的数据是以键-值对形式存储的序列化文本类型数据，可以使用pandas库的read_json和to_json方法读写。（）

内容已经隐藏，点击付费后查看

如果数据集中表示日期时间的数据是一个很大的整数，一般是指在内部从新纪元Epoch开始的秒数。（）

内容已经隐藏，点击付费后查看

在表示时间序列的频率中，WOM-3FRI表示每月第3个星期五。（）

内容已经隐藏，点击付费后查看

以协调世界时UTC形式表示的时间戳值是带有时区信息的，在进行运算时需要进行时区的转换。（）

内容已经隐藏，点击付费后查看

创建pandas库的Series对象时，以下可以作为其数据参数的有：（）

内容已经隐藏，点击付费后查看

假设已经创建列标识分别为“A”、“B”、“C”、“D”共4列的DataFrame对象df，则以下语句中能够同时访问C列、D列所有数据的是（）

内容已经隐藏，点击付费后查看

执行语句序列data=[[4,5,6], [4,5,6], [4,5,6]];df=pd.DataFrame(data,columns= list("ABC"))创建DataFrame对象df，则以下可以将df中值为5的数据修改为数值10的语句是（）。

内容已经隐藏，点击付费后查看

使用pandas库可以直接读取的外部文件格式包括（）。

内容已经隐藏，点击付费后查看

在pandas环境中对数据进行聚合，DataFrame对象的groupby方法是一种常用的形式，则以下相关说法正确的是（）。

内容已经隐藏，点击付费后查看

对时间序列数据的重采样，以下说法正确的是（）。

内容已经隐藏，点击付费后查看

在进行时间序列分析时，以时间顺序排列构成的观测样本序列数据集，一般具有的基本特性包括（）。

内容已经隐藏，点击付费后查看

对时间序列的分析和预测，可以通过移动窗口并在窗口上进行统计计算的方式。Pandas应用于移动窗口计算的常用函数有（）。

内容已经隐藏，点击付费后查看

在Pandas环境中使用分类数据，以下说法正确的是（）。

内容已经隐藏，点击付费后查看

在Python环境中，可以使用链式编程思想的场景有（）。

内容已经隐藏，点击付费后查看

在pandas的数据合并方法中，既可以按行合并，又可以按列合并的方法有（）。

内容已经隐藏，点击付费后查看

以下属于pandas库自带的基本数据结构的是（）。

内容已经隐藏，点击付费后查看

假设执行df=pd.DataFrame(np.random.randn(4,3),index=range(4), columns= ["one", "two","three"])语句已经正确创建了一个DataFrame对象，则以下允许的操作有（）。

内容已经隐藏，点击付费后查看

使用DataFrame对象的describe方法，可以查看数据集的（）。

内容已经隐藏，点击付费后查看

使用DataFrame对象的groupby方法对数据进行分组后，得到一个GroupBy对象，则以下关于GroupBy对象的说法正确的是（）。

内容已经隐藏，点击付费后查看

采用分组机制对数据进行计算时，以下对分组聚合和解封的说法正确的是（）。

内容已经隐藏，点击付费后查看

在使用pandas库的get_dummies方法对分类特征进行哑变量处理以满足某些回归分析模型对数值型输入的要求时，以下说法正确的是（）。

内容已经隐藏，点击付费后查看

在进行数据处理分析时，对数据进行离散化处理的原因主要有（）。

内容已经隐藏，点击付费后查看

在进行数据的处理分析时，要求对原始数据进行标准化处理，其主要原因有（）。

内容已经隐藏，点击付费后查看

在pandas库的数据组织方式上，允许使用层次化索引，以使得在同一个轴上可以拥有多个索引级别，其主要原因有（）。

内容已经隐藏，点击付费后查看

温馨提示支付 ￥3.00 元后可查看付费内容,请先翻页预览!

微信支付

点赞(3) dxwkbang

本文分类：知到答案智慧树章节答案2024秋
本文标签：Python数据科学方法与实践（山东联盟）
浏览次数：17 次浏览
发布日期：2024-10-18 02:51:49

上一篇 > 跨学科阅读纲要章节测试课后答案2024秋
下一篇 > 写意人物画章节测试课后答案2024秋