提示:内容已经过期谨慎付费,点击上方查看最新答案

Python数据分析与数据可视化

  1. 使用可视化扩展库matplotlib的模块pyplot中的xlabel()函数设置x轴标签时,下面哪个参数可以用来设置字号?

  2. A:prop B:font C:fontproperties D:fontsize
    AI参考:在Python的可视化扩展库matplotlib的pyplot模块中,设置x轴标签的字号可以使用`fontproperties`参数。因此,正确选项是C: `fontproperties`。'
  3. 已知x = [1, 2, 3]和y = [4, 5, 6],那么表达式sum(map(lambda i,j: i*j, x, y))的值为?

  4. A:4 B:32 C:18 D:16
    AI参考:选项 B:32,是正确答案。map函数是Python中一个强大的工具,用于对输入的元素进行某种变换并返回结果。在此问题中,lambda函数将输入的数组x和y映射到新的数组z,通过i*j的操作将x中的每个元素与y中的对应元素相乘。所以,表达式sum(map(lambda i,j: i*j, x, y))将返回x和y中所有元素相乘的结果之和。对于给定的x = [1, 2, 3]和y = [4, 5, 6],结果为3*4 + 2*5 + 1*6 = 32。因此,答案为B。'
  5. 使用可视化扩展库matplotlib的模块pyplot中的legend()函数创建和显示图例时,下面哪个参数可以用来设置图例的字体?

  6. A:facecolor B:title C:shadow D:markerfirst E:ncol F:edgecolor G:prop H:loc
    AI参考:正确答案是 G:prop。在pyplot的legend()函数中,可以设置图例的字体参数为prop,使用Matplotlib中的FontProperties对象来设置字体的大小、样式等属性。其他选项如facecolor、title、shadow、markerfirst、ncol、edgecolor和loc等,都是用于设置图例的其他属性,如颜色、标题、阴影效果、是否显示标记等,而与字体无关。因此,G选项是正确答案。'
  7. 在机器学习扩展库sklearn中,KMeans聚类模型完成聚类之后,可以通过_____________属性查看样本的标签。


  8. A:labels_ B:Label_ C:Label D:labels
    AI参考:正确选项是:A:labels_。在sklearn库中,KMeans聚类模型完成聚类后,可以通过labels_属性查看样本的标签。这个属性是一个NumPy数组,其中包含每个样本的标签,标签是从0开始递增的整数。因此,选项A是正确的。其他选项B、C、D都是错误的拼写或格式。'
  9. 扩展库matplotlib.pyplot中的函数plot()可以用来绘制哪种图形?

  10. A:饼状图 B:柱状图 C:雷达图 D:散点图 E:折线图
    AI参考:正确答案是E:折线图。matplotlib.pyplot中的函数plot()可以用来绘制折线图,它是一种常用的数据可视化方法,用于展示数据的变化趋势。其他选项如饼状图、柱状图、雷达图和散点图分别由不同的函数或库实现,如pie()、bar()、scatter()和polar_scatter()等。因此,选项E是正确的答案。'
  11. 表达式np.ones((3,4)).sum()的值为____________。

  12. A:1 B:0 C:7 D:12
    AI参考:正确答案是D:12。np.ones((3,4))生成一个形状为(3,4)的元素全为1的数组,sum()函数对数组中所有元素求和,因此答案是12。'
  13. 表达式not {}的值为____________。

  14. A:True B:False C:true D:false
    AI参考:这个问题的答案应该是:B:False。not {}是一个逻辑表达式,{}是一个空括号,所以它实际上表示的是“假”,即false。而not false就是true,所以表达式的值为false。因此,答案为B。'
  15. 扩展库matplotlib.pyplot中的函数pie()可以用来绘制哪种图形?

  16. A:雷达图 B:散点图 C:折线图 D:饼状图 E:柱状图
    AI参考:正确选项是D:饼状图。matplotlib.pyplot中的函数pie()用于绘制饼状图,用于展示数据的比例或构成情况。它通常用于显示数据中的各个部分所占的比例,通常用于展示数据分布或分类信息。其他选项如雷达图、散点图、折线图、柱状图等不是pie()函数所擅长的图形类型。'
  17. 表达式np.diag((1,2,3,4)).shape的值为____________。

  18. A:4 B:8 C:16 D:(4, 4)
    AI参考:正确答案是D: (4, 4)。np.diag((1,2,3,4))生成了一个四维的虚幻矩阵,其形状为(4, 1, 1, 1),而shape属性返回的是矩阵的形状,所以答案是(4, 4)。'
  19. 在机器学习扩展库sklearn中,KMeans聚类模型完成聚类之后,可以通过_____________属性查看各个聚类的中心。


  20. A:clustercenters B:cluster_centers C:cluster_centers_ D:clustercenters_
    AI参考:正确选项是【C:cluster_centers_】。在sklearn库中,KMeans聚类模型完成聚类后,可以通过属性“cluster_centers_”查看各个聚类的中心。这个属性返回一个包含所有聚类中心点的数组。因此,选项C是正确的。而其他选项中的拼写错误(如“clustercenters”和“clustercenters_”)都是不正确的。'
  21. 使用可视化扩展库matplotlib的模块pyplot中的legend()函数创建和显示图例时,下面哪个参数可以用来设置图例是否显示阴影效果?

  22. A:edgecolor B:ncol C:title D:prop E:shadow F:loc G:facecolor H:markerfirst
    答案:hatch
  23. 使用可视化扩展库matplotlib的模块pyplot中的bar()函数绘制柱状图时,下面哪个参数可以用来设置柱的位置?

  24. A:lw B:width C:fill D:color E:hatch F:left
    AI参考:使用可视化扩展库matplotlib的模块pyplot中的bar()函数绘制柱状图时,用来设置柱的位置的参数是:F:left。这个参数用于指定柱状图柱子的位置,left的值越大,柱子越靠近图的左边。其他选项如lw(线宽)、width(柱宽度)、fill(填充颜色)、color(颜色)、hatch(填充图案)等都与设置柱状图的位置无关。'
  25. 已知x = np.array((1, 2, 3, 4, 5)),那么表达式(2**x).max()的值为____________。

  26. A:60 B:25 C:32 D:15
    答案:1
  27. 已知x = np.array([3, 5, 1, 9, 6, 3]),那么表达式x[x>5].sum()的值为____________。

  28. A:9 B:15 C:34 D:6
    AI参考:正确答案是C:34。已知x = np.array([3, 5, 1, 9, 6, 3]),x>5表示选取数组中大于5的元素,所以x[x>5] = np.array([5, 9, 6]),再求和得到34。因此,表达式x[x>5].sum()的值为34。'
  29. 使用可视化扩展库matplotlib的模块pyplot中的pie()函数绘制饼状图时,下面哪个参数用来设置饼状图的半径?

  30. A:radius B:startangle C:explode D:shadow E:center F:colors
    答案:hatch
  31. 使用可视化扩展库matplotlib的模块pyplot中的scatter()函数绘制散点图时,下面哪个参数可以用来设置散点的符号?

  32. A:alpha B:s C:marker D:c
    答案:
  33. 使用可视化扩展库matplotlib的模块pyplot中的bar()函数绘制柱状图时,下面哪个参数可以用来设置柱的内部填充符号?

  34. A:left B:lw C:color D:width E:fill F:hatch
    答案:hatch
  35. 使用可视化扩展库matplotlib的模块pyplot中的pie()函数绘制饼状图时,下面哪个参数用来设置每个扇形区域偏离圆心的程度?

  36. A:center B:shadow C:radius D:colors E:startangle F:explode

  37. 下面表达式中等价于False的是?

  38. A:-2 B:{2} C:3 D:[]
    AI参考:正确答案是D:[]。空列表在Python中表示为[],它是一个空集合,不包含任何元素,所以空列表等价于False。A、B、C选项中的表达式都表示一个具体的数值或集合,它们都等价于True。因此,答案为D。'
  39. 已知data = np.arange(20).reshape(5,4),那么表达式data[3,2]的值为?

  40. A:18 B:14 C:24 D:4

  41. KMeans算法的基本思想是:选择样本空间中k个样本(点)为初始中心,然后对剩余样本进行聚类,每个中心把距离自己最近的样本“吸引”过来,然后更新聚类中心的值,依次把每个样本归到距离最近的类中,重复上面的过程,直至得到某种条件下最好的聚类结果。

  42. A:错 B:对

  43. 在使用KNN算法对未知样本进行分类时,参数k的取值不重要,对结果影响不大。

  44. A:对 B:错

  45. 使用上下文管理语句with管理文件对象时,即使with块中的代码发生错误引发异常,也能保证文件被正确关闭。

  46. A:错 B:对

  47. 扩展库numpy的线性代数子模块linalg中提供了用来计算不同范数的函数norm()。

  48. A:对 B:错

  49. 扩展库numpy的线性代数子模块linalg中提供了用来计算逆矩阵的函数inv()。

  50. A:错 B:对

  51. Python语言中字符串对象的strip()只能删除字符串两端的空白字符,无法删除其他字符。

  52. A:对 B:错

  53. 理想的模型应该方差和偏差都很小。

  54. A:错 B:对

  55. 在机器学习扩展库sklearn中,SVC类的参数C用来设置错误项的惩罚参数C,值越大对误分类的惩罚越小,间隔越小,对错误的容忍度越高。

  56. A:错 B:对

  57. 已知x = np.matrix([1, 2, 3, 4, 5]),那么表达式x*x.T的值为matrix([[55]])。

  58. A:错 B:对
    AI参考:答案:B。因为x是np.matrix类型,因此表达式x*x.T表示矩阵的转置乘法,结果应该是一个新的矩阵,而非单个数值55。'
  59. 使用DBSCAN算法进行聚类时,需要使用参数指定聚类的数量。

  60. A:对 B:错
    AI参考:答案:B:错。DBSCAN是一种基于密度的聚类算法,它不需要明确指定聚类的数量。它通过密度连接和噪声连接来发现任意形状的聚类,而不需要预先知道聚类的数量。因此,使用DBSCAN算法进行聚类时,不需要使用参数指定聚类的数量。'
  61. 对于复杂表达式,如果计算结果是正确的,那么不建议再增加圆括号来说明计算顺序,这样可以使得代码更加简洁清晰。

  62. A:对 B:错

  63. 已知x是一个足够大的numpy二维数组,那么语句x[0, 2] = 4的作用是把行下标为0、列下标为2的元素值改为4。

  64. A:对 B:错

  65. 聚类算法KMeans属于有监督学习算法。

  66. A:对 B:错
    AI参考:正确答案是B:错。KMeans算法是一种无监督学习算法,它通过数据集中数据的聚类结果来发现数据集中的数据分布规律,而不需要额外的标签信息。因此,KMeans算法不属于有监督学习算法。'
  67. 扩展库pandas中DataFrame对象的index属性表示列名。

  68. A:错 B:对

  69. 在样本的众多特征中,并不是每个特征都对要分析的问题有贡献。即使是对问题有贡献的若干特征,每个特征的重要程度可能也不一样。

  70. A:错 B:对

  71. 在机器学习扩展库sklearn中,Lasso是可以估计稀疏系数的线性模型,尤其适用于减少给定解决方案依赖的特征数量的场合。如果数据的特征过多,而其中只有一小部分是真正重要的,此时选择Lasso比较合适。

  72. A:错 B:对

  73. 机器学习扩展库sklearn中的评估器对象都提供了fit()方法使用数据对模型进行拟合和训练。

  74. A:错 B:对

  75. 在使用KNN算法对未知样本进行分类时,已知类别中各类别包含的样本数量最好差不多,否则会影响结果的准确性。

  76. A:对 B:错
    AI参考:答案:A。在使用KNN算法对未知样本进行分类时,已知类别中各类别包含的样本数量最好差不多,否则会影响结果的准确性。这是因为KNN算法是一种基于实例的学习,它通过比较待分类项与已知类别的样本,找出最接近的K个样本,并根据这K个样本的多数类别作为待分类项的预测类别。如果类别中各类别包含的样本数量相差太大,则可能会导致某些类别的样本在计算过程中被忽略或被错误地考虑,从而影响结果的准确性。因此,选择答案A:对。'
  77. 扩展库pandas中DataFrame对象提供了pivot()方法和pivot_table()方法实现透视表所需要的功能,返回新的DataFrame对象。

  78. A:对 B:错

  79. 随机森林是一种集成学习方法,基本思想是把几棵不同参数的决策树打包到一起,每棵决策树单独进行预测,然后计算所有决策树预测结果的平均值(适用于回归分析)或所有决策树“投票”得到最终结果(适用于分类)。

  80. A:错 B:对

  81. 对于分类算法而言,准确率定义被正确分类的样本数量与样本总数量的比值。

  82. A:错 B:对

  83. 在对文件进行读写时,文件指针的位置会自动变化,始终表示读写的当前位置。

  84. A:对 B:错

  85. 在Python中,可调用对象主要包括函数(function)、lambda表达式、类(class)、类的方法(method)、实现了特殊方法__call__()的类的对象,这些对象作为内置函数callable()的参数会使得该函数返回True。

  86. A:对 B:错

  87. 已知data = np.arange(20),那么语句data.shape = 5, -1无法执行,因为-1没有含义。

  88. A:对 B:错

  89. 在Python 3.x中,reduce()是内置函数,可以直接使用。

  90. A:对 B:错

  91. 已知df为pandas的DataFrame对象,那么df.at[3, '姓名']表示访问行下标为3,姓名列的值。

  92. A:错 B:对

  93. 机器学习扩展库sklearn的model_selection模块实现了多个交叉验证器类以及用于学习曲线、数据集分割的函数。

  94. A:对 B:错

  95. 在进行数据分析和挖掘时,应使用样本尽可能多的特征,这样可以得到更理想的结果。

  96. A:错 B:对

  97. 基尼值越大,表示数据纯度越低,也表示从样本空间中随机选取两个样本时这两个样本所属类别不一样的概率越大。

  98. A:对 B:错

  99. 缩进对于Python程序至关重要。

  100. A:错 B:对

  101. 扩展库sklearn.linear_model中LinearRegression类的对象拟合完成之后,可以通过属性coef_查看回归系数。

  102. A:错 B:对

  103. 列表可以作为字典元素的“键”。

  104. A:对 B:错

  105. 扩展库pandas中Series对象和DataFrame的列数据提供了cat、dt、str三种属性接口(accessors),分别对应分类数据、日期时间数据和字符串数据。

  106. A:错 B:对

  107. 图例往往位于图形绘制结果的一角或一侧,也可以根据图形的特点来设置位置以及背景色等其他样式,主要用于对所绘制的图形中使用的各种符号和颜色进行说明,对于理解图形有重要的作用。

  108. A:对 B:错

  109. 扩展库pandas中DataFrame对象支持sort_index()方法沿某个方向按标签进行排序并返回一个新的DataFrame对象。

  110. A:对 B:错

  111. 已知df为pandas的DataFrame对象,那么df[:10]表示访问df中前10行数据。

  112. A:对 B:错

  113. 使用UTF8编码格式的中文文本文件可以直接使用GBK编码格式进行解码。

  114. A:对 B:错

  115. 表达式np.empty((3,5)).sum()的值一定为0。

  116. A:错 B:对

  117. 已知x = np.matrix([[1,2,3], [4,5,6]]),那么表达式x.mean(axis=0)的值为matrix([[ 2.5, 3.5, 4.5]])。

  118. A:错 B:对

  119. 扩展库pandas的read_csv()函数用于读取CSV文件中的数据并创建DataFrame对象。

  120. A:对 B:错

温馨提示支付 ¥2.10 元后可查看付费内容,请先翻页预览!
点赞(1) dxwkbang
返回
顶部