1. 已知data = np.arange(20),那么语句data.shape = 5, -1无法执行,因为-1没有含义。

  2. 答案:错
  3. 扩展库pandas中DataFrame对象的fillna()方法,当参数inplace=True时是原地填充缺失值,当参数inplace=False时返回填充后的新DataFrame对象。

  4. 答案:对
  5. 扩展库pandas中Series对象的hist()方法可以用于绘制直方图。

  6. 答案:对
  7. 表达式'a'*5 == 'aaaaa'的值为True。

  8. 答案:对
  9. 扩展库matplotlib.pyplot的函数subplot()可以用来切分绘图区域和创建子图。

  10. 答案:对
  11. 包含列表的元组不可以作为集合的元素。

  12. 答案:对
  13. 使用上下文管理语句with管理文件对象时,即使with块中的代码发生错误引发异常,也能保证文件被正确关闭。

  14. 答案:对
  15. 书写文件路径时,为了减少路径中分隔符“\”符号的输入,同时也为了避免不正确的转义导致代码错误,建议使用原始字符串。

  16. 答案:对
  17. 使用pandas的date_range()函数生产日期时间数据时,如果以6天为间隔可以设置参数freq为'6D'。

  18. 答案:对
  19. 使用扩展库pandas的函数read_excel()读取Excel文件时,可以使用参数usecols指定只读取哪几列的数据。

  20. 答案:对
  21. 决策树属于有监督学习算法,需要根据已知样本数据及其目标来训练并得到一个可以工作的模型,然后再使用该模型对未知样本进行分类。

  22. 答案:对
  23. 扩展库pandas的DataFrame数据中的日期时间列支持dt接口,该接口提供了dayofweek、dayofyear、is_leap_year、quarter、weekday_name等属性和方法。
  24. 网格搜索常用于在指定范围中选取最佳参数。
  25. 在循环体中必须有break语句。
  26. 已知df为pandas的DataFrame对象,那么df[df['交易额']>1700]表示访问df中交易额高于1700元的数据。
  27. 扩展库pandas中DataFrame对象提供了pivot()方法和pivot_table()方法实现透视表所需要的功能,返回新的DataFrame对象。
  28. 已知df为pandas的DataFrame对象,那么df.describe()可以返回所有列的数值数量、最小值、最大值、标准差、平均值等信息。
  29. 交叉验证可以用来检验模型的泛化能力或者评估模型的质量。
  30. 已知x = map(int, '123'),那么连续执行多次list(x)都可以得到同样的列表[1, 2, 3]。
  31. 机器学习扩展库sklearn中的评估器对象都提供了fit()方法使用数据对模型进行拟合和训练。
  32. 已知df为pandas的DataFrame对象,那么df[df['姓名'].isin(['张三','李四'])]表示访问df中“姓名”列的值为“张三”或“李四”的数据。
  33. 扩展库numpy的线性代数子模块linalg中提供了用来计算不同范数的函数norm()。
  34. 扩展库matplotlib.pyplot中的函数pie()可以用来绘制哪种图形?
  35. 使用可视化扩展库matplotlib的模块pyplot中的legend()函数创建和显示图例时,下面哪个参数可以用来设置图例的分栏数目?
  36. 表达式np.random.randn(3,4).shape的值为____________。
  37. 表达式not {}的值为____________。
  38. 表达式max([1111, 222, 33, 4], key=str)的值为?
  39. 使用可视化扩展库matplotlib的模块pyplot中的bar()函数绘制柱状图时,下面哪个参数可以用来设置柱的边框线宽?
  40. 使用可视化扩展库matplotlib的模块pyplot中的scatter()函数绘制散点图时,下面哪个参数可以用来设置散点的颜色?
  41. 已知x = np.array([1, 2, 3])和y = np.array([[3], [4], [5]]),那么表达式(x*y).sum()的值为____________。
  42. Python语言中字符串对象的哪个方法可以替换其中的子串,类似于Word中的“全部替换”功能。
  43. 假设已使用from functools import reduce导入reduce函数,那么表达式reduce(lambda x, y: x*y, range(10))的值为?
  44. 使用可视化扩展库matplotlib的模块pyplot中的pie()函数绘制饼状图时,下面哪个参数用来设置饼状图中第一个扇形区域的起始角度?
  45. 扩展库pandas中DataFrame对象的哪个方法可以用来计算数据差分?
  46. 使用可视化扩展库matplotlib的模块pyplot中的bar()函数绘制柱状图时,下面哪个参数可以用来设置柱的颜色?
  47. 机器学习扩展库sklearn的neighbors模块提供了k近邻算法的实现。
  48. 机器学习扩展库sklearn的model_selection模块实现了多个交叉验证器类以及用于学习曲线、数据集分割的函数。
  49. 已知x = np.arange(30).reshape(5,6),那么语句x[[0,3], :] = 0的功能为把数组x中行下标为0和3的所有元素值都修改为0。
  50. 扩展库sklearn.linear_model中LinearRegression类的对象拟合完成之后,可以通过属性coef_查看回归系数。
  51. 在Python中,可调用对象主要包括函数(function)、lambda表达式、类(class)、类的方法(method)、实现了特殊方法__call__()的类的对象,这些对象作为内置函数callable()的参数会使得该函数返回True。
  52. 数组的reshape()方法不能修改元素个数,resize()方法可以。
  53. 关联规则分析或者关联规则学习主要用于从大规模数据中寻找物品之间隐含的或者可能存在的联系,从而实现某种意义上的预测。
  54. 扩展库sklearn.linear_model中LinearRegression类的对象拟合完成之后,可以通过score()在测试数据集上进行评分来验证模型的质量。
  55. 已知df为包含若干(大于10)行和列数据的DataFrame对象,那么df[:5]可以查看前5列数据。
  56. 使用扩展库pandas中DataFrame对象的iloc方法访问数据时,可以使用DataFrame的index标签,也可以使用整数序号来指定要访问的行和列。
  57. Python的for和while循环必须带else子句。
  58. 在机器学习扩展库sklearn中,SVC类的参数C用来设置错误项的惩罚参数C,值越大对误分类的惩罚越小,间隔越小,对错误的容忍度越高。
  59. 使用扩展库pandas的函数read_excel()读取Excel文件时,可以使用参数index_col指定把哪一列的数据作为DataFrame对象的index。
  60. 依次执行语句s = 'abcabc'和s.replace('a', 'd')之后,变量s的值为'dbcdbc'?
  61. 使用可视化扩展库matplotlib的模块pyplot中的pie()函数绘制饼状图时,下面哪个参数用来设置每个扇形区域的填充颜色?
  62. 使用可视化扩展库matplotlib的模块pyplot中的scatter()函数绘制散点图时,下面哪个参数可以用来设置散点符号的透明度?
  63. 在机器学习扩展库sklearn中,KMeans聚类模型完成聚类之后,可以通过_____________属性查看各个聚类的中心。
  64. 已知data = np.arange(20).reshape(5,4),那么表达式len(data[[3,2], [0,3]])的值为?
  65. 已知列表data = [1, 2, 3, 4],那么data[2:100]的值为_________。
  66. 使用可视化扩展库matplotlib的模块pyplot中的xlabel()函数设置x轴标签时,下面哪个参数可以用来设置字体?
  67. 使用np.arange(8)生成的数组中最后一个元素的值为____________。
  68. 使用可视化扩展库matplotlib的模块pyplot中的pie()函数绘制饼状图时,下面哪个参数用来设置饼状图的圆心?
  69. 使用UTF8编码格式的中文文本文件可以直接使用GBK编码格式进行解码。
  70. 扩展库sklearn.svm中提供了线性支持向量机分类器LinearSVC、线性支持向量机回归器LinearSVR,基于libsvm的支持向量机分类器SVC、支持向量机回归器SVR,无监督异常值检测OneClassSVM,以及NuSVC和NuSVR。
  71. 机器学习扩展库sklearn的tree模块提供了用于分类和回归的决策树模型。
  72. 使用DBSCAN算法进行聚类时,需要使用参数指定聚类的数量。
  73. 理想的模型应该方差和偏差都很小。
  74. 表达式{3, 2, 1} > {1, 2, 3}的值为True。
  75. 扩展库pandas中Series对象的add_suffix()方法可以用于在每行索引后面增加后缀。
  76. 已知x = np.matrix([1, 2, 3, 4, 5]),那么表达式x*x.T的值为matrix([[55]])。
  77. 在Python 3.x中,reduce()是内置函数,可以直接使用。
  78. 聚类属于有监督学习。
  79. 使用扩展库pandas中DataFrame对象的loc方法访问数据时,可以使用DataFrame的index标签,也可以使用整数序号来指定要访问的行和列。
  80. 在Python 3.x中,内置函数input()用来接收用户的键盘输入,不管输入什么,都以字符串形式返回。
  81. 扩展库pandas中DataFrame对象的nsmallest()方法可以返回某列值最小的前几条数据。
  82. 已知x和y是两个等长的一维数组,那么表达式x.dot(y)和sum(x*y)的值相等。
  83. 使用可视化扩展库matplotlib的模块pyplot中的scatter()函数绘制散点图时,下面哪个参数可以用来设置散点符号的大小?
  84. 使用可视化扩展库matplotlib的模块pyplot中的pie()函数绘制饼状图时,下面哪个参数用来设置饼状图是否显示阴影?
  85. 使用可视化扩展库matplotlib的模块pyplot中的legend()函数创建和显示图例时,下面哪个参数可以用来设置图例中符号在前还是文字在前?
  86. 已知data = np.array([5, 8, 4, 2, 0]),那么表达式data.argmax()的值为?
  87. 表达式np.random.randn(3).shape的值为____________。
  88. 表达式{40, 50, 60} | {40, 60, 70}的值为______________。
  89. 扩展库pandas中的Series对象哪个方法可以返回最小的前n个数据?
  90. 使用可视化扩展库matplotlib的模块pyplot中的legend()函数创建和显示图例时,下面哪个参数可以用来设置图例的标题?
  91. 已知字典data = {'a':97, 'A':65},那么data.get('a', None)的值为________。
  92. 已知x = np.array((1, 2, 3, 4, 5)),那么表达式(x*2).sum()的值为____________。
  93. 已知x = np.array([3, 5, 1, 9, 6, 3]),那么表达式x[(x%2==0)&(x>5)][0]的值为____________。
  94. 表达式3 and 5的值为____________。
  95. 已知data = np.arange(20).reshape(5,4),那么表达式data[3,2]的值为?
  96. 扩展库pandas中Series对象和DataFrame的列数据提供了cat、dt、str三种属性接口(accessors),分别对应分类数据、日期时间数据和字符串数据。
  97. 扩展库pandas提供了crosstab()函数根据一个DataFrame对象中的数据生成交叉表,返回新的DataFrame对象。
  98. 扩展库numpy的isclose()和allclose()用来测试两个数组是否严格相等。
  99. 扩展库pandas中DataFrame对象groupby()方法的参数as_index=False时用来设置分组的列中的数据不作为结果DataFrame对象的index
  100. 两个不等长的数组不能相加。
  101. 对于分类算法而言,准确率定义被正确分类的样本数量与样本总数量的比值。
  102. 扩展库pandas的DataFrame数据中的字符串列支持str接口,该接口提供了center、contains、count、endswith、find、extract、lower、split等大量属性和方法。
  103. 欧几里德距离和曼哈顿距离可以看作闵科夫斯基距离的特例。
  104. 扩展库pandas中DataFrame结构的diff()对象支持进行数据差分,返回新的DataFrame对象。
  105. 下面表达式中等价于False的是?
  106. 表达式chr(ord('0')+3)的值为___________。
  107. 使用np.zeros((3,4))生成的数组中元素个数为____________。
  108. 已知data = np.arange(20).reshape(5,4),那么表达式data.sum(axis=1)[0]的值为?
  109. Python语言中字符串对象的哪个方法可以查看另一个字符串在当前字符串中出现的次数?
  110. 使用pip命令在线安装扩展库numpy的完整命令是____________。
  111. 假设已使用import matplotlib.pyplot as plt导入扩展库,那么语句ax1 = plt.subplot(221)执行之后,ax1表示画布左上角的子图。
  112. 扩展库pandas中DataFrame对象的nlargest()方法可以返回某列值最大的前几条数据。
  113. 主成分分析(Principal Component Analysis, PCA)是一种比较常用的线性降维方法,该方法通过对矩阵进行奇异值分解把高维空间中的数据映射到低维空间中重新表示,并期望在投影后的维度上方差最大,使得投影后的维度尽可能少,同时又保留尽可能多的原数据特征。
  114. 在扩展库sklearn.naive_bayes中提供了三种朴素贝叶斯算法,分别是伯努利朴素贝叶斯BernoulliNB、高斯朴素贝叶斯GaussianNB和多项式朴素贝叶斯MultinomialNB,分别适用于伯努利分布(又称二项分布或0-1分布)、高斯分布(也称正态分布)和多项式分布的数据集。
  115. 已知df为pandas的DataFrame对象,那么df[df['交易额'].between(800,850)]表示访问df中“交易额”列的值介于800和850之间的数据。
  116. 表达式np.diag((1,2,3,4)).shape的值为____________。
  117. 使用可视化扩展库matplotlib的模块pyplot中的scatter()函数绘制散点图时,下面哪个参数可以用来设置散点的符号?
  118. 扩展库matplotlib.pyplot中的函数polar()可以用来绘制哪种图形?
  119. 表达式all(np.random.rand(20000)内容已经隐藏,点击付费后查看
  120. 在训练模型时,如果每个样本都有预期的目标或理想值,称作有监督学习。
  121. 已知df为pandas的DataFrame对象,那么df.at[3, '姓名']表示访问行下标为3,姓名列的值。
  122. 扩展库pandas中Series对象的add_prefix()方法可以用于在每行索引前面增加前缀。
  123. 随机试验是指这样的试验,可以在相同条件下重复试验多次,所有可能发生的结果都是已知的,但每次试验到底会发生其中哪一种结果是无法预先确定的。
  124. 表达式-68 // 7的值为__________。
  125. 扩展库pandas中DataFrame对象支持使用dropna()方法丢弃带有缺失值的数据行,或者使用fillna()方法对缺失值进行批量替换,也可以使用loc()、iloc()方法直接对符合条件的数据进行替换。
  126. 标准差是一组数据分散程度或波动程度的一种度量,也是数据不确定性或不稳定性的一种度量。对于一组特定的数据,如果标准差较大则代表大部分数值和其平均值之间差异较大,如果标准差较小则代表这些数值较接近平均值。
  127. 已知x = np.array((1, 2, 3, 4, 5)),那么表达式(2**x).max()的值为____________。
  128. 机器学习扩展库sklearn的cluster模块中提供了DBSCAN、KMeans等大量聚类算法的实现。
  129. 在可视化扩展库matplotlib的模块pyplot中,plot(x, y, 'r-+')使用等长数组x和y中对应元素作为端点坐标绘制红色实心线并使用加号标记端点。
  130. 表达式np.diag((1,2,3,4)).size的值为____________。
  131. 已知x = np.random.randint(0, 100, (3,5)),那么表达式np.ceil(abs(np.sin(x))).sum()的值为____________。
  132. 使用可视化扩展库matplotlib的模块pyplot中的legend()函数创建和显示图例时,下面哪个参数可以用来设置图例的位置?
  133. 扩展库pandas的read_excel()函数用于读取Excel文件中的数据并创建DataFrame对象。
  134. 扩展库pandas中DataFrame对象支持sort_index()方法沿某个方向按标签进行排序并返回一个新的DataFrame对象。
  135. 使用扩展库pandas的函数read_excel()读取Excel文件时,可以使用参数thousands指定把什么符号作为千分符。
  136. 岭回归是一种用于共线性数据(自变量之间存在较强的线性关系)分析的有偏估计回归方法,是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息、降低精度为代价从而获得更符合实际、更可靠的回归系数,对病态数据(这样的数据中某个元素的微小变动会导致计算结果误差很大)的拟合效果比最小二乘法好。
  137. 使用可视化扩展库matplotlib的模块pyplot中的legend()函数创建和显示图例时,下面哪个参数可以用来设置图例是否显示阴影效果?
  138. 扩展库pandas的DataFrame对象的plot()方法可以直接绘制折线图、柱状图、饼状图等各种形状的图形来展示数据,绘图时会自动调用扩展库matplotlib的功能。
  139. 扩展库pandas中DataFrame结构支持使用groupby()方法根据指定的一列或多列的值进行分组,得到一个GroupBy对象,该GroupBy对象支持大量方法对列数据进行求和、求均值以及其他操作,并自动忽略非数值列。
  140. 列表的sort()方法没有返回值,或者说返回值为_________。
  141. 机器学习扩展库sklearn中的评估器对象大多提供了predict()方法用来对未知数据进行预测或分类。
  142. 随机森林是一种集成学习方法,基本思想是把几棵不同参数的决策树打包到一起,每棵决策树单独进行预测,然后计算所有决策树预测结果的平均值(适用于回归分析)或所有决策树“投票”得到最终结果(适用于分类)。
  143. 条件概率也称后验概率,是指在另一个事件B已经发生的情况下事件A发生的概率,记为P(A|B)。
  144. 熵表示的是数据中包含的信息量大小或着数据的混乱程度。熵越小,数据的纯度越高,数据越趋于一致,混乱程度越低;熵越大,数据的纯度越低,数据混乱程度越高。
  145. 模块sklearn.linear_model中的RidgeCV实现了带有内置的alpha参数交叉验证的岭回归算法,类似于GridSearchCV,可用来在指定范围内自动搜索和确定约束项的最佳系数。
  146. KMeans算法的基本思想是:选择样本空间中k个样本(点)为初始中心,然后对剩余样本进行聚类,每个中心把距离自己最近的样本“吸引”过来,然后更新聚类中心的值,依次把每个样本归到距离最近的类中,重复上面的过程,直至得到某种条件下最好的聚类结果。
  147. 机器学习扩展库sklearn在model_selection模块中提供了用来实现交叉验证的函数cross_val_score()。
  148. 扩展库pandas中DataFrame对象的index属性表示列名。
  149. 一般地,不会把给定的整个数据集都用来训练模型,而是将其分成训练集和测试集两部分,使用训练集对模型进行训练或学习,然后把测试集输入训练好的模型并评估其表现。
  150. 在进行数据分析和挖掘时,应使用样本尽可能多的特征,这样可以得到更理想的结果。
  151. 扩展库pandas中DataFrame对象的std()方法可以计算标准差,cov()方法可以计算协方差。
  152. 对于复杂表达式,如果计算结果是正确的,那么不建议再增加圆括号来说明计算顺序,这样可以使得代码更加简洁清晰。
  153. 在使用KNN算法对未知样本进行分类时,已知类别中各类别包含的样本数量最好差不多,否则会影响结果的准确性。
  154. 扩展库numpy的函数corrcoef()用来计算相关系数矩阵。
  155. 已知df为pandas的DataFrame对象,那么df[:10]表示访问df中前10列数据。
  156. 方差用来描述数据的离散程度或者波动程度,比较分散的数据集的方差大,而相对集中的数据集的方差小。
  157. 扩展库numpy的线性代数子模块linalg中提供了求解线性方程组的函数solve()和求解线性方程组最小二乘解的函数lstsq()。
  158. 线性回归算法只适用于具有两个特征的样本,不适用于具有3个以上特征的样本数据。
  159. 扩展库sklearn.linear_model中的LinearRegression类实现了线性回归算法。
  160. 扩展库pandas支持使用Python字典直接创建DataFrame对象,此时字典中的“键”将作为DataFrame中的columns。
  161. 基尼值越大,表示数据纯度越低,也表示从样本空间中随机选取两个样本时这两个样本所属类别不一样的概率越大。
  162. 聚类算法KMeans属于有监督学习算法。
  163. 已知x = np.matrix([[1,2,3], [4,5,6]]),那么表达式x.mean(axis=0)的值为matrix([[ 2.5, 3.5, 4.5]])。
  164. 在使用pandas进行处理时,需要借助于人工分析根据具体的业务数据来确定异常值的阈值。
  165. 在对文件进行读写时,文件指针的位置会自动变化,始终表示读写的当前位置。
  166. 扩展库numpy的线性代数子模块linalg中提供了用来计算特征值与特征向量的函数eig()。
  167. 扩展库jieba的函数cut()可以用来对中文文本进行分词并返回包含分词结果的列表。
  168. 扩展库numpy的线性代数子模块linalg中提供了用来计算逆矩阵的函数inv()。
  169. 假设已使用import matplotlib.pyplot as plt导入扩展库,那么语句ax2 = plt.subplot(222, projection='polar')执行之后,ax2表示画布右上角的子图,并且在该子图中可以绘制极坐标图。
  170. 扩展库numpy函数cov()可以用来计算协方差,函数std()用来计算标准差。
  171. 在可视化扩展库matplotlib的模块pyplot中,plot(x, y, 'g--v')使用等长数组x和y中对应元素作为端点坐标绘制绿色短划线并以下三角标记端点。
  172. 机器学习扩展库sklearn的naive_bayes模块提供了朴素贝叶斯算法的实现。
  173. 已知df为pandas的DataFrame对象,那么df[:10]表示访问df中前10行数据。
  174. 在使用KNN算法对未知样本进行分类时,参数k的取值不重要,对结果影响不大。
  175. 概率是用来描述在特定试验中一个事件发生的可能性大小的指标,是介于0和1之间的实数,可以定义为某个事件发生的次数与试验总次数的比值。
  176. 表达式len(np.random.randint(0, 50, 5))的值为____________。
  177. 在机器学习扩展库sklearn中,KMeans聚类模型完成聚类之后,可以通过_____________属性查看样本的标签。
  178. 已知x = np.array((1, 2, 3, 4, 5)),那么表达式(x//5).sum()的值为____________。
  179. 已知x = np.array((1, 2, 3, 4, 5)),那么表达式(x**2).max()的值为____________。
  180. 使用可视化扩展库matplotlib的模块pyplot中的pie()函数绘制饼状图时,下面哪个参数用来设置每个扇形区域偏离圆心的程度?
  181. 表达式{40, 50, 60} & {40, 60, 70}的值为______________。
  182. 使用可视化扩展库matplotlib的模块pyplot中的xlabel()函数设置x轴标签时,下面哪个参数可以用来设置字号?
  183. 已知x = np.array((1, 2, 3, 4, 5)),那么表达式sum(x*x)的值为____________。
  184. 已知x = np.array([3, 5, 1, 9, 6, 3]),那么表达式np.argmax(x)的值为____________。
  185. 表达式np.ones((3,4)).sum()的值为____________。
  186. 表达式{40, 50, 60} - {40, 60, 70}的值为____________。
  187. 已知x = np.array([3, 5, 1, 9, 6, 3]),那么表达式x[x>5].sum()的值为____________。
  188. 使用可视化扩展库matplotlib的模块pyplot中的legend()函数创建和显示图例时,下面哪个参数可以用来设置图例的边框颜色?
  189. 已知x = [1, 2, 3]和y = [4, 5, 6],那么表达式sum(map(lambda i,j: i*j, x, y))的值为?
  190. 已知x = np.array([3, 5, 1, 9, 6, 3]),那么表达式np.where(x>5, 1, 0).sum()的值为____________。
  191. 使用可视化扩展库matplotlib的模块pyplot中的legend()函数创建和显示图例时,下面哪个参数可以用来设置图例的背景颜色?
  192. Python的主程序文件python.exe属于二进制文件。
  193. 函数内部定义的局部变量当函数调用结束后被自动删除。
  194. 使用可视化扩展库matplotlib的模块pyplot中的legend()函数创建和显示图例时,下面哪个参数可以用来设置图例的字体?
  195. 使用可视化扩展库matplotlib的模块pyplot中的bar()函数绘制柱状图时,下面哪个参数可以用来设置柱的位置?
  196. 扩展库matplotlib.pyplot中的函数bar()可以用来绘制哪种图形?
  197. 假设已使用import matplotlib as mpl导入可视化扩展库,那么mpl.rcParams['legend.fontsize'] = 10语句的功能是设置图例的字号。
  198. 使用可视化扩展库matplotlib的模块pyplot中的pie()函数绘制饼状图时,下面哪个参数用来设置饼状图的半径?
  199. 可视化扩展库matplotlib的模块pyplot中哪个函数可以用来设置同一个画布中多个子图之间的水平间距和垂直间距?
  200. 扩展库matplotlib.pyplot中的函数scatter()可以用来绘制哪种图形?
  201. 使用可视化扩展库matplotlib的模块pyplot中的bar()函数绘制柱状图时,下面哪个参数可以用来设置柱的内部填充符号?
  202. 扩展库matplotlib.pyplot中的函数plot()可以用来绘制哪种图形?
  203. 使用可视化扩展库matplotlib的模块pyplot中的xticks()函数设置x轴刻度时,下面哪个参数用来设置刻度文本的旋转角度?
  204. 图例往往位于图形绘制结果的一角或一侧,也可以根据图形的特点来设置位置以及背景色等其他样式,主要用于对所绘制的图形中使用的各种符号和颜色进行说明,对于理解图形有重要的作用。
  205. 使用朴素贝叶斯算法进行分类时,分别计算未知样本属于每个已知类的概率,然后选择其中概率最大的类作为分类结果。
  206. 在机器学习扩展库sklearn中,Lasso是可以估计稀疏系数的线性模型,尤其适用于减少给定解决方案依赖的特征数量的场合。如果数据的特征过多,而其中只有一小部分是真正重要的,此时选择Lasso比较合适。
  207. DBSCAN(Density-Based Spatial Clustering of Applications with Noise)属于密度聚类算法,把类定义为密度相连对象的最大集合,通过在样本空间中不断搜索高密度的核心样本并扩展得到最大集合完成聚类,能够在带有噪点的样本空间中发现任意形状的聚类并排除噪点。
  208. 在样本的众多特征中,并不是每个特征都对要分析的问题有贡献。即使是对问题有贡献的若干特征,每个特征的重要程度可能也不一样。
  209. KNN算法是k-Nearest Neighbor的简称,叫作k近邻算法,属于有监督学习算法,既可以用于分类,也可以用于回归。
  210. DBSCAN算法不需要预先指定聚类数量,但对用户设定的参数非常敏感。当空间聚类的密度不均匀、聚类间距相差很大时,聚类质量较差。
  211. 支持向量机(Support Vector Machine, SVM)是通过寻找超平面对样本进行分隔从而实现分类或预测的算法,分隔样本时的原则是使得间隔最大化,寻找间隔最大的支持向量。
  212. 如果DataFrame对象中索引是日期时间数据,或者包含日期时间类型数据列,可以使用resample()方法进行重采样,实现按时间段进行统计查看员工业绩的功能。
  213. 扩展库pandas中DataFrame对象的drop_duplicates()方法可以用来删除重复的数据。
  214. 使用扩展库pandas的函数read_excel()读取Excel文件时,可以使用参数na_values指定哪些值被解释为缺失值。
  215. 使用扩展库pandas的函数read_excel()读取Excel文件时,可以使用参数sheetname指定读取哪个工作表中的数据,并且该参数必须指定为工作表的名字,不能是序号。
  216. 扩展库pandas的read_csv()函数用于读取CSV文件中的数据并创建DataFrame对象。
  217. 表达式np.empty((3,5)).sum()的值一定为0。
  218. 扩展库numpy中的arange()函数功能和内置函数range()类似,只能生成包含整数的数组,无法创建包含实数的数组。
  219. 扩展库numpy在linalg模块中提供了计算奇异值分解的函数svd()。
  220. 扩展库numpy的函数append()和insert()是在原数组的基础上追加或插入元素,没有返回值。
  221. 已知x是一个足够大的numpy二维数组,那么语句x[0, 2] = 4的作用是把行下标为0、列下标为2的元素值改为4。
  222. 已知x.shape的值为(3, 5),那么语句x[:, 3] = 2的作用是把数组x所有行中列下标为3的元素值都改为2。
  223. 扩展库numpy的isclose()返回包含若干True/False值的数组,而allclose()返回True或False值。
  224. 如果要操作docx格式的Word文档,可以按照扩展库python-docx。
  225. 二进制文件不能使用记事本程序打开。
  226. 使用内置函数open()打开文件时,只要文件路径正确就总是可以正确打开的。
  227. 在Python中,不能在一个函数的定义中再定义一个嵌套函数。
  228. 在定义函数时,某个参数名字前面带有两个*符号表示可变长度参数,可以接收任意多个关键参数并将其存放于一个字典之中。
  229. 在编写多层循环时,为了提高运行效率,应尽量减少内循环中不必要的计算。
  230. 调用函数时传递的实参个数必须与函数形参个数相等才行。
  231. g = lambda x: 3不是一个合法的赋值表达式。
  232. Python关键字and和or连接多个表达式时具有惰性求值特点,只计算必须计算的表达式。
  233. Python语言中字符串对象的strip()只能删除字符串两端的空白字符,无法删除其他字符。
  234. 列表可以作为字典元素的“键”。
  235. 列表的rindex()方法返回指定元素在列表中最后一次出现的位置。
  236. Python语言中同一个集合中的元素不会重复,每个元素都是唯一的。
  237. 包含列表的元组可以作为字典的“键”。
  238. 生成器表达式的计算结果是一个元组。
  239. 已知列表x = [1, 2, 1, 2, 3, 1],那么执行x.remove(1)之后,x的值为[2, 2, 3]。
  240. 表达式4 < 5>
  241. 表达式3 > 5 and math.sin(0)的值为0。
  242. 已知列表x = [1, 2, 3],那么执行y = x.reverse()之后,y的值为[3, 2, 1]。
  243. 缩进对于Python程序至关重要。
  244. 在Python 3.x中不能使用汉字作为变量名。
  245. Python支持面向对象程序设计。
  246. 下面属于Python编程语言特点的有?
  247. 下面哪些是正确的Python标准库对象导入语句?
温馨提示支付 ¥5.00 元后可查看付费内容,请先翻页预览!
点赞(9) dxwkbang
返回
顶部