第五章单元测试
  1. 以下关于缺失值检测的说法中,正确的是( )。

  2. A:dropna方法既可以删除观测记录,亦可以删除特征
    B:null 和notnull可以对缺失值进行处理
    C:fllna 方法中用来替换缺失值的值只能是数据框
    D:pandas库中的 internolate模块包含了多种插值方法

    答案:dropna方法既可以删除观测记录,亦可以删除特征

  3. 以下关于异常值检测的说法中错误的是( )。

  4. A:基于聚类的方法可以讲行离群点检测
    B:使用箱型图方法时要求数据服从或近似服从正态分布
    C:3原则利用了统计学中小概率事件的原理
    D:某干分类的方法可以讲行离群点检测
  5. 下列与标准化方法有关的说法错误的是( )。

  6. A:多个特征的数据的K-Means聚类不需要对数据进行标准化
    B:小数定标标准化实质上就是将数据按照一定的比例缩小
    C:离差标准化简单易懂,对最大值和最小值敏感度不高
    D:标准差标准化是最常用的标准化方法,又名零—均值标准化
  7. 关于标准差标准化,下列说法中错误的是( )。

  8. A:Python中可自定义该方法实现函数
    def StandardScaler(data):
    data-(data-data.mean())/data.std()return data
    B:计算公式为
    C:可能会改变数据的分布情况
    D:经过该方法处理后的数据均值为0,标准差为1
  9. 以下关于pandas数据预处理说法正确的是( )。

  10. A:pandas没有做哑变量的函数
    B:pandas可以实现所有的数据预处理操作
    C:cut 函数默认情况出效以认情况下做的是等宽法离散
    D:在不导入其他库的情况下,仅仅使用pandas就可实现聚类分析离散化

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(3) dxwkbang
返回
顶部