第二章单元测试
  1. 回归问题和分类问题都有可能发生过拟合。( )


  2. A:错 B:对
    答案:对
  3. 对于k折交叉验证, 以下对k的说法正确的是 ( )


  4. A:k越大, 不一定越好, 选择大的k会加大评估时间
    B:在选择k时, 要最小化数据集之间的方差
    C:选择更大的k, 就会有更小的bias (因为训练集更加接近总数据集)
    D:k越大越好

    答案:k越大, 不一定越好, 选择大的k会加大评估时间
    ###在选择k时, 要最小化数据集之间的方差
    ###选择更大的k, 就会有更小的bias (因为训练集更加接近总数据集)

  5. 小明参加Kaggle某项大数据竞赛,他的成绩在大赛排行榜上原本居于前20,后来他保持特征不变,对原来的模型做了1天的调参,将自己的模型在自己本地测试集上的准确率提升了3%,然后他信心满满地将新模型的预测结果更新到了大赛官网上,结果懊恼地发现自己的新模型在大赛官方的测试集上准确率反而下降了。对此,他的朋友们展开了讨论,下列说法正确的是( )


  6. A:小明应该乖乖使用默认的参数就行了,调参是不可能有收益的
    B:小明可以考虑一下,使用交叉验证来验证一下是否发生了过拟合
    C:从机器学习理论的角度,这样的情况不应该发生,应该去找大赛组委会反应
    D:小明这个有可能是由于过拟合导致的

    答案:小明可以考虑一下,使用交叉验证来验证一下是否发生了过拟合
    ###小明这个有可能是由于过拟合导致的

  7. 下列哪种方法可以用来减小过拟合?( )


  8. A:更多的训练数据
    B:减小模型的复杂度
    C:L2 正则化
    D:L1 正则化

    答案:更多的训练数据
    ###减小模型的复杂度
    ###L2 正则化
    ###L1 正则化

  9. 下列关于 bootstrap 说法正确的是?( )


  10. A:从总的 N 个样本中,无放回地抽取 n 个样本(n < N)
    B:从总的 N 个样本中,有放回地抽取 n 个样本(n < N)
    C:从总的 M 个特征中,无放回地抽取 m 个特征(m < M)
    D:从总的 M 个特征中,有放回地抽取 m 个特征(m < M)

    答案:从总的 N 个样本中,有放回地抽取 n 个样本(n < N)

  11. 评估完模型之后,发现模型存在高偏差(high bias),应该如何解决?( )


  12. A:增加模型的特征数量
    B:增加样本数量
    C:减少模型的特征数量

    答案:增加模型的特征数量

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(1) dxwkbang
返回
顶部