内蒙古农业大学
第一章单元测试
  1. 大数据的起源是( )。

  2. A:金融
    B:电信
    C:公共管理
    D:互联网

    答案:互联网

  3. 机器学习的实质是( )。

  4. A:建立数据模型
    B:挑出输入数据和输出数据的最佳映射关系/函数
    C:衡量输入数据和输出数据的映射关系/函数的好坏
    D:根据现有数据,寻找输入数据和输出数据的映射关系/函数

    答案:根据现有数据,寻找输入数据和输出数据的映射关系/函数

  5. Spark支持的分布式部署方式中哪个是错误的( )。

  6. A:spark on mesos
    B:spark on YARN
    C:standalone
    D:Spark on local

    答案:Spark on local

  7. 以下表述正确的是:( )


  8. A:深度学习是机器学习的一种。
    B:人或机器表现的很有智慧取决于先天本能/创造者事先设定的规则和后天学习。
    C:机器学习指机器有学习的能力,是人类达成人工智能目标的手段。
    D:人工智能是人们长远以来的目标,期待机器像人一样有智慧。

    答案:深度学习是机器学习的一种。
    ###人或机器表现的很有智慧取决于先天本能/创造者事先设定的规则和后天学习。
    ###机器学习指机器有学习的能力,是人类达成人工智能目标的手段。
    ###人工智能是人们长远以来的目标,期待机器像人一样有智慧。

  9. 有效抑制机器学习过拟合的方法是( )


  10. A:减少数据量。
    B:加大数据量。
    C:重新设计损失函数,引入平滑函数。
    D:平滑损失函数。

    答案:加大数据量。
    ###重新设计损失函数,引入平滑函数。
    ###平滑损失函数。

  11. 下面表述正确的( )

  12. A:迁移学习指训练集中包括没有输出数据与之对应的输入数据,但这些输入数据与其他输入数据不相干。
    B:监督学习指训练集所有输入数据都有相应输出数据与之对应。
    C:监督学习指训练集中包括没有输出数据与之对应的输入数据,且所有输入数据属于同类别数据。
    D:强化学习指只有评价性输出结果的机器学习。

    答案:迁移学习指训练集中包括没有输出数据与之对应的输入数据,但这些输入数据与其他输入数据不相干。
    ###监督学习指训练集所有输入数据都有相应输出数据与之对应。
    ###监督学习指训练集中包括没有输出数据与之对应的输入数据,且所有输入数据属于同类别数据。
    ###强化学习指只有评价性输出结果的机器学习。

  13. 关于Spark中的RDD描述正确的( )

  14. A:RDD(Resilient Distributed Datset)叫做弹性分布式数据集,是Spark中最基本的数据抽象。
    B:Resilient:表示弹性的,弹性表示。
    C:Destributed:分布式,可以并行在集群计算。
    D:Datset:就是一个集合,用于存放数据的。

    答案:RDD(Resilient Distributed Datset)叫做弹性分布式数据集,是Spark中最基本的数据抽象。
    ###Resilient:表示弹性的,弹性表示。
    ###Destributed:分布式,可以并行在集群计算。
    ###Datset:就是一个集合,用于存放数据的。

  15. 大数据的定义是不唯一的,从不同的角度对大数据都会有不同的理解。( )

  16. A:对 B:错
    答案:对
  17. 关系抽取一般在实体抽取任务之后,用于抽取两个实体之间的句间关系。( )

  18. A:对 B:错
    答案:错
  19. Spark的四大组件为Spark Streaming、Mlib、Graphx、Spark R。( )

  20. A:对 B:错
    答案:错

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(3) dxwkbang
返回
顶部