第一章测试
1.大数据的起源是( )。
A:金融
B:互联网
C:公共管理
D:电信

答案:B
2.机器学习的实质是( )。
A:建立数据模型
B:根据现有数据,寻找输入数据和输出数据的映射关系/函数
C:衡量输入数据和输出数据的映射关系/函数的好坏
D:挑出输入数据和输出数据的最佳映射关系/函数

答案:B
3.Spark支持的分布式部署方式中哪个是错误的( )。
A:spark on YARN
B:spark on mesos
C:Spark on local
D:standalone

答案:C
4.

以下表述正确的是:( )


A:深度学习是机器学习的一种。
B:人工智能是人们长远以来的目标,期待机器像人一样有智慧。
C:机器学习指机器有学习的能力,是人类达成人工智能目标的手段。
D:人或机器表现的很有智慧取决于先天本能/创造者事先设定的规则和后天学习。

答案:ABCD
5.

有效抑制机器学习过拟合的方法是( )


A:减少数据量。
B:平滑损失函数。
C:重新设计损失函数,引入平滑函数。
D:加大数据量。

答案:BCD
6.下面表述正确的( )
A:迁移学习指训练集中包括没有输出数据与之对应的输入数据,但这些输入数据与其他输入数据不相干。
B:强化学习指只有评价性输出结果的机器学习。
C:监督学习指训练集所有输入数据都有相应输出数据与之对应。
D:监督学习指训练集中包括没有输出数据与之对应的输入数据,且所有输入数据属于同类别数据。

答案:ABCD
7.关于Spark中的RDD描述正确的( )
A:Destributed:分布式,可以并行在集群计算。
B:RDD(Resilient Distributed Datset)叫做弹性分布式数据集,是Spark中最基本的数据抽象。
C:Resilient:表示弹性的,弹性表示。
D:Datset:就是一个集合,用于存放数据的。

答案:ABCD
8.大数据的定义是不唯一的,从不同的角度对大数据都会有不同的理解。( )
A:对 B:错
答案:A
9.关系抽取一般在实体抽取任务之后,用于抽取两个实体之间的句间关系。( )
A:对 B:错
答案:B
10.Spark的四大组件为Spark Streaming、Mlib、Graphx、Spark R。( )
A:对 B:错
答案:B

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(176) dxwkbang
返回
顶部