第一章测试
1.目前,数据密集型科学研究的范式也称为科学研究的( )。
A:第二范式 B:第三范式 C:第四范式 D:第一范式
答案:C
2.在Drew Conway提出的数据科学韦恩图中,危险区是指( )。
A:忽视专业领域知识的掌握 B:重视机器学习算法的掌握 C:缺乏数学解释的能力 D:忽视计算机编程的能力
答案:C
3.以下不属于数据离散程度统计指标的是( )。
A:方差 B:极差 C:标准差 D:数学期望
答案:D
4.随着大数据、人工智能的发展,数据科学与( )建立了本质性的联系。
A:机器学习 B:深度学习 C:统计学 D:数据挖掘
答案:D
5.IBM提出的大数据“5V”理论,增加了( )特征。
A:Value(价值密度低) B:Velocity(速度快) C:Veracity(真实性) D:Variety(多样性)
答案:C
6.随着大数据的广泛应用和技术的不断创新,人们的思维模式也发生了很大的变化,以下不属于大数据思维的是( )。
A:总体性思维 B:相关性思维 C:因果性思维 D:容错性思维
答案:C
7.当今大数据区别于传统的小数据,其主要差异不包括( )。
A:应用需求 B:数据特点 C:数据来源 D:技术框架
答案:C
8.目前,对大数据分析技术面临的主要挑战,描述错误的是( )。
A:数据处理分析算法需要在实时性和准确率之间做出平衡 B:数据往往伴有噪声,对数据的管理和评价容易出现偏差 C:数据分布广泛,只有在集成后才能更好地处理和分析 D:数据生存环境是动态变化的,具有很强的不确定性
答案:C
9.大数据技术生态中,使用流处理模式,适用于大型互联网服务日志采集的系统是( )。
A:SparkSQL B:Kafka C:RabbitMQ D:RocketMQ
答案:B
10.以下不属于大数据分析和挖掘技术平台的是( )。
A:TensorFlow B:Impala C:Apache Drill D:ZooKeeper
答案:D
11.目前,数据的来源主要包括___、___和非结构化数据三种类型。

答案:
12.根据要分析的数据对象的类型,数据分析分为___和___两大类型。

答案:
13.从一般意义上来说,NoSQL是指___。

答案:
14.常用的关系型数据库中表示和存储的数据,属于___数据。

答案:
15.在大数据处理时,有价值的数据所占比例很小,而收集、存储和分析大数据的成本往往偏高,说明大数据具有___的特征。

答案:
16.采集大数据时,按照数据来源的不同,主要有系统日志、___、数据库和传感设备等四种不同的形式。

答案:
17.数据清洗主要包括缺失值处理、___和异常值处理。

答案:
18.用于大数据存储和管理的典型技术工具主要有___、NoSQL数据库系统、数据仓库系统三种类型。

答案:
19.大数据的处理模式,主要有批处理模式、___和混合处理模式三种类型。

答案:
20.数据挖掘是一种深层次的数据分析方法,常用方法主要有分类、回归分析、___和关联规则等。

答案:
21.大数据和数据科学既有联系、又有区别。( )
A:对 B:错
答案:A
22.在大数据分析和挖掘技术中,TensorFlow是目前最热门的机器学习框架平台。( )
A:对 B:错
答案:A
23.从用户的角度,数据可视化可以更好地发现数据中存在的价值和模式。( )
A:错 B:对
答案:B
24.大数据中潜在的价值越来越受到人们的关注,但数据本身的价值密度很低。( )
A:错 B:对
答案:B
25.Hadoop YARN是一种通用的资源管理系统,但不能协调资源和任务之间的调度。( )
A:对 B:错
答案:B
26.未来,数据科学与人工智能的结合将越来越紧密。( )
A:错 B:对
答案:B
27.Tableau属于可编程的数据可视化分析工具。( )
A:对 B:错
答案:B
28.Python技术不支持大数据的处理和分析。( )
A:错 B:对
答案:A
29.大数据时代,数据量呈指数级增长,数据中的价值也会随之相应增长。( )
A:对 B:错
答案:B
30.在数据量的度量单位中,EB和TB是1000倍的关系。( )
A:对 B:错
答案:B

温馨提示支付 ¥4.99 元后可查看付费内容,请先翻页预览!
点赞(156) dxwkbang
返回
顶部