⬆️⬆️⬆️本课程2024最新同名章节期末答案⬆️⬆️

Spark大数据技术与应用期末考试答案题库2024秋

所有课程章节/期末均有答案,可提供word版,点击联系客服✅

8 阅读 0 评论 2 点赞

山西职业技术学院

DataFrame的limit方法执行完成返回的是一个新的DataFrame对象.（）

答案:对

DStream全称Discretized Stream（离散化的数据流），是Spark Stream的基础抽象，表示数据源不间断的数据流和经过各种操作后的结果数据流。（）

答案:错

foreachRDD函数是DStream提供的一个功能强大的方法，它可以将数据发送到外部系统。（）

答案:对

DataFrame的orderBy方法默认为降序排列。（）

答案:错

在Spark Streaming官方文档中指出，join转换操作极大的丰富了DStream上能够进行的操作内容。（）

答案:B:对

Spark Streaming是基于Spark的准实时流式计算框架，其基本原理是实时接收输入数据流并将数据流按照时间分成微批次数据，随后由 Spark计算引擎处理微批次数据生成最终的结果批次数据，最后将数据输出到Spark Streaming支持的数据输出地（）

答案:对

在Spark程序中，setAppName函数的作用是设置当前程序名称。（）

答案:对

Spark是用来构建大型的、低延迟的数据分析应用程序（）

答案:A:错

join算子将两个不同的RDD数据集中的数据进行连接，相同key的value会连接在一起，如果两个数据源中有多个相同的key，则会依次匹配，如果没有相同的数据，则不匹配。（）

答案:B:对

DataFrame数据输出中mode方法的参数为error代表如果指定的位置已有数据则抛出相应的异常。（）

内容已经隐藏，点击付费后查看

saveAsTextFile属于转换算子，可以将RDD数据保存为文本文件。（）

内容已经隐藏，点击付费后查看

转换操作函数map(func)表示利用函数func处理原DStream的每个元素，并返回一个新的DStream。（）

内容已经隐藏，点击付费后查看

JSON是一种独立于语言和平台、轻量级的数据交换格式。JSON格式易阅读和编写，方便机器进行解析，JSON文件使用广泛且频繁。几乎每门开发语言都有处理JSON的API。（）

内容已经隐藏，点击付费后查看

Spark的sbin目录，该目录存放的是启动和停止Saprk相关服务的脚本。（）

内容已经隐藏，点击付费后查看

union算子可以将两个RDD数据集合并在一起。（）

内容已经隐藏，点击付费后查看

reduceByWindow该函数含义与表5-1中countByValue函数一致，只不过对应的数据源不同。countByValueAndWindow的数据源是基于该DStream的窗口长度中的所有数据。（）

内容已经隐藏，点击付费后查看

saveAsHadoopFiles方法，它是以Hadoop文件形式存储每一批次的DStream数据。（）

内容已经隐藏，点击付费后查看

Spark的jars目录存放的是spark依赖包。这些jar包提供了Spark运行所需的核心类库（）

内容已经隐藏，点击付费后查看

调用StreamingContext的awaitTermination()方法，来等待计算逻辑的终止。（）

内容已经隐藏，点击付费后查看

countByKey算子可以统计键值对RDD中每一个key出现的次数，并且把结果保存到一个map集合中。（）

内容已经隐藏，点击付费后查看

Spark SQL的SparkSession对象可以通过哪些方法从存放到HDFS上的结构化数据文件创建DataFrame。（）

内容已经隐藏，点击付费后查看

下面哪个算子可以对key-value类型的数据进行操作。（）

内容已经隐藏，点击付费后查看

下列哪些属于输出函数（）

内容已经隐藏，点击付费后查看

使用SparkContext对象创建StreamingContext需要传递两个参数（）

内容已经隐藏，点击付费后查看

collectAsList方法与collect方法说法正确的是（）

内容已经隐藏，点击付费后查看

通过printSchema()方法查看，该方法会输出DataFrame的（）

内容已经隐藏，点击付费后查看

以下关于流数据特征的描述，哪些是正确的。（）

内容已经隐藏，点击付费后查看

在RDD中，窄依赖的特点为（）

内容已经隐藏，点击付费后查看

本课程中Spark框架使用了哪些搭建模式（）

内容已经隐藏，点击付费后查看

Spark有哪些优势（）

内容已经隐藏，点击付费后查看

使用SparkConf对象创建StreamingContext需要传递两个参数（）

内容已经隐藏，点击付费后查看

在RDD读取JSON文件中，导入隐式转换参数formats是下列哪几个方法转化数据所依赖的参数、（）

内容已经隐藏，点击付费后查看

在内存中创建RDD可以使用下列哪些函数（）

内容已经隐藏，点击付费后查看

DataFrame的哪个方法容易造成内存溢出（）

内容已经隐藏，点击付费后查看

RDD数据集的五个特性（）

内容已经隐藏，点击付费后查看

flatMap算子实现了那种功能（）

内容已经隐藏，点击付费后查看

Spark SQL 特点正确的是（）

内容已经隐藏，点击付费后查看

创建StreamingContext有两种方式，是通过（）对象完成创建。

内容已经隐藏，点击付费后查看

下列返回数组形式的算子是（）

内容已经隐藏，点击付费后查看

Spark框架中的进程有哪些（）。

内容已经隐藏，点击付费后查看

创建DStream，使用（）变量获取textFileStream方法，该方法将监视指定的HDFS目录并处理在该目录中创建的任何文件。

内容已经隐藏，点击付费后查看

在flatMap算子中传递一个匿名函数，通过匿名函数调用split方法，可以（）

内容已经隐藏，点击付费后查看

103在Spark Streaming中批处理时间间隔是指（）

内容已经隐藏，点击付费后查看

创建StreamingContext对象，该对象是（）流处理的编程入口点。

内容已经隐藏，点击付费后查看

在本课程中，启动spark集群的命令是（）

内容已经隐藏，点击付费后查看

count行动算子的作用是（）

内容已经隐藏，点击付费后查看

join算子的作用是（）

内容已经隐藏，点击付费后查看

DataFrame的select方法和selectExpr方法说法正确的是（）

内容已经隐藏，点击付费后查看

DataFrame的col(colName: String)方法返回值类型为（）

内容已经隐藏，点击付费后查看

下列哪个数据结构拥有Schema信息（）

内容已经隐藏，点击付费后查看

通过外部存储来创建RDD使用的函数是（）

内容已经隐藏，点击付费后查看

Spark中Master进程的职责是什么（）

内容已经隐藏，点击付费后查看

通过DataFrame的哪个方法可以查看DataFrame的数据模式（）

内容已经隐藏，点击付费后查看

用户在开发Spark Streaming程序之前必须创建一个（）对象。

内容已经隐藏，点击付费后查看

saveAsTextFiles方法，它是以（）文件形式存储每一批次的DStream数据。

内容已经隐藏，点击付费后查看

DataFrame的apply(colName: String)返回值类型为（）

内容已经隐藏，点击付费后查看

sortByKey算子的作用是（）

内容已经隐藏，点击付费后查看

在代码中 val ssc:StreamingContext = new StreamingContext(sc,Seconds(1));参数Seconds(1)的含义是（）

内容已经隐藏，点击付费后查看

reduceByKey算子的作用是（）

内容已经隐藏，点击付费后查看

键值对RDD里面存储的数据类型是（）

内容已经隐藏，点击付费后查看

温馨提示支付 ￥5.00 元后可查看付费内容,请先翻页预览!

微信支付

点赞(2) dxwkbang

本文分类：知到智慧树期末考试答案2024秋
本文标签：Spark大数据技术与应用
浏览次数：8 次浏览
发布日期：2024-10-07 23:57:48

上一篇 > 酒店体验之旅期末考试答案题库2024秋
下一篇 > 市政工程识图与构造期末考试答案题库2024秋

Spark大数据技术与应用期末考试答案题库2024秋

Spark大数据技术与应用章节测试课后答案2024春

Spark大数据技术与应用期末答案和章节题库2024春

Spark大数据技术与应用期末考试答案2023春

Spark大数据技术与应用期末答案2023秋

Spark大数据技术与应用答案2023秋

Spark大数据技术与应用答案2023

Spark大数据技术与应用期末考试答案题库2024秋