⬆️⬆️⬆️本课程2024最新同名章节期末答案⬆️⬆️

Hadoop大数据技术与项目实战期末考试答案题库2024秋

12 阅读 0 评论 4 点赞

山西职业技术学院

在编写Flume拦截器代码中，实现 Interceptor需要重写（）方法

答案:public Event intercept(Event event) 处理单个 Event###public List intercept(List events) 处理多个 Event，在这个方法中调用 Event intercept(Event event)###close 方法###initialize 初始化

pyecharts的Page中内置了以下哪些布局方式？（）

答案:SimplePageLayout###DraggablePageLayout

以下描述正确的是（）

答案:A/B/D

在HQL实现过程中，一个语句里要执行（）两部分操作。

答案:B: 查询业务数据表中的数据

本项目编写Flume自定义拦截器步骤（）

答案:重写四个方法###静态内部类，实现 Interceptor.Builder###实现 Interceptor

flume中自定义的分流标记拦截器可以实现（）两种分流。

答案:启动日志流###事件日志流

下列属于事件日志数据合法校验步骤的是（）。

答案:校验服务器时间###对数据进行校验###对日志进行切割###校验是否为json格式

在本教材的实战操作中，打开hosts文件，设置三台虚拟机的IP地址及映射名称，需要输入（）内容。

答案:192.168.100.3 node1###192.168.100.5 node3###192.168.100.4 node2

在JSON字符串中，Object结构是（）。

答案:{key:value,key:value...}###key , value

创建活跃设备数据表中包含有哪些字段（）

内容已经隐藏，点击付费后查看

Hadoop具有四大优势，是（）。

内容已经隐藏，点击付费后查看

创建每日新增设备数据表包含有（）哪些字段

内容已经隐藏，点击付费后查看

以下关于Kafka的存储机制描述正确的是（）。

内容已经隐藏，点击付费后查看

yarn集群核心配置的文件是（）。

内容已经隐藏，点击付费后查看

下列属于事件日志数据的是（）。

内容已经隐藏，点击付费后查看

谷歌开源的三篇大数据论文有（）。

内容已经隐藏，点击付费后查看

在Zookeeper的配置文件中，要设置的dataDir参数的功能是（）。

内容已经隐藏，点击付费后查看

在ETL拦截器中，我们重写的初始化方法initialize()可以理解为是（）。

内容已经隐藏，点击付费后查看

用于文件在网络间安全传输的软件是（）。

内容已经隐藏，点击付费后查看

使用hdfs dfs -count / 查看根目录下面数据文件的个数，显示结果为“14 7 248745”，其中14代表的是（）

内容已经隐藏，点击付费后查看

PyEcharts中，折线图类是（）。

内容已经隐藏，点击付费后查看

在Linux系统中，（）目录默认为空，在本课程项目开发过程中是使用最多的目录。

内容已经隐藏，点击付费后查看

Sqoop的工作本质是（）。

内容已经隐藏，点击付费后查看

在编写Flume拦截器代码时，intercept(List events)方法的功能是用来接收source传递的批次数据，对其进行（）。

内容已经隐藏，点击付费后查看

项目实施流程中没有哪一步（）

内容已经隐藏，点击付费后查看

在Flume数据传输系统中，Channel Processor 是（）。

内容已经隐藏，点击付费后查看

在编写Flume拦截器代码时，initialize() 方法的作用是：当程序中需要开辟某种资源时申请资源，该方法的特点是程序至始至终，只执行（）；

内容已经隐藏，点击付费后查看

当Kafka启动之后，会把元数据保存到哪里（）？

内容已经隐藏，点击付费后查看

在Flume数据传输系统中，memory channel的特点是（）。

内容已经隐藏，点击付费后查看

在Flume数据传输过程中，Source的主要功能是和外部数据源对接，负责数据的采集，将采集回来的数据传递给（）。

内容已经隐藏，点击付费后查看

创建bigdata用户的命令是（）。

内容已经隐藏，点击付费后查看

在编写flume拦截器代码中event.getHeaders( )方法的功能是（）。

内容已经隐藏，点击付费后查看

mapred-site.xml配置文件主要是针对MapReduce程序在YARN集群上运行的一些相关参数的配置，需要找到对应的文件。（）

内容已经隐藏，点击付费后查看

Hadoop是Apache基金会开发的一款分布式系统基础架构，主要解决海量数据存储和海量数据计算两大问题，从广义上来说，Hadoop通常指的是Hadoop生态圈。（）

内容已经隐藏，点击付费后查看

通过Sqoop可以将关系型数据库的数据迁移到Hadoop平台，但是不可以将Hadoop平台的数据迁移到关系型数据库。（）

内容已经隐藏，点击付费后查看

Sqoop数据迁移时，命令参数fields-terminated-by代表导入数据的切分格式。

内容已经隐藏，点击付费后查看

折线图主要以百分比形式显示每一类数值相对于总数值的大小。（）

内容已经隐藏，点击付费后查看

启动hive之前只需要启动hive --server metastore服务。（）

内容已经隐藏，点击付费后查看

数据仓库就是数据库。（）

内容已经隐藏，点击付费后查看

Kafka内部有两个topic分别用来接收Flume传输过来的数据，topic_start接收启动日志数据，topic_event接收事件日志数据。（）

内容已经隐藏，点击付费后查看

insert overwrite命令将数据写入表中（）

内容已经隐藏，点击付费后查看

删除Kafka主题时，在配置文件中设置delete.topic.enable=true，才是完全删除，否则为标记删除。

内容已经隐藏，点击付费后查看

在编写Flume拦截器代码时，build方法是拦截器类的核心方法，功能是将当前自定义的LogETLInterceptor类进行实例化，从而提供给Flume进程在运行过程中对其调用。（）

内容已经隐藏，点击付费后查看

在分流标记拦截器中，初始化和关闭方法进行空实现即可。（）

内容已经隐藏，点击付费后查看

Kafka最大的特性就是可以实时的处理大量数据以满足各种需求场景，比如基于hadoop的批处理系统、低延迟的实时系统、storm/Spark流式处理引擎，web/nginx日志、访问日志，消息服务等。（）

内容已经隐藏，点击付费后查看

本项目中，/opt目录下存放着项目所安装的全部软件及所有数据文件。（）

内容已经隐藏，点击付费后查看

饼图主要用于展现数据的变化趋势。（）

内容已经隐藏，点击付费后查看

数据仓库主要是为决策分析提供数据。（）

内容已经隐藏，点击付费后查看

实现全外连接的关键字是join。（）

内容已经隐藏，点击付费后查看

Event的最大定义为1024字节，超过会被切割放到下一个Event中。（）

内容已经隐藏，点击付费后查看

Sqoop作为大数据平台的数据搬运工，比较轻松地打开了关系数据库与分布式存储体系之间方便之门。为传统数据仓库平稳过渡到大数据平台作出了重要贡献。（）

内容已经隐藏，点击付费后查看

Flume基于事务传输event(批量传输)，使用两个独立的事务分别处理source到channel和channel到sink，失败时会将所有数据回滚进行重试。该事务遵循“最少一次”语义，因此数据不会丢失，但有可能重复。（）

内容已经隐藏，点击付费后查看

温馨提示支付 ￥5.00 元后可查看付费内容,请先翻页预览!

微信支付

点赞(4) dxwkbang

本文分类：知到智慧树期末考试答案2024秋
本文标签：Hadoop大数据技术与项目实战
浏览次数：12 次浏览
发布日期：2024-10-07 20:53:35

上一篇 > 病理学（山东联盟-济宁医学院）期末考试答案题库2024秋
下一篇 > 泥塑人体快速入门期末考试答案题库2024秋

Hadoop大数据技术与项目实战期末考试答案题库2024秋

Hadoop大数据技术与项目实战章节测试课后答案2024春

Hadoop大数据技术与项目实战期末答案和章节题库2024春

Hadoop大数据技术与项目实战期末考试答案2023春

Hadoop大数据技术与项目实战期末答案2023秋

Hadoop大数据技术与项目实战答案2023秋

Hadoop大数据技术与项目实战答案2023

Hadoop大数据技术与项目实战期末考试答案题库2024秋