第十一章 综合实战 ——非结构化数据分析方法:本章主要介绍Web日志数据分析方法,通过数据导入、数据过滤方法、数据抽样方法、HTTP状态码分析、各种状态码的比例获得、404错误的链接地址分析、404错误的Android版本号分析,讲解非结构化数据分析的一般方法(即增量抽样分析方法)、正则表达式的构造方法、正则表达式完备的分析方法和数据综合处理实战。11.1数据挖掘之前需要做什么:数据挖掘之前需要做什么
11.2采用哪种数据过滤方法来实现数据抽样:采用哪种数据过滤方法来实现数据抽样
11.3如何分析status=404中链接比例呢?:如何分析status=404中链接比例呢?
11.4还能挖掘其他有用的信息吗?:还能挖掘其他有用的信息吗?
11.5如何构造正则表达式呢?:如何构造正则表达式呢?
11.6如何验证正则表达式是完备的呢?:如何验证正则表达式是完备的呢?
[多选题]数据过滤类型包括(      )

选项:[文件过滤, 行过滤, 列过滤]
[多选题]一般什么样的列信息在数据抽样分析时可以不用考虑? (       )

选项:[数据内容特别简单的列, 含空信息的列, 该列中的数据是其他列中的一部分, 每一行数据值都相同的列]
[单选题]匹配C:Window*的正则表达式是(     )

选项:[c:window*, C:Window*, C:windows*, c:window*]
[单选题]HTTP状态码中200表示(   )

选项:[请求成功, 断点续传, 请求失败, 超出范围]
[单选题]正则表达式中[?.]的作用是表示选择?和.中的一个。

选项:[对, 错]
[单选题]Splunk中如何对字段count进行降序排列呢?(    )

选项:[| sort - count, | sort count, | stats count, | stats - count]
[单选题]正则表达式[^aeiou]表示的含义(      )

选项:[匹配^aeiou中的任意一个, 不匹配^aeiou中的任意一个, 不匹配aeiou中的任意一个, 匹配aeiou中的任意一个]
[单选题]正则表达式中{n}的含义表示循环n次。

选项:[错, 对]
[多选题]Splunk中的数据显示格式包括(    )

选项:[table, list, raw, _time]
[单选题]下列命令具有列过滤功能的是(     )

选项:[head, 列名=“A”, top, fields]

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(0) dxwkbang
返回
顶部