第三章测试
1.从数据的加工程度对数据进行了分类,以下不属于该分类的是( )。
A:专家数据 B:半结构化数据 C:信息和价值 D:裸数据
答案:B
2.按( )分,把数据采集分类为静态数据采集、低频数据采集和高频数据采集。
A:采集频率 B:采集方式 C:数据结构 D:内容 3.数据采集工具不包括( )。
A:Flume B:KalKa C:HBase D:Sqoop 4.关于缺失数据处理,( )是不合适的。
A:当缺失数据较多时直接删除相应样本 B:多重查补法 C:决策树 D:对缺失数据进行插补 5.当缺失数据较少时直接删除相应样本,删除缺失数据样本,其前提是缺失数据的比例较少,而且缺失数据是随机出现的,这样删除缺失数据后对分析结果影响不大。( )
A:对 B:错 6.异常值(离群点)是指测量数据中的随机错误或偏差造成其偏离均值的孤立点。在数据处理中,异常值不会极大地影响回归或分类的效果。( )
A:错 B:对 7.所谓数据的中心化是指数据集中的各项数据减去数据集的方差。( )
A:错 B:对 8.Python爬虫架构主要由五个部分组成,分别是搜索引擎、调度器、URL管理器、网页下载器和网页解析器。( )
A:错 B:对

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(5) dxwkbang
返回
顶部