项目二单元测试
- 最早提出“大数据”时代已经到来的机构是( )
- 大数据的特征有哪些( )
- Python的优点包括以下哪些选项( )
- Python的缺点有哪些( )
- 以下哪种数据形式是半结构化数据( )
- 上交所XBRL财报页面的Python采集脚本里,‘code=[ ]’的方括号里定义的数据是企业的证券交易代码等信息。( )
- 以下哪些内容是常见的数据清洗问题( )
- 数据清洗一般遵循以下哪些原则( )
- 公司现有两张财务报表,一份是当月的利润明细表,一份是公司在售产品清单表,现在想分析各产品的利润情况,需要对这两表做哪种数据集成?( )
- 在大数据分析时,例如资产负债表、利润表这样的财报数据表属于事实表。( )
A:联想集团 B:麦肯锡 C:IBM D:中兴新云
答案:麦肯锡
A:Volume B:Value C:Velocity D:Variety
答案:Volume###Value###Velocity###Variety
A:简单易学,语法优美 B:应用领域广泛 C:开发效率高 D:可移植性好
答案:简单易学,语法优美###应用领域广泛###开发效率高###可移植性好
A:运行速度慢 B:Python的GIL锁限制并发 C:Python2.X和Python3.X的库非常少 D:Python2.X和Python3.X不能完全兼容
答案:运行速度慢###Python的GIL锁限制并发###Python2.X和Python3.X不能完全兼容
A:表格 B:SQL C:图片 D:HTML
答案:HTML
A:错 B:对
答案:对
A:有影响指标计算的非法字符,如英文逗号、空格等 B:数值为空,有缺失 C:重复数据 D:日期、时间格式不一致
答案:有影响指标计算的非法字符,如英文逗号、空格等###数值为空,有缺失###重复数据###日期、时间格式不一致
A:数据清洗结果有问题时,从数据源头开始检查数据质量问题 B:每份数据连入时都针对这份数据清洗,清洗干净后再做数据合并、联接 C:数据量小的数据连入时,先合并、联接数据后再清洗 D:在大规模数据计算前,先执行数据清洗
答案:数据量小的数据连入时,先合并、联接数据后再清洗###在大规模数据计算前,先执行数据清洗
A:数据关联 B:数据追加 C:数据联动 D:数据合并
答案:数据关联
A:对 B:错
答案:对
温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!