- 啤酒与尿布的经典案例,充分体现了实验思维在大数据分析理念中的重要性。( )
- 具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求。( )
- 当前大数据技术的基础是由( )首先提出的。
- 在使用0和1输入多选题信息时,若出现了0和1之外的数据,可以采用条件格式利用( )标记错误。
- 下列关于数据重组的说法中,错误的是( )。
- 下列关于数据生命周期管理的核心认识中,正确的是( )。
- 数据再利用的意义在于( )。
- MapReduce技术屏蔽底层编程细节,抽象出哪两个函数( )。
- 数据可视化的主要作用包括哪3个方面,这也是可视化技术支持计算机辅助数据认知的三个基本阶段。( )
- Map任务的输出中排序是按照字典排序进行自动进行的。( )
- MapReduce模型高度的抽象为了两个函数Map和Reduce函数。( )
- 因为NoSQL数据库在可扩展性方面优于关系数据库,所以关系数据库要被NoSQL数据库取代了。( )
- 协同过滤算法的优点( )。
- 从经济社会视角来看,大数据的重点在于“数据量大”。( )
- MapReduce的Map函数接受的输入和输出都是<key,value>类型。( )
- Shuffle过程的种类包括( )。
- 传统数据密集型行业积极探索和布局大数据应用的表现是( )。
- 强调CAP理论中的CP的数据库不包括( )。
- 下列反映比例关系的可视化图表是( )。
- 简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。( )
- 以下关于Web2.0说法正确的是( )。
- ( )算法思路是通过群体的行为来找到某种相似性(用户之间的相似性或者标的物之间的相似性),通过该相似性来为用户做决策和推荐。
- MapReduce采用分而治之策略,一个存储在分布式文件系统中的大规模数据集,会被切分成许多独立的分片,这些分片可以被多个Map任务并行处理。( )
- 数据仓库的最终目的是( )。
- 关于SecondaryNameNode( )是正确的。
- Iaas计算实现机制中,系统管理模块的核心功能是。( )
- ( )在许多情况下,可以达到99.999%的可用性。
- ( )是指对Map输出结果进行分区、排序、合并以及可能的归并等处理,并交给Reduce的过程。
- 论据中,体现“冷眼”看大数据的观点的是( )。
- ( )是制图对象某一数量指标值相等的各点连成的平滑曲线。
- Amazon.com公司通过( )计算云,可以让客户通过WebService的方式租用计算机来运行自己的应用程序。
- 在Hadoop中,下面哪一个是默认的OutputFormat( )。
- 所谓( )就是新的标的物加入系统,没有用户操作行为,这时协同过滤算法也无法将该物品推荐给用户。
- 下列关于配置机架感知的相关描述( )不正确。
- 以下哪一项属于非结构化数据( )。
- Hadoop的特性包括( )。
- 反映发展趋势的可视化图表有( )。
- 在云计算中,虚拟层主要包括( )。
- 在数据可视化时要简约,尽量避免使用( )等不必要的设计。
- HBase是按行的方式存储数据的( )。
- 当数据中同时包含正负数值时,数据点会默认显示在横坐标的两侧,横坐标轴也会位于图表绘图区域的内部,影响图表显示数据。( )
- 云计算真正实现了按需计算,从而有效地提高了对软硬件资源的利用效率。( )
- 数据可视化可分为三类( )。
- 运用大数据进行大治理要做到( )。
- 在新加坡政府发展大数据行动中,政府侧重于做好数据分析和服务,不承担数据提供服务。( )
- HBase性能优化包含以下哪些选项( )。
- 下列关于基于大数据的营销模式和传统营销模式的说法中,正确的是( )。
- HDFS默认工作目录是/user/$USER,fs.default.name的值需要在( )配置文件内说明。
- 常见的反映差异化的图表类型是气泡图。( )
- 所谓( )就是该产品是一个新开发不久的产品,还在发展用户初期阶段,这时协同过滤算法基本无法起作用,最好采用基于内容的推荐算法或者直接利用编辑编排一些多样性的优质内容作为推荐备选推荐集。
- 谷歌流感趋势充分体现了数据重组和扩展对数据价值的重要意义。( )
- ItemCF算法需要计算的是物品相似度,首先需要计算出用户到物品的倒排表。 ( )
- 下列关于数据交易市场的说法中,错误的是( )。
- 下面哪个是一种编程模型,它将大规模的数据处理工作拆分成互相独立的任务然后并行处理( )。
- Map函数接受的输入及输出类型( )。
- 大数据环境下的隐私担忧,主要表现为( )。
- 将平台作为服务的云计算服务类型是( )。
- 将与该用户最相似的用户喜欢的标的物推荐给该用户。这就是( )的核心思想。
- 强调CAP理论中的AP的数据库不包括( )。
- 关系数据库强调( )。
- 在绘制图表的过程中,可以对不易理解的图标添加其他的( ),以便于用户理解和传达信息。
- ( )通过二维坐标系中的一组点来展示变量之间的关系。
- ( )反映数据的精细化程度,越细化的数据,价值越高。
- HBase依靠( )存储底层数据。
- CAP理论中的CP是指( )。
- ( )负责加载数据并将数据转化为Map任务读取的键值对输入给Map任务。
- 下列关于舍恩伯格对大数据特点的说法中,错误的是( )。
- 基于用户的协同过滤(UserCF)与基于物品的协同过滤(ItemCF)适用相同的场景。( )
- 推荐系统是自动联系用户和物品的一种工具,和搜索引擎相比,其通过研究用户的兴趣偏好,进行个性化计算。( )
- 一个完整的推荐系统通常包括( )等几个部分。
- 以下哪种商品代表了用户的个性化需求,可通过挖掘此商品可以提高销售额,所累积的总销售额将是一个可观的数字,也许会超过热门商品带来的销售额?( )
- MapReduce技术屏蔽了底层的编程细节,抽象为两个函数( )。
- MapReduce设计的一个理念是“计算向数据靠拢”,而不是“数据向计算靠拢”,因为,移动数据需要大量的网络传输开销。( )
- 两个键值对<"a",1>和<"a",1>,如果对其进行归并(merge),会得到<"a",2>,如果对其进行合并(combine),会得到<"a",<1,1>>。( )
- 对于文本行“hello hadoop hello world”,经过WordCount的Reduce函数处理后的结果是 ( )
- 在实验集群的master节点使用jps命令查看进程时,终端出现以下哪项能说明Hadoop主节点启动成功?( )
- 列族数据库HBase物理结构是行存储的。 ( )
- Hadoop 支持数据的随机读写。 ( )
- Client 端上传文件的时候下列哪项正确( )。
- 使用云服务的宗旨之一是按需购买。 ( )
- 云计算中云端要有管理工具进行资源管理。 ( )
- 可实现虚拟化的有( )。
- 用户利用在线数据可视化平台,不需要本地安装数据可视化软件工具就实现了数据的可视化呈现,这可能属于哪一种云计算的服务模式( )。
- 用户在阿里云提供的操作系统上部署了MySQL数据库服务器,这属于哪一种云计算的服务模式( )。
- 价值密度高是大数据的一个特征。 ( )
- 大数据的数据类型包括( )。
- 在大数据时代,以下关于大数据思维的说法正确的是( )。
- 传统的关系类型数据占大数据总量的90%。 ( )
- 数据存储单位不包括以下哪个( )。
答案:错
答案:错
答案:谷歌
答案:OR函数
答案:数据重组是数据的重新生产和重新采集
答案:根据数据价值的不同应该对数据采取不同的管理策略###在不同的数据存在阶段,数据的价值是不同的###数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段
答案:实现数据重组的创新价值###利用数据可扩展性拓宽业务领域###挖掘数据的潜在价值
答案:Reduce###Map
答案:数据记录和表达###数据操作###数据分析
答案:对
答案:对
温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!