东北石油大学
  1. 在大数据的萌芽期只有结构化数据,没有非结构化数据。( )

  2. A:对 B:错
    答案:错
  3. 物联网是大数据的重要数据来源。( )

  4. A:错 B:对
    答案:对
  5. 分布式文件系统(Distributed File System)是指文件系统管理的物理存储资源不直接连接在本地节点上,而是通过计算机网络与节点相连,或是若干不同的逻辑磁盘分区或卷标组合在一起而形成的完整的有层次的文件系统。( )

  6. A:错 B:对
    答案:对
  7. 在大数据产业链中,数据管理层主要提供智能交通、智慧医疗、智能物流等服务。( )

  8. A:错 B:对
    答案:错
  9. HDFS系统中的一台或多台服务器出现故障的时候,系统仍可用且数据保持完整。( )

  10. A:错 B:对
    答案:对
  11. 在热门图书过程中,通过统计性描述就可以发现结果不正常,是因为我们了解学校的业务背景。( )

  12. A:对 B:错
    答案:对
  13. 大数据的目标就是掌握尽可能多的数据。( )

  14. A:对 B:错
    答案:错
  15. 业务理解不仅要理解项目的需求,还要定义数据分析问题和完成目标的初步计划。( )

  16. A:错 B:对
    答案:对
  17. 已知x = 3,那么赋值语句x = 'abcedfg'是无法正常执行的。( )

  18. A:对 B:错
    答案:错
  19. HDFS侧重高吞吐量的数据访问,可以容忍数据访问的高延迟。( )

  20. A:错 B:对
  21. 扩展库pandas的read_csv()函数用于读取CSV文件中的数据并创建DataFrame对象。( )

  22. A:对 B:错
  23. HDFS应用程序需要一次写入,多次读取一个文件的访问模式。( )

  24. A:对 B:错
  25. 数据处理就是对原始数据进行计算 。( )

  26. A:错 B:对
  27. 在Python中,使用三元条件表达式的好处就是可以使代码比较简洁。( )

  28. A:对 B:错
  29. 科学可视化最初被称为“科学计算之中的可视化” 。( )

  30. A:对 B:错
  31. HBase与传统的关系数据库的区别主要体现在以下几个方面:( )。

  32. A:数据操作
    B:数据类型
    C:数据索引
    D:存储模式
  33. Hadoop的核心功能特点主要包括:( )。

  34. A:高可靠性
    B:高容错性
    C:高效性
    D:高可扩展性
  35. Redis数据库的特点:( )。

  36. A:在内存管理方面,支持最近最少使用算法(LRU)
    B:支持数据多副本、主从复制机制
    C:缺乏统一的查询语法
    D:支持主节点选举机制
  37. 关于大数据可视化,下面哪些说法是正确的( )

  38. A:大数据可视化可用于方案实施环节中,用于将分析结果发布出去
    B:大数据可视化不属于哪一个具体环节,在大数据分析各环节都可使用
    C:大数据可视化可用于模型构建环节,用于进行可视化分析
    D:大数据可视化可用于模型评估中,可直观地看出模型是否符合预期
  39. 大数据产业链中,下面哪些服务属性数据分析层?( )

  40. A:数据挖掘
    B:数据分析平台
    C:交通大数据
    D:分布式计算
    E:数据可视化
  41. 多维数据可视化常用的方法有( )。

  42. A:标签云法
    B:节点链接法
    C:降维投影法
    D:空间映射法
  43. “大数据让我们不再期待精确性”是因为:( )

  44. A:在某种场合下,快速获取大概轮廓数据,要比严格精确性重要得多
    B:在某种场合下,通过大数据带来的效果,实现起来更容易
    C:在某种场合下,通过大数据带来的效果远比提高一点点精度带来的效果更好
    D:误差无所谓,不必再追求精确性
    E:大数据让我们能够接受不精确性的存在
  45. 以下哪些现象会给大数据应用带来困扰。( )

  46. A:数据越来越多,存储设备不够用。
    B:数据来源参差不齐,影响数据的权威性。
    C:过分依赖大数据,会损害我们的创新激情。
    D:数据收集得越多,隐私被暴露的可能性越大。
  47. 下面哪些工作属性大数据分析的数据理解环节?( )

  48. A:设计数据集模型
    B:了解当前使用的数据库的数据模型
    C:对数据进行格式转换和编码
    D:梳理企业数据流程
    E:了解企业当前使用的数据库有哪些
  49. Python语言的特点有( )。

  50. A:易于移植
    B:资源丰富
    C:易于使用
    D:易于学习
  51. BigTable是一种( )。

  52. A:图数据库
    B:文档数据库
    C:列族数据库
    D:键值数据库·
  53. 关于大数据与人工智能的关系,下面哪个说法是正确的( )。

  54. A:大数据与人工智能是两个方向,相互独立
    B:大数据利用人工智能进行分析,同时也促进人工智能的发展
    C:没有人工智能就不能开展大数据分析
    D:没有大数据就不能开展人工智能的研究及应用
  55. 在科学可视化系统的研究中最为核心的部分是( )。

  56. A:数据模拟
    B:数据处理
    C:数据获取
    D:数据显示
  57. 可视分析流程图中的起点和终点分别是( )。

  58. A:知识、知识
    B:数据、知识
    C:数据、数据
    D:知识、数据
  59. CRISP-DM是( )。

  60. A:一个关于大数据分析方法的标准
    B:一个关于大数据分析过程的模型
    C:一种大数据分析算法
    D:一个用于大数据分析的模板
  61. 使用可视化扩展库matplotlib的模块pyplot中的bar()函数绘制直方图时,参数( )可以用来设置柱的位置。

  62. A:left
    B:width
    C:fill
    D:lw
  63. 关于数据与算法的关系,下面哪个说法是正确的( )。

  64. A:大数据的简单算法比小数据的复杂算法更有效
    B:在一定背景下,大数据的简单算法比小数据的复杂算法更有效
    C:算法分析不出来的规律用大数据都可以分析出来
    D:有了大数据,就不需要研究算法了
  65. MongoDB是一种( )。

  66. A:文档数据库
    B:图数据库
    C:键值数据库·
    D:列族数据库
  67. 大数据大规模应用阶段对应第三次信息化浪潮的哪个阶段:( )。

  68. A:人工智能阶段
    B:个人计算机阶段
    C:云计算和大数据阶段
    D:互联网
  69. 从宏观看,数据可视化的主要作用不包括哪个方面( )。

  70. A:数据记录和表达
    B:数据分析
    C:数据操作
    D:信息清洗
  71. 科学可视化系统大多采用“可视化流水线”,这个过程的第一步操作是( )。

  72. A:模拟
    B:预处理
    C:解释
    D:映射
    E:绘制
  73. 科学研究第四范式--数据密集型科学是指( )。

  74. A:通过观察和实验描述自然规律
    B:利用计算机进行模拟仿真实验。
    C:先有了大量的已知数据,通过计算得出之前未知的理论。
    D:用模型简化并通过演算得到结论
  75. ( )的优点是灵活性高、支持复杂的图算法、可以用来构建复杂的关系图谱。

  76. A:文档数据库
    B:键值数据库·
    C:图数据库
    D:列族数据库
  77. 关于大数据,下面说法正确的是( )

  78. A:大数据指数据种类多,至少包括图像、视频、音频、文本
    B:大数据就是指数据容量非常大,至少达到1T
    C:大数据指海量多样的数据、分析数据的方法、管理数据的系统、数据的应用的统称
    D:大数据指互联网上的海量数据
  79. ( )语句在Python中是非法的。

  80. A:x = y = z = 1
    B:x = (y = z + 1)
    C:x += y
    D:x, y = y, x

温馨提示支付 ¥5.00 元后可查看付费内容,请先翻页预览!
点赞(1) dxwkbang
返回
顶部