1. 分类(Classification)是指预测的结果(即标签)是离散的,是类别型的一种机器学习。( )

  2. 答案:对
  3. 黑白图像也叫二值图像或者灰度图像。( )

  4. 答案:错
  5. 访客数(UV)是指用户访问页面的总数,是重要的流量数据。( )

  6. 答案:错
  7. 2021年4月,某品牌在某地区销售同比增长32%。该地区只有三名销售员,他们分别完成销售23.8万元、36.8万元、27.0万元。去年同期他们分别完成销售18.3万元、28.8万元、20.9万元。( )

  8. 答案:错
  9. 回归(Regression)是指预测的结果(即标签)是连续的,是数值型的一种机器学习。( )

  10. 答案:对
  11. ASCII码使用一个字节编码。( )

  12. 答案:对
  13. 能够提升计算能力的方式有:( )

  14. 答案:垂直扩展###水平扩展###分布式计算###计算机集群
  15. 当前,大数据产业发展的特点是( )。

  16. 答案:规模较大###增速很快###多产业交叉融合
  17. 关于MySQL中服务器,数据库,数据表的说法正确的是哪个?( )。

  18. 答案:一个服务器能有多个数据库###一个数据库能有多张表
  19. 物联网的数据质量问题体现在数据的( )上。

  20. 答案:完整性###精确性###一致性###时效性###实体同一性
  21. 光滑是指去掉数据中的噪声。这类技术包括( )。

  22. 答案:回归###聚类###分箱
  23. 医疗领域利用大数据分析的场景有哪些?( )
  24. 以下( )可以使用正则表达式“\d{4}[年/-]\d{1,2}([月/-]|$)(\d{1,2}(日|$)|$)”进行匹配。
  25. 下列系统中不属于关系型数据库的是( )。
  26. 用于向数据库写入内容的是哪个节点?( )。
  27. 口算:3872 x 68 =( )
  28. AWS和华为云提供的是一种( )云服务模式。
  29. 数据库中设置按主键去除重复的方法属于满足数据清洗中的( )。
  30. 小天要求时间都要以“YYYY-MM-DD”格式存储,这符合数据质量评估中的( )标准。
  31. 每一个样本包含一个或多个特征,还包含一个目标变量,即标签。( )
  32. CPU用于执行存储在计算机内存中的程序所需的计算。( )
  33. ALU负责对寄存器中的数据进行算术或者逻辑计算。( )
  34. 数据预处理是提高大数据质量的非常重要的手段,它在整个大数据分析过程中占用了约60%的工作量,显得尤为重要。( )
  35. 我国城镇住房建设较快发展,人均住宅建筑面积升至26.11平方米(北京市为32.68平方米),户均住宅建筑面积为83.2平方米。同时,城镇住宅面积达到历史最高的300.16亿平方米。( )
  36. 云计算是一种分布式计算。( )
  37. 表格中的每一列被称为元祖或者记录。( )
  38. 期望是指数据集中出现最频繁的值。( )
  39. URL是Uniform Resource Locator的简称,是Internet上用于指定数据位置的表示方法。( )
  40. 魔力象限的横坐标表示执行能力,纵坐标表示前瞻性。( )
  41. 特征构造也称为属性构造,可以由给定的特征构造新的特征并添加到数据集中,以帮助数据分析过程。( )
  42. 数据探索采用的方法只有数据描述方法。( )
  43. 信息是有时效性的。( )
  44. A公司目前有11个业务人员,4月前三名业务人员对A公司生意贡献度分别为:14%、12%、10%,后三名业务人员对A公司的生意贡献度分别为:5%、4%、2%。( )
  45. GPU是一种浮点运算处理器。( )
  46. 以下哪些是非关系型数据库?( )。
  47. 大数据人才整体上需要具备( )等核心知识。
  48. 下列属于机器学习模型设置的超参数的有( )。
  49. 用于评价回归模型的损失函数有( )。
  50. 关于饼图的描述,正确的是哪个?( )。
  51. 20世纪末至今,数据可视化呈现哪些特征?( )。
  52. 通过数据探索可以对数据集有一些初步、总体上的认知,包括( )。
  53. 以下( )可以使用正则表达式“0\d{3}-d{11}”进行匹配。
  54. 数据可视化涉及到的学科包括?( )。
  55. 回归模型的性能评估指标有( )。
  56. 以下关于几种基本图形的说法,正确的是哪个?( )。
  57. 为了建立模型,可以将数据集分为( )。
  58. 以下属于集中趋势分析统计量的有( )。
  59. 下面哪个图形可用于展示离散数据?( )。
  60. 对于缺失值的处理,从总体上来说分为( )。
  61. 某股票价格周一上涨了10%,周二又下降了10%,则该股票的的价格是如何变化的?( )
  62. 大数据最显著的特征是( )。
  63. Android移动端嵌入式开发中用以存储数据的数据库是( )。
  64. 以下哪个不是文本数据?( )。
  65. 有数据显示,在大数据分析的工作中有约60%的时间都在进行( )工作。
  66. 箱型图主要描述的5个数据特征不包括下列哪一个?( )。
  67. 用于读取数据库二维表内容的是哪个节点?( )。
  68. 口算:1258 x 308 = ( )
  69. 下面关于直方图的说法中,错误的是哪个?( )。
  70. 比较3个班级学生高数成绩的分位数分布并观察异常值,可选择哪种图形?( )。
  71. 为观察测试Y与X之间的线性关系,X,Y是连续变量,使用哪种图形最合适?( )。
  72. Views是KNIME中非常重要的组件,它常用来进行( )。
  73. 有多个特征的线性回归称为多元线性回归。( )
  74. 最基本的回归分析算法是线性回归,如:y=w1x1+w2x2+w3x3+b ( )
  75. 回归分析(regression analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。也就是研究当自变量X变化时,因变量Y以何种形式在变化。 ( )
  76. 客流量、降雨量、销售量的预测都属于回归分析。( )
  77. 相关系数是一个[-1,1]的值,正表示正相关,负表示负相关。数值越大,相关性越( )。
  78. MySQL服务器的默认端口为哪项?( )。
  79. 以下关于SQL和NoSQL的描述错误的是哪个?( )。
  80. 以下关于关系型和非关系型数据库的说法,正确的是哪个?( )。
  81. 在数据管理技术的发展过程中,经历了三个发展阶段。其中,数据独立性最高的阶段是( )。
  82. 已知有学生信息表student, 其中学生姓名和年龄分布存放在字段name和age中,查询年龄在20岁到22岁之间的学生姓名和年龄的SQL语句是哪个?( )。
  83. 设置日期字段格式为 “2019-10-10”,属于满足数据清洗中的( )。
  84. 数据集的类别分布不均被称为( )。
  85. 对各种脏数据进行对应方式的处理,得到标准、干净、连续的数据,提供给数据统计、数据挖掘等使用的方法称为( )。
  86. 数据质量反映的是数据的实用性问题。( )
  87. 通过身份证号来补全性别、年龄、籍贯等属于满足数据清洗中的( )。
  88. 图像是以数字( )形式存储在计算机中的,其中每一个数字表示一个像素。
  89. 指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串称为( )。
  90. 在网络爬虫的爬行策略中,应用最为基础的是( )。
  91. 等级型和数值型数据可以排序和比较大小。( )
  92. HDFS集群中至少有3个数据节点,即DataNode。( )
  93. 微信小程序开发提供的是一种( )云服务模式。
  94. Harmony是一种移动设备操作系统。( )
  95. 下列属于分布式并行计算框架的是( )
  96. 每个HDFS集群有且仅有一个主节点,即NameNode。( )
  97. 数据分析的一般流程是( )。
  98. 数据是作为信息的重要来源,信息经过加工转化为知识。( )
  99. 现在的自动驾驶系统最高可以达到( )级别。
  100. 交通大数据的信息种类包括出行者、位置、车辆、交通流、气象、舆情、活动、用地。( )
  101. 与大数据密切相关的技术是( )。
温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(7) dxwkbang
返回
顶部