第二章 HiveQL:每种数据库管理系统都拥有自己的语言,Hive也不例外。本章主要从HiveQL出发,介绍了Hive数据库中的基本使用方法,为在实际场景中使用Hive数据库提供基础知识。2.1数据类型与文件格式:数据类型是数据存储时最重要的属性之一,而作为非关系型数据库的Hive,新增的集合数据类型使得无法简单实用传统的方式在文本文件中分割加载的数据。本节主要从Hive支持的数据类型出发,介绍了通过文本加载Hive数据时应当注意的两三事,旨在让同学们对于集合类型的数据有一个初步的认识。[判断题]Hive中删除管理表不会删除表所指向的数据文件
2.2Hive中的数据库:数据库的创建和使用是Hive基础中的基础。本节从实践的角度出发,实战了如何在Hive中查看、创建和修改数据库,旨在让同学们对Hive命令行界面和数据库有一个初步的认识。
2.3HiveQL创建、修改、删除表:一个数据库是由一张张表组合构建而成的。本节从一个真实的数据挖掘竞赛数据集出发,带着同学们一步一步设计、创建、修改和删除数据表,旨在让同学们可以在自己的生产环境中对数据库中表的管理有一个初步的认识。
2.4HiveQL分区表:Hive是针对大数据应用场景下的数据仓库。因此为了加速大数据的记录查询和管理任务,创建的分区表的概念。本节主要从Hive中涉及的分区表概念出发,通过实战构建Hive数据库中的分区表,旨在让同学们能够通过实践理解分区表对于数据库查询和管理的重要意义。
2.5加载和导出数据:经过前面课程构建的数据库和数据库中的表都还只是空表,并不存储任何实际的数据。本节主要从加载和导出数据的实战出发,演示了几种常用的数据加载和导出方法,旨在让同学们可以在实际应用中完成数据库构建任务的最后一步——数据加载。
2.6HiveQL查询语句:数据库记录数据的最主要作用就是供用户对数据库中的数据进行复合式的查询响应。本节从HiveQL的查询语句出发,实践了Hive数据库中常用的查询语句关键字和组合用法,旨在让同学们在拥有了自己的数据库后可以按照特定需求查询返回相应的数据。
2.7HiveQL视图:视图一直是数据库中非常重要的概念,作为保护数据和简化查询的重要手段,常被应用于各种数据库场景中。本节主要从HiveQL的视图实践出发,简单介绍Hive数据库中视图的相关应用,旨在让同学们理解视图的概念并在实际场景中根据需求应用视图。
对
错
答案:错
[判断题]Hive会在数据读取时进行数据类型验证
错
对
答案:对
对
错
答案:对
SHOW test.TABLES;
USE test;SHOW TABLES;
SHOW TABLES IN test;
答案:SHOW TABLES IN test;USE test;SHOW TABLES;
错
对
答案:错
SHOW PARTITIONS test PARTITION(a=1);
SELECT PARTITIONS FROM test PARTITION(a=1);
SELECT b FROM test WHERE a=1;
答案:SHOW PARTITIONS test PARTITION(a=1);
SELECT sum(match) FROM date_records;
SELECT count(*) FROM date_records WHERE match=1;
SELECT sum(id) FROM date_records WHERE match=1;
SELECT match FROM date_records WHERE match=1;
答案:SELECT sum(match) FROM date_records;SELECT count(*) FROM date_records WHERE match=1;
错
对
答案:对
错
对
答案:对
错
对
答案:对