HiveQL学习

数据类型与文件格式

数据类型

基本数据类型

img

集合数据类型

img

案例

img

文本文件数据编码

CSV(Comma-Separated Values):逗号分隔值的英文缩写
一行表示一条记录,每条记录中不同属性的值用逗号进行分隔

数据并不是一开始就存储在数据库中的,一般都是需要进行收集后加载到数据库中,数据库都支持诸如csv这种文本文件的批量数据导入。

HiveQL 由于存在集合数据类型(存在逗号),所以 csv文件中格式容易混淆,由此提出字段分隔符

字段分隔符

img

读时模式

写时模式(传统数据库):数据在吸入数据库时对模式进行检查。
读时模式(Hive):Hive不会在数据加载时进行验证,而是在查询时进行。

Hive 中的数据库

HiveQL 与 MySQL 的异同

异:Hive 不支持行级插入、更新和删除操作,也不支持事务。在Hadoop的支撑下,Hive具有很强的扩展性。
同:语法差别不大

… …