HiveQL学习
数据类型与文件格式
数据类型
基本数据类型
集合数据类型
案例
文本文件数据编码
CSV(Comma-Separated Values):逗号分隔值的英文缩写
一行表示一条记录,每条记录中不同属性的值用逗号进行分隔
数据并不是一开始就存储在数据库中的,一般都是需要进行收集后加载到数据库中,数据库都支持诸如csv这种文本文件的批量数据导入。
HiveQL 由于存在集合数据类型(存在逗号),所以 csv文件中格式容易混淆,由此提出字段分隔符
字段分隔符
读时模式
写时模式(传统数据库):数据在吸入数据库时对模式进行检查。
读时模式(Hive):Hive不会在数据加载时进行验证,而是在查询时进行。
Hive 中的数据库
HiveQL 与 MySQL 的异同
异:Hive 不支持行级插入、更新和删除操作,也不支持事务。在Hadoop的支撑下,Hive具有很强的扩展性。
同:语法差别不大
… …