RDBMS 和 Hive 的区别
关系型数据库:
RDBMS 代表关系数据库管理系统。RDBMS 是一种专门为关系数据库设计的数据库管理系统。RDBMS 是 DBMS 的子集。关系数据库是指使用行和列以结构化格式存储数据的数据库,这种结构化形式称为表。RDBMS 中定义了一些特定的规则,称为 Codd 规则。
Hive:
Hive是一个提供数据查询和分析的数据仓库软件系统。Hive 提供了一个类似于 SQL 的接口来查询存储在与 Hadoop 集成的各种数据库和文件系统中的数据。Hive 有助于快速查询和管理大型数据集。它是Hadoop生态系统的ETL工具。
RDBMS 和 Hive 的区别:
RDBMS | Hive |
---|---|
RDBMS用于维护数据库。 | Hive用于维护数据仓库。 |
RDBMS使用 SQL(结构化查询语言)。 | Hive使用 HQL(Hive 查询语言)。 |
Schema 在 RDBMS 中是固定的。 | 架构在Hive中有所不同。 |
RDBMS存储标准化数据。 | 存储规范化和非规范化两种类型的数据。 |
RDBMS 中的表是稀疏的。 | Hive中的桌子很密集。 |
RDBMS不支持分区。 | Hive支持自动化分区。 |
RDBMS没有使用分区方法。 | 分片方法用于分区。 |