Hive 教程
Hive 是一个处理 Hadoop 结构化数据的数据仓库基础架构工具。它位于 Hadoop 之上,用于汇总大数据,并使查询和分析变得容易。
这是一个简要教程,介绍如何在 Hadoop 分布式文件系统中使用 Apache Hive HiveQL。这个教程可以是成为使用 Hive 成功的 Hadoop 开发人员的第一步。
阅读更多:Hive 教程
目标受众
这个教程是为那些希望在使用 Hadoop 框架进行大数据分析方面发展职业的专业人士准备的。ETL 开发人员和普遍从事分析工作的专业人员也可以有效地使用这个教程。
先决条件
在开始这个教程之前,你需要对核心 Java、SQL 数据库概念、Hadoop 文件系统以及任何 Linux 操作系统版本有基本的了解。