Hadoop和Cassandra的区别
Hadoop :Hadoop 是一个开源软件编程框架。Hadoop 的框架基于 Java 编程语言,在 shell 脚本和 C 中包含一些本机代码。该框架用于管理、存储和处理在集群系统下运行的大数据的不同应用程序的数据和计算。Hadoop 的主要组件是 HDFS、MapReduce 和 YARN。
Cassandra :Cassandra是一个开源分布式数据管理系统,具有宽列存储和 NoSQL 数据库。在这个 NoSQL 数据库中,提供了跨许多商品硬件处理大量数据的能力,没有单点故障和高可用性。该代码是用 Java 编写的,由 Apache Software Foundation 开发。
Hadoop和Cassandra的区别
编号 | Hadoop | Cassandra |
---|---|---|
1 | Hadoop 是一个可扩展的框架,旨在部署在低成本硬件上。 | Cassandra以非常分布式的方式部署为一个实例集群,这些实例都相互了解。 |
2 | Hadoop 是一个基于著名的 MapReduce 编程模型的大数据处理框架。 | Cassandra主要用于实时数据处理。 |
3 | Hadoop 支持多种格式。 | Cassandra 不支持图像。 |
4 | Hadoop 遵循主从架构。 | Cassandra 遵循点对点架构 |
5 | Hadoop 部署在单个数据中心。 | Cassandra 以非常分布式的方式部署。 |
6 | Hadoop使用 map reduce 来读/写。 | 这使用 Cassandra 查询语言。 |
7 | 在hadoop中,数据直接写入数据节点。 | 在 Cassandra 中,数据首先写入内存表,然后写入磁盘。 |
8 | Hadoop 有一个固定的复制因子3 | Cassandra 中的复制因子取决于节点的数量。 |
9 | Hadoop延迟率高。 | Cassandra的延迟率更低。 |
10 | Hadoop 使用 TCP 和 UDP 进行通信。 | 在 Cassandra 中,gossip 协议用于通信。 |
11 | Hadoop用于数据批处理。 | Cassandra用于实时处理。 |