MapR平台和Cloudera平台的区别
Cloudera
Cloudera成立于2008年,由一些来自大数据天才的最聪明的人创立,包括谷歌、雅虎、甲骨文和Facebook。它基于开源的Apache Hadoop,但增加了自己的专利软件。它提供了免费和付费的发行版本,具有额外的功能和支持。Cloudera的长期成就是成为一个企业数据中心,从而减少/消除对数据仓库的需求。它支持MapReduce以及YARN。自Hadoop创建以来,它在这里存在的时间最长。Cloudera Distribution Hadoop(CDH)有能力向正在运行的Hadoop集群添加新的服务,并支持多集群管理。
MapR
MapR是由John Schroeder, M.C. Srivas于2009年创立。它是一个数据平台,一些数据源可以从一个计算机集群中访问,包括大数据工作负载,如Apache Hadoop和Apache Spark,Hive和Drill等等,并同时进行。它以速度、规模和可靠性执行分析和应用。像思科、谷歌云平台和亚马逊EMR这样的大公司都使用MapR Hadoop Distribution提供Hadoop服务。MapR Hadoop发行版(MapRHD)采用分布式架构在处理节点上存储元数据,因为它依赖于不同的文件系统,即MapR文件系统或简称为MapRFS,没有名称节点架构。
Cloudera和MapR之间的区别 –
编号 | Cloudera | MapR |
---|---|---|
1 | Cloudera成立于2008年,由谷歌、雅虎、甲骨文和Facebook等大数据天才的一些最聪明的人创立。 | MapR于2009年由John Schroeder、M.C. Sivas创立。 |
2 | Cloudera以开源的Apache Hadoop为基础,但加入了自己的专利软件。 | MapR是一个数据平台,可以从一个计算机集群中访问各种数据源,包括Apache Hadoop、Hive和Drill、Apache Spark等大数据工作负载,但它也远远不止这些。 |
3 | Cloudera的管理工具是Cloudera Manager。 | MapR的管理工具是MapR控制系统。 |
4 | Cloudera没有卷支持。 | MapR有卷支持。 |
5 | 对于灾难恢复和备份,Cloudera使用常规的备份和灾难恢复(BDR)功能。 | 对于灾难恢复,MapR使用镜像功能。 |
6 | Cloudera复制允许数据被复制。 | MapR Replication允许数据和元数据被复制。 |
7 | Cloudera有集中式元数据架构。 | MapR有分布式元数据架构。 |
8 | Cloudera的文件系统访问是Hadoop分布式文件系统(HDFS)和只读NFS。 | MapR的文件系统访问是Hadoop分布式文件系统(HDFS)和读写NFS(POSIX)。 |
9 | Cloudera使用Kerberos写级认证。 | MapR使用Kerberos,Native写级别认证。 |
10 | Cloudera有三个版本,一个是免费的,另一个是长达60天的企业版和完全企业版。 | MapR有完全的企业版。 |
11 | Cloudera在Hadoop分布式文件系统(HDFS)上运行。 | MapR运行在MapR文件系统(MAPRFS)上。 |