Diferencia entre la plataforma MapR y la plataforma Cloudera

1. Cloudera:
Cloudera fue fundada en 2008 por algunas de las mentes más brillantes de los grandes genios de datos, incluidos Google, Yahoo!, Oracle y Facebook. Se basa en Apache Hadoop de código abierto, pero ha agregado su propio software propietario . Proporciona distribución gratuita y de pago con funciones y soporte adicionales. El logro a largo plazo de Cloudera es ser un centro de datos empresarial, por lo que se reduce/elimina la necesidad de un almacén de datos . Admite MapReduce y YARN. Ha estado aquí durante más tiempo desde la creación de Hadoop. Cloudera Distribution Hadoop (CDH) tiene la capacidad de agregar nuevos servicios a un clúster de Hadoop en ejecución y admite la administración de múltiples clústeres.

2. MapR:
MapR fue fundado en 2009 por John Schroeder, MC Srivas. Es una plataforma de datos y se puede acceder a varias fuentes de datos desde un solo clúster de computadoras, incluidas cargas de trabajo de big data como Apache Hadoop y Apache Spark , Hive and Drill y más, y simultáneamente. Realiza análisis y aplicaciones con velocidad, escala y confiabilidad. Grandes empresas como Cisco, Google Cloud Platform y Amazon EMR utilizan MapR Hadoop Distribution para sus servicios Hadoop. MapR Hadoop Distribution (MapRHD) sigue una arquitectura distribuida para almacenar metadatos en los Nodes de procesamiento, ya que depende de un sistema de archivos diferente que se conoce como MapR File System o, en resumen, MapRFS y no tiene una arquitectura de Node de nombre.

Diferencia entre Cloudera y MapR:

S. No. CLOUDERA MAPR
01. Cloudera fue fundada en 2008 por algunas de las mentes más brillantes de los grandes genios de datos, incluidos Google, Yahoo!, Oracle y Facebook. MapR fue fundado en 2009 por John Schroeder, MC Sivas.
02 Se basa en Apache Hadoop de código abierto, pero ha agregado su propio software propietario. Es una plataforma de datos que brinda acceso a una variedad de fuentes de datos desde un solo clúster de computadoras que incluye grandes cargas de trabajo de datos como Apache Hadoop, Hive and Drill, Apache Spark, pero también va mucho más allá.
03. La herramienta de gestión de Cloudera es Cloudera Manager. La herramienta de gestión de MapR es MapR Control System.
04. Cloudera no tiene soporte de volumen. MapR tiene soporte de volumen.
05. Para la recuperación ante desastres y la copia de seguridad, utiliza funciones regulares de copia de seguridad y recuperación ante desastres (BDR). Para la recuperación ante desastres, utiliza funciones de duplicación.
06 La replicación de Cloudera permite replicar los datos. MapR Replication permite replicar datos y metadatos.
07 Cloudera tiene una arquitectura de metadatos centralizada. MapR tiene una arquitectura de metadatos distribuidos.
08 El acceso al sistema de archivos en cloudera es Hadoop Distributed File System (HDFS) y NFS de solo lectura. El acceso al sistema de archivos en MapR es Hadoop Distributed File System (HDFS) y NFS de lectura y escritura (POSIX).
09 Utiliza autenticación de nivel de escritura de Kerberos. Utiliza Kerberos, autenticación de nivel de escritura nativa.
10 Cloudera tiene tres ediciones, una es gratuita, otra edición empresarial de hasta 60 días y una edición empresarial completa. Tiene una edición completamente empresarial.
11 Se ejecuta en el sistema de archivos distribuidos de Hadoop (HDFS). MAPR se ejecuta en el sistema de archivos MapR (MAPRFS).

Publicación traducida automáticamente

Artículo escrito por Satyabrata_Jena y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *