Diferencia entre Hadoop 2.x y Hadoop 3.x

El viaje de Hadoop comenzó en 2005 por Doug Cutting y Mike Cafarella. ¿Cuál es una compilación de software de código abierto para manejar datos de gran tamaño? El objetivo de este artículo es familiarizarlo con las diferencias entre la versión Hadoop 2.x y Hadoop 3.x. Obviamente, Hadoop 3.x tiene algunas funciones más avanzadas y compatibles que las versiones anteriores de Hadoop 2.x.

Hadoop 2.X vs 3.X

Hadoop 2.x frente a Hadoop 3.x

S. No. Rasgo Hadoop 2.x Hadoop 3.x
1 Licencia Apache 2.0 se utiliza para la concesión de licencias, que es de código abierto. Apache 2.0 se utiliza para la concesión de licencias, que es de código abierto.
2 Versión mínima de Java admitida JAVA 7 es la versión mínima compatible. JAVA 8 es la versión mínima compatible.
3 Tolerancia a fallos La replicación es la única forma de manejar la tolerancia a fallas que no está optimizada para el espacio. La codificación de borrado se usa para manejar la tolerancia a fallas.
4 Equilibrio de datos El equilibrador HDFS se utiliza para el equilibrio de datos. Se utiliza el equilibrador de Nodes intradatos, que se llama a través de la interfaz de línea de comandos del equilibrador de disco HDFS.
5 Esquema de almacenamiento Se utiliza el esquema de replicación 3x. utiliza codificación de borrador en HDFS.
6 Gastos generales de almacenamiento El 200 % de HDFS se consume en Hadoop 2.x 50% utilizado en Hadoop 3.x significa que tenemos más espacio para trabajar.
7 Servicio de línea de tiempo de YARN Utiliza el servicio de línea de tiempo con problemas de escalabilidad. Mejorar el servicio de línea de tiempo junto con mejorar la escalabilidad y confiabilidad de este servicio.
8 Escalabilidad Escalabilidad limitada, puede tener hasta 10000 Nodes en un clúster. Se mejora la escalabilidad, puede tener más de 10000 Nodes en un clúster.
9 Intervalo de puertos predeterminado (32768-61000) El rango de puertos efímeros de Linux se usa de forma predeterminada, que no se pudo vincular en el momento del inicio. Los puertos utilizados están fuera de este rango de puertos efímeros.
10 Sistema de archivos compatibles. HDFS (predeterminado), FTP, Amazon S3 y sistema de archivos de Windows Azure Storage Blobs (WASB). Todos los sistemas de archivos, incluido el sistema de archivos de Microsoft Azure Data Lake.
11 Recuperación de Node de nombre Se necesita una intervención manual para la recuperación del Node de nombre. No es necesaria la intervención manual para la recuperación del Node de nombre.

Publicación traducida automáticamente

Artículo escrito por dikshantmalidev y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *