1. Sistema de archivos local (LFS):
el sistema de archivos básico del sistema operativo Linux se denomina sistema de archivos local. Almacena cualquier archivo de datos tal como está en una sola copia.
Almacena archivos de datos en formato de árbol. Aquí, cualquier usuario puede acceder a los archivos de datos directamente. LFS no replica los bloques de datos. Siempre se utiliza para almacenar y procesar datos personales (pequeños datos).
2. Sistema de archivos distribuidos (DFS):
cuando necesitamos almacenar y procesar un archivo de datos de gran tamaño (un archivo de aproximadamente 1 TB de tamaño como mínimo), el sistema de archivos local del sistema operativo no es adecuado. En tales casos, utilizamos el sistema de archivos distribuidos. Se puede crear en cualquier sistema operativo Linux con Hadoop. DFS almacena cualquier archivo de datos dividiéndolo en varios bloques.
Este sistema de archivos funciona en formato Maestro-Esclavo donde Maestro es NameNode y DataNodes son los esclavos. Todos los bloques de un archivo de datos se almacenan en diferentes DataNodes y la ubicación solo la conoce NameNode. Cada bloque de datos se replica en diferentes Nodes de datos para evitar la pérdida de datos cuando falla un Node de datos. En DFS, los archivos de datos no son accesibles directamente para ningún usuario porque solo NameNode sabe dónde se almacenan los bloques de datos del archivo de datos.
Diferencia entre el sistema de archivos local (LFS) y el sistema de archivos distribuido (DFS):
Sistema de archivos locales | Sistema de archivos distribuido |
---|---|
LFS almacena datos como un solo bloque. | DFS divide los datos en múltiples bloques y los almacena en diferentes DataNodes. |
LFS utiliza el formato de árbol para almacenar datos. | DFS proporciona una arquitectura Maestro-Esclavo para el almacenamiento de datos. |
La recuperación de datos en LFS es lenta. | La recuperación de datos en DFS es rápida. |
No es confiable porque los datos LFS no replican los archivos de datos. | Es confiable porque en DFS los bloques de datos se replican en diferentes DataNodes. |
LFS es más económico porque no necesita memoria adicional para almacenar ningún archivo de datos. | DFS es costoso porque necesita memoria adicional para replicar los mismos bloques de datos. |
Se puede acceder a los archivos directamente en LFS. | No se puede acceder a los archivos directamente en DFS porque solo NameNode conoce la ubicación real de los bloques de datos. |
LFS no es apropiado para el análisis de archivos de datos muy grandes porque necesita mucho tiempo para procesarse. | DFS es apropiado para el análisis de grandes archivos de datos porque necesita menos tiempo para procesar en comparación con el sistema de archivos local. |
LFS es menos complejo que DFS. | DFS es más complejo que LFS. |
Publicación traducida automáticamente
Artículo escrito por Akash_chowrasia y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA