El comando Dividir en Linux se usa para dividir archivos grandes en archivos más pequeños . Divide los archivos en 1000 líneas por archivo (por defecto) e incluso permite a los usuarios cambiar el número de líneas según los requisitos.
Los nombres de los archivos son PREFIXaa, PREFIXab, PREFIXac, etc. De forma predeterminada, el PREFIJO del nombre de los archivos es x y el tamaño predeterminado de cada archivo dividido es de 1000 líneas por archivo y ambos parámetros se pueden cambiar con facilidad. Por lo general, se usa con archivos de registro y de almacenamiento, ya que son muy grandes y tienen muchas líneas. Por lo tanto, para dividirlos en archivos pequeños para el análisis, se usa el comando de división.
Sintaxis:
split [options] name_of_file prefix_for_new_files
Trabajar con Comando Dividir
1. Divida el archivo en archivos cortos. Asuma un nombre de archivo con el nombre index.txt. Use el siguiente comando dividir para dividirlo en pedazos.
split index.txt
El archivo Index.txt se divide en dos partes con el nombre ‘xaa’ y ‘xab’. Tendrá 1000 líneas en cada archivo por defecto. El nombre de los comandos divididos es ‘xaa’ y ‘xab’ ya que no hemos establecido ningún valor de prefijo.
2. Archivo dividido según el número de líneas.
split -l 4 index.txt split_file
El archivo Index.txt se divide en archivos cortos en función del número de líneas que queremos usando la opción -l como se muestra.
3. Dividir comando con opción detallada. También podemos ejecutar el comando dividido en modo detallado usando ‘–verbose’. Dará un mensaje de diagnóstico cada vez que se cree un nuevo archivo dividido.
split index.txt -l 4 --verbose
Aquí, hemos creado un archivo con el nombre index.txt que se dividirá en archivos cortos y detallados que nos darán los detalles de cuáles son las tareas realizadas.
Nota: Aquí no es necesario usar -l 4. Se utiliza sólo con fines de comprensión.
4. Divida el tamaño del archivo usando la opción ‘-b’.
split -b 16 index.txt index
Aquí, dividirá el archivo index.txt en archivos separados llamados indexaa, indexab, … cada archivo contiene 16 bytes de datos.
5. Cambio en la longitud del sufijo. Por defecto, la longitud del sufijo es 2. También podemos cambiarlo usando la opción ‘-a’.
split -l 4 -a 4 index.txt
En esto tiene una longitud de sufijo 4 en los archivos divididos.
Nota: Aquí no es necesario usar -l 4. Se utiliza sólo con fines de comprensión.
6. Archivos divididos creados con sufijo numérico. En general, la salida tiene un formato de x** donde ** son letras. Podemos cambiar el sufijo de archivos divididos a numérico usando la opción ‘-d’.
split -l 4 -d index.txt
Nota: Aquí no es necesario usar -l 4. Se utiliza sólo con fines de comprensión.
7. Cree archivos de salida de n fragmentos. Si queremos dividir un archivo en tres archivos de salida de fragmentos, use la opción ‘-n’ con el comando dividir que limita la cantidad de archivos de salida divididos.
split -n 3 index.txt
Creará tres fragmentos de archivos divididos.
8. Archivo dividido con sufijo personalizado. Con este comando, podemos crear archivos de salida divididos con sufijo de personalización. Supongamos que, si queremos crear archivos de salida divididos con sufijo de índice , ejecute el siguiente comando.
split -l 4 index.txt split_index_
Se crearán archivos de salida divididos con sufijo de índice.
Nota: Aquí no es necesario usar -l 4. Se utiliza sólo con fines de comprensión.
9. Evite los archivos divididos de tamaño cero. Hay situaciones en las que dividimos un archivo pequeño en una gran cantidad de archivos fragmentados y esto puede generar archivos de salida divididos de tamaño cero. No añaden ningún valor por lo que para evitarlo usamos la opción ‘-e’.
split -l 4 -e index.txt
Al usar esto, no se crearán archivos de salida divididos de tamaño cero.
Nota: Aquí no es necesario usar -l 4. Se utiliza sólo con fines de comprensión.
10. Divida el archivo en dos archivos de igual longitud. Para dividir un archivo por igual en dos archivos, usamos la opción ‘-n’. Al especificar ‘-n 2’, el archivo se divide por igual en dos archivos.
split -n 2 index.txt