En este artículo, discutiremos cómo leer archivos de texto con pandas en python. En python, el módulo pandas nos permite cargar DataFrames desde archivos externos y trabajar en ellos. El conjunto de datos puede estar en diferentes tipos de archivos.
Archivo de texto utilizado:
Método 1: Usar read_csv()
Leeremos el archivo de texto con pandas usando la función read_csv(). Junto con el archivo de texto, también pasamos el separador como un solo espacio (‘ ‘) para el carácter de espacio porque, para los archivos de texto, el carácter de espacio separará cada campo. Hay tres parámetros que podemos pasar a la función read_csv().
Sintaxis:
data=pandas.read_csv(‘filename.txt’, sep=’ ‘, header=Ninguno, names=[“Columna1”, “Columna2”])
Parámetros:
- filename.txt: como su nombre indica, es el nombre del archivo de texto del que queremos leer los datos.
- sep : Es un campo separador. En el archivo de texto, usamos el carácter de espacio (‘ ‘) como separador.
- encabezado: Este es un campo opcional. Por defecto, tomará la primera línea del archivo de texto como encabezado. Si usamos header=None, creará el encabezado.
- nombres: podemos asignar nombres de columna al importar el archivo de texto usando el argumento de nombres.
Ejemplo 1:
Python3
# Read Text Files with Pandas using read_csv() # importing pandas import pandas as pd # read text file into pandas DataFrame df = pd.read_csv("gfg.txt", sep=" ") # display DataFrame print(df)
Producción:
Ejemplo 2:
En el ejemplo 2, haremos que el encabezado archivado sea igual a Ninguno. Esto creará un encabezado predeterminado en la salida. Y tome la primera línea del archivo de texto como entrada de datos. El nombre del encabezado creado será un número a partir de 0.
Python3
# Read Text Files with Pandas using read_csv() # importing pandas import pandas as pd # read text file into pandas DataFrame and # create header df = pd.read_csv("gfg.txt", sep=" ", header=None) # display DataFrame print(df)
Producción:
Ejemplo 3:
En el resultado anterior, podemos ver que crea un encabezado a partir del número 0. Pero también podemos dar nombres al encabezado. En este ejemplo, veremos cómo crear un encabezado con un nombre usando pandas.
Python3
# Read Text Files with Pandas using read_csv() # importing pandas import pandas as pd # read text file into pandas DataFrame and create # header with names df = pd.read_csv("gfg.txt", sep=" ", header=None, names=["Team1", "Team2"]) # display DataFrame print(df)
Producción:
Método 2: Usar read_table()
Podemos leer datos de un archivo de texto usando read_table() en pandas. Esta función lee un archivo delimitado general a un objeto DataFrame. Esta función es esencialmente la misma que la función read_csv() pero con el delimitador = ‘\t’, en lugar de una coma por defecto. Leeremos los datos con la función read_table haciendo que el separador sea igual a un solo espacio (‘ ‘).
Sintaxis:
data=pandas.read_table('filename.txt', delimiter = ' ')
Ejemplo:
Python3
# Read Text Files with Pandas using read_table() # importing pandas import pandas as pd # read text file into pandas DataFrame df = pd.read_table("gfg.txt", delimiter=" ") # display DataFrame print(df)
Producción:
Método 3: Usar read_fwf()
El fwf en la función read_fwf() representa líneas de ancho fijo. Podemos usar esta función para cargar DataFrames desde archivos. Esta función también admite archivos de texto. Leeremos los datos de los archivos de texto usando la función read_fef() con pandas. También admite, opcionalmente, iterar o dividir el archivo en fragmentos. Dado que las columnas en el archivo de texto se separaron con un ancho fijo, este read_fef() lee el contenido de manera efectiva en columnas separadas.
Sintaxis:
data=pandas.read_fwf('filename.txt')
Ejemplo:
Python3
# Read Text Files with Pandas using read_fwf() # importing pandas import pandas as pd # read text file into pandas DataFrame df = pd.read_fwf("gfg.txt") # display DataFrame print(df)
Producción:
Publicación traducida automáticamente
Artículo escrito por rushi_javiya y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA