¿Cómo leer un archivo o datos numéricos en Python con numpy?

Requisitos previos : Numpy 

NumPy es un paquete de procesamiento de arrays de propósito general. Proporciona un objeto de array multidimensional de alto rendimiento y herramientas para trabajar con estas arrays. Este artículo describe cómo se pueden leer los datos numéricos de un archivo usando Numpy.

Los datos numéricos pueden estar presentes en diferentes formatos de archivo:

  • Los datos se pueden guardar en un archivo txt donde cada línea tiene un nuevo punto de datos.
  • Los datos se pueden almacenar en un archivo CSV (valores separados por comas).
  • Los datos también se pueden almacenar en el archivo TSV (valores separados por tabuladores).

Existen múltiples formas de almacenar datos en archivos y las anteriores son algunos de los formatos más utilizados para almacenar datos numéricos. Para lograr nuestra funcionalidad requerida, se utilizará la función loadtxt() de numpy .

Sintaxis: numpy.loadtxt(fname, dtype=’float’, comments=’#’, delimitador=Ninguno, convertidores=Ninguno, skiprows=0, usecols=Ninguno, unpack=False, ndmin=0)

Parámetros:
fname: Archivo, nombre de archivo o generador para leer. Si la extensión del nombre de archivo es .gz o .bz2, primero se descomprime el archivo. Tenga en cuenta que los generadores deben devolver strings de bytes para Python 3k.
dtype : tipo de datos de la array resultante; predeterminado: flotante. Si se trata de un tipo de datos estructurados, la array resultante será unidimensional y cada fila se interpretará como un elemento de la array.
delimitador: la string utilizada para separar valores. Por defecto, este es cualquier espacio en blanco.
convertidores: un número de columna de asignación de diccionario a una función que convertirá esa columna en un flotante. Por ejemplo, si la columna 0 es una string de fecha: convertidores = {0: datestr2num}. Valor predeterminado: ninguno.
skiprows : Omite las primeras líneas de skiprows; predeterminado: 0.

Devoluciones: ndarray

Acercarse

  • Módulo de importación
  • Cargar archivo
  • Leer datos numéricos
  • Datos de impresión recuperados.

A continuación se presentan algunas implementaciones para varios formatos de archivo:

Enlace para descargar los archivos de datos utilizados: 

Ejemplo 1: lectura de datos numéricos de un archivo de texto

Python3

# Importing libraries that will be used
import numpy as np
 
# Setting name of the file that the data is to be extracted from in python
filename = 'gfg_example1.txt'
 
# Loading file data into numpy array and storing it in variable called data_collected
data_collected = np.loadtxt(filename)
 
# Printing data stored
print(data_collected)
 
 
# Type of data
print(
    f'Stored in : {type(data_collected)} and data type is : {data_collected.dtype}')

Producción : 

Salida del Ejemplo 1

Ejemplo 2: lectura de datos numéricos de un archivo CSV.

Python3

# Importing libraries that will be used
import numpy as np
 
# Setting name of the file that the data is to be extracted from in python
# This is a comma separated values file
filename = 'gfg_example2.csv'
 
# Loading file data into numpy array and storing it in variable.
# We use a delimiter that basically tells the code that at every ',' we encounter,
# we need to treat it as a new data point.
# The data type of the variables is set to be int using dtype parameter.
data_collected = np.loadtxt(filename, delimiter=',', dtype=int)
 
# Printing data stored
print(data_collected)
 
 
# Type of data
print(
    f'Stored in : {type(data_collected)} and data type is : {data_collected.dtype}')

Producción : 

Salida del ejemplo 2

Ejemplo 3: lectura del archivo tsv

Python3

# Importing libraries that will be used
import numpy as np
 
# Setting name of the file that the data is to be extracted from in python
# This
filename = 'gfg_example3.tsv'
 
# Loading file data into numpy array and storing it in variable called data_collected
# We use a delimiter that basically tells the code that at every ',' we encounter,
# we need to treat it as a new data point.
data_collected = np.loadtxt(filename, delimiter='\t')
 
# Printing data stored
print(data_collected)
 
 
# Type of data
print(
    f'Stored in : {type(data_collected)} and data type is : {data_collected.dtype}')

Producción : 

Salida del Ejemplo 3

Ejemplo 4: seleccione solo filas particulares y omita algunas filas

Python3

# Importing libraries that will be used
import numpy as np
 
# Setting name of the file that the data is to be extracted from in python
filename = 'gfg_example4.csv'
 
# Loading file data into numpy array and storing it in variable called data_collected
data_collected = np.loadtxt(
    filename, skiprows=1, usecols=[0, 1], delimiter=',')
 
# Printing data stored
print(data_collected)
 
 
# Type of data
print(
    f'Stored in : {type(data_collected)} and data type is : {data_collected.dtype}')

Producción : 

Salida del ejemplo 4

Publicación traducida automáticamente

Artículo escrito por dhruv_tewari y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *