Reemplazo de valores faltantes usando Pandas en Python

El conjunto de datos es una colección de atributos y filas. El conjunto de datos puede tener datos faltantes que están representados por NA en Python y en este artículo, vamos a reemplazar los valores faltantes en este artículo

Consideramos este conjunto de datos: Conjunto de datos

conjunto de datos

En nuestros datos contiene valores faltantes en las columnas cantidad, precio, comprado, mañana y tarde,

Entonces, podemos reemplazar los valores que faltan en la columna de cantidad con la media, la columna de precio con una mediana, la columna Comprada con desviación estándar. Columna de la mañana con el valor mínimo en esa columna. Columna de la tarde con valor máximo en esa columna.

Acercarse:

  • Importar el módulo
  • Cargar conjunto de datos
  • Completa los valores que faltan
  • Verificar conjunto de datos

Sintaxis:

Media: datos=datos.fillna(datos.mean())

Mediana: datos=datos.fillna(datos.mediana())

Desviación estándar: data=data.fillna(data.std())

Min: datos=datos.fillna(datos.min())

Máx.: datos=datos.fillna(datos.max())

A continuación se muestra la implementación:

Python3

# importing pandas module
import pandas as pd
  
# loading data set
data = pd.read_csv('item.csv')
  
# display the data
print(data)

Producción:

Luego, procederemos a reemplazar los valores faltantes con la media, la mediana, la moda, la desviación estándar, el mínimo y el máximo.

Python3

# replacing missing values in quantity
# column with mean of that column
data['quantity'] = data['quantity'].fillna(data['quantity'].mean())
  
# replacing missing values in price column
# with median of that column
data['price'] = data['price'].fillna(data['price'].median())
  
# replacing missing values in bought column with
# standard deviation of that column
data['bought'] = data['bought'].fillna(data['bought'].std())
  
# replacing missing values in forenoon  column with
# minimum number of that column
data['forenoon'] = data['forenoon'].fillna(data['forenoon'].min())
  
# replacing missing values in afternoon  column with 
# maximum number of that column
data['afternoon'] = data['afternoon'].fillna(data['afternoon'].max())
  
print(Data)

Producción:

Publicación traducida automáticamente

Artículo escrito por sravankumar8128 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *