El conjunto de datos es una colección de atributos y filas. El conjunto de datos puede tener datos faltantes que están representados por NA en Python y en este artículo, vamos a reemplazar los valores faltantes en este artículo
Consideramos este conjunto de datos: Conjunto de datos
En nuestros datos contiene valores faltantes en las columnas cantidad, precio, comprado, mañana y tarde,
Entonces, podemos reemplazar los valores que faltan en la columna de cantidad con la media, la columna de precio con una mediana, la columna Comprada con desviación estándar. Columna de la mañana con el valor mínimo en esa columna. Columna de la tarde con valor máximo en esa columna.
Acercarse:
- Importar el módulo
- Cargar conjunto de datos
- Completa los valores que faltan
- Verificar conjunto de datos
Sintaxis:
Media: datos=datos.fillna(datos.mean())
Mediana: datos=datos.fillna(datos.mediana())
Desviación estándar: data=data.fillna(data.std())
Min: datos=datos.fillna(datos.min())
Máx.: datos=datos.fillna(datos.max())
A continuación se muestra la implementación:
Python3
# importing pandas module import pandas as pd # loading data set data = pd.read_csv('item.csv') # display the data print(data)
Producción:
Luego, procederemos a reemplazar los valores faltantes con la media, la mediana, la moda, la desviación estándar, el mínimo y el máximo.
Python3
# replacing missing values in quantity # column with mean of that column data['quantity'] = data['quantity'].fillna(data['quantity'].mean()) # replacing missing values in price column # with median of that column data['price'] = data['price'].fillna(data['price'].median()) # replacing missing values in bought column with # standard deviation of that column data['bought'] = data['bought'].fillna(data['bought'].std()) # replacing missing values in forenoon column with # minimum number of that column data['forenoon'] = data['forenoon'].fillna(data['forenoon'].min()) # replacing missing values in afternoon column with # maximum number of that column data['afternoon'] = data['afternoon'].fillna(data['afternoon'].max()) print(Data)
Producción:
Publicación traducida automáticamente
Artículo escrito por sravankumar8128 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA