En este artículo, intentaremos ver diferentes formas de eliminar la columna vacía, la columna nula y la columna de valor de ceros. Primero, crearemos un marco de datos de muestra y luego realizaremos nuestras operaciones en ejemplos posteriores. Al final, obtendrá un conocimiento sólido sobre cómo manejar esta situación con pandas.
Acercarse:
- Importe la biblioteca de python necesaria.
- Cree un marco de datos de muestra.
- Use el método dropna() de Pandas, le permite al usuario analizar y soltar filas/columnas con valores nulos de diferentes maneras.
- Muestra el marco de datos actualizado.
Sintaxis: DataFrameName.dropna(axis=0, how=’any’, inplace=False)
Parámetros:
- eje: el eje toma un valor int o de string para filas/columnas. La entrada puede ser 0 o 1 para Integer y ‘index’ o ‘columns’ para String.
- how: how toma valor de string de solo dos tipos (‘cualquiera’ o ‘todos’). ‘cualquiera’ elimina la fila/columna si CUALQUIER valor es nulo y ‘todo’ solo elimina si TODOS los valores son nulos.
- inplace: es un booleano que realiza los cambios en el marco de datos en sí mismo si es verdadero.
Data de muestra:
Este es el marco de datos de muestra en el que realizaremos diferentes operaciones.
Python3
# import required libraries import numpy as np import pandas as pd # create a Dataframe Mydataframe = pd.DataFrame({'FirstName': ['Vipul', 'Ashish', 'Milan'], "Gender": ["", "", ""], "Age": [0, 0, 0]}) Mydataframe['Department'] = np.nan # show the dataframe print(Mydataframe)
Producción:
Ejemplo 1:
Eliminar todas las columnas de valores nulos.
Python3
# import required libraries import numpy as np import pandas as pd # create a Dataframe Mydataframe = pd.DataFrame({'FirstName': ['Vipul', 'Ashish', 'Milan'], "Gender": ["", "", ""], "Age": [0, 0, 0]}) Mydataframe['Department'] = np.nan display(Mydataframe) Mydataframe.dropna(how='all', axis=1, inplace=True) # show the dataframe display(Mydataframe)
Producción:
Ejemplo 2:
Reemplace todos los lugares vacíos con nulos y luego elimine todas las columnas de valores nulos con la función dropna.
Python3
# import required libraries import numpy as np import pandas as pd # create a Dataframe Mydataframe = pd.DataFrame({'FirstName': ['Vipul', 'Ashish', 'Milan'], "Gender": ["", "", ""], "Age": [0, 0, 0]}) Mydataframe['Department'] = np.nan display(Mydataframe) nan_value = float("NaN") Mydataframe.replace("", nan_value, inplace=True) Mydataframe.dropna(how='all', axis=1, inplace=True) # show the dataframe display(Mydataframe)
Producción:
Ejemplo 3:
Reemplace todos los lugares de ceros con nulos y luego elimine todas las columnas de valores nulos con la función dropna.
Python3
# import required libraries import numpy as np import pandas as pd # create a Dataframe Mydataframe = pd.DataFrame({'FirstName': ['Vipul', 'Ashish', 'Milan'], "Gender": ["", "", ""], "Age": [0, 0, 0]}) Mydataframe['Department'] = np.nan display(Mydataframe) nan_value = float("NaN") Mydataframe.replace(0, nan_value, inplace=True) Mydataframe.dropna(how='all', axis=1, inplace=True) # show the dataframe display(Mydataframe)
Producción:
Ejemplo 4:
Reemplace todos los ceros y lugares vacíos con nulos y luego elimine todas las columnas de valores nulos con la función dropna.
Python3
# import required libraries import numpy as np import pandas as pd # create a Dataframe Mydataframe = pd.DataFrame({'FirstName': ['Vipul', 'Ashish', 'Milan'], "Gender": ["", "", ""], "Age": [0, 0, 0]}) Mydataframe['Department'] = np.nan display(Mydataframe) nan_value = float("NaN") Mydataframe.replace(0, nan_value, inplace=True) Mydataframe.replace("", nan_value, inplace=True) Mydataframe.dropna(how='all', axis=1, inplace=True) # show the dataframe display(Mydataframe)
Producción: