Python es un excelente lenguaje para realizar análisis de datos, principalmente debido al fantástico ecosistema de paquetes de Python centrados en datos. Pandas es uno de esos paquetes y facilita mucho la importación y el análisis de datos.
Al crear un marco de datos a partir de un archivo csv, muchas columnas en blanco se importan como valor nulo en el marco de datos, lo que luego crea problemas al operar ese marco de datos. Los métodos isnull() y notnull() de Pandas se utilizan para verificar y administrar valores NULL en un marco de datos.
Marco de datos.isnull()
Sintaxis: Pandas.isnull(“Nombre del marco de datos”) o DataFrame.isnull()
Parámetros: Objeto para verificar valores nulos para
Tipo de retorno: Marco de datos de valores booleanos que son verdaderos para valores NaN
Para descargar el archivo CSV utilizado, haga clic aquí .
Ejemplo n.º 1: uso de isnull()
En el siguiente ejemplo, la columna Team se comprueba en busca de valores NULL y el método isnull() devuelve una serie booleana que almacena True para siempre el valor NaN y False para un valor Not null.
Python
# importing pandas package import pandas as pd # making data frame from csv file data = pd.read_csv("employees.csv") # creating bool series True for NaN values bool_series = pd.isnull(data["Team"]) # filtering data # displaying data only with team = NaN data[bool_series]
Salida:
como se muestra en la imagen de salida, solo se muestran las filas que tienen Team=NULL.
Marco de datos.notnull()
Sintaxis: Pandas.notnull(“Nombre del marco de datos”) o DataFrame.notnull()
Parámetros: Objeto para verificar valores nulos para
Tipo de retorno: Marco de datos de valores booleanos que son falsos para valores NaN
Ejemplo n.º 1: uso de notnull()
En el siguiente ejemplo, la columna Género se comprueba en busca de valores NULOS y el método notnull() devuelve una serie booleana que almacena Verdadero para siempre el valor NO NULO y Falso para un valor nulo.
Python
# importing pandas package import pandas as pd # making data frame from csv file data = pd.read_csv("employees.csv") # creating bool series False for NaN values bool_series = pd.notnull(data["Gender"]) # displayed data only with team = NaN data[bool_series]
Salida:
como se muestra en la imagen de salida, solo se muestran las filas que tienen algún valor en Género.
Publicación traducida automáticamente
Artículo escrito por Kartikaybhutani y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA