¿Cómo mostrar filas y columnas no nulas en un marco de datos de Python?

En Python, las filas y columnas no nulas significan las filas y columnas que tienen valores Nan , especialmente en la biblioteca Pandas. Para mostrar filas y columnas no nulas en un marco de datos de python, vamos a utilizar diferentes métodos como dropna(), notnull(), loc[].

  • dropna() : esta función se usa para eliminar filas y columnas que tienen valores faltantes que son valores NaN. La función dropna() tiene un parámetro de eje. Si se establece en 0, eliminará todas las filas que tengan un valor de NaN y si se establece en 1, eliminará todas las columnas que tengan un valor de NaN. Por defecto, el valor del parámetro del eje es 0.
  • notnull() : esta función detecta valores que no faltan y devuelve una máscara de valores booleanos para cada elemento en DataFrame que indica si un elemento no es un valor NA.
  • loc[] : este método filtra filas y columnas por etiquetas o array booleana. En nuestro ejemplo, este método filtra filas por una array booleana que devuelve el método notnull().

Pasos:

  • Importar biblioteca de pandas
  • Lea el archivo CSV o puede crear su propio marco de datos.
  • Use uno de los métodos como dropna(), notnull(), loc[] como se describe a continuación.
  • Mostrar resultado

Debajo del archivo StudentData.csv utilizado en el programa:

Método 1: Usar el método dropna() 

En este método, usamos el método dropna() que elimina las filas nulas y muestra el marco de datos modificado.

Python3

# Import library
import pandas as pd
  
# Reading csv file
df = pd.read_csv('StudentData.csv')
  
# using dropna() method
df = df.dropna()
  
# Printing result
print(df)

Producción:

Método 2: Usar el método notnull() y dropna()

En este método, primero usaremos el método notnull() que devuelve un objeto booleano que tiene valores verdaderos y falsos. Si hay un valor de NaN, devolverá falso, de lo contrario, verdadero. Y luego proporcione estos objetos booleanos como parámetros de entrada a la función where junto con esta función use drpna() para colocar filas NaN.

Python3

# Import library
import pandas as pd
  
# Reading csv file
df = pd.read_csv('StudentData.csv')
  
# using notnull() method ,it will return 
# boolean values
mask = df.notnull()
  
# using dropna() method to drop NaN 
# value rows
df = df.where(mask).dropna()
  
# Displaying result
print(df)

Producción:

Método 3: Usar el método loc[] y notnull()

En este método, estamos usando dos conceptos, uno es un método y el otro es una propiedad. Entonces, primero, encontramos un marco de datos con instancias no nulas por columna específica y luego ubicamos las instancias sobre datos completos para obtener el marco de datos.

Python3

# Import library
import pandas as pd
  
# Reading csv file
df = pd.read_csv('StudentData.csv')
  
# Here filtering the rows according to 
# Grade column which has notnull value.
df = df.loc[df['Grade'].notnull()]
  
# Displaying result
print(df)

Producción:

Como se muestra en la imagen de salida, solo se muestran las filas que tienen Grade != NaN.

Publicación traducida automáticamente

Artículo escrito por patildhanu4111999 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *