¿Cómo contar las ocurrencias de NaN en una columna en Pandas Dataframe?

El marco de datos se divide en celdas, que pueden almacenar un valor que pertenece a alguna estructura de datos, así como también puede contener valores faltantes o NA. El paquete pandas contiene varias funciones integradas, para verificar si el valor en la celda de un marco de datos es NA o no, y también para realizar agregaciones sobre estos valores NA.

Método n.º 1: usar los métodos integrados isna() y sum() en el marco de datos.

La función isna() se usa para detectar valores faltantes/ningunos y devolver una array booleana de longitud igual al elemento del marco de datos sobre el que se aplica y el método sum() se usa para calcular un total de estos valores faltantes.

Python3

# importing necessary packages
import pandas as pd
import numpy as np
  
# creating data
data = [[1, "M", np.nan], [5, "A", 3.2], [
    np.nan, np.nan, 4.6], [1, "D", np.nan]]
  
# converting data to data frame
data_frame = pd.DataFrame(data, 
                          columns=["col1", "col2", "col3"])
  
# printing original data frame
print("\nOriginal Data Frame:")
print(data_frame)
  
# counting NaN values of col1
cnt = data_frame["col1"].isna().sum()
  
# printing count of NaN values
print("\nNan values in col1:", cnt)

Producción:

Método #2: Usar la longitud del marco de datos

El recuento de los valores contenidos en cualquier columna particular del marco de datos se resta de la longitud del marco de datos, es decir, el número de filas en el marco de datos. El método count() nos da el número total de valores NaN en una columna específica y la longitud (marco de datos) nos da la longitud del marco de datos, es decir, el número total de filas en el marco. 

Python3

# importing necessary packages
import pandas as pd
import numpy as np
  
# creating data
data = [[1, "M", np.nan], [5, "A", 3.2],
        [np.nan, np.nan, 4.6], [1, "D", np.nan]]
  
# converting data to data frame
data_frame = pd.DataFrame(data, columns=["col1", "col2", "col3"])
  
# printing original data frame
print("\nOriginal Data Frame:")
print(data_frame)
  
# counting NaN values of col1
length = len(data_frame)
count_in_col3 = data_frame['col3'].count()
cnt = length - count_in_col3
  
# printing count of NaN values
print("\nNan in col3:", cnt)

Producción:

Publicación traducida automáticamente

Artículo escrito por mallikagupta90 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *