El marco de datos se divide en celdas, que pueden almacenar un valor que pertenece a alguna estructura de datos, así como también puede contener valores faltantes o NA. El paquete pandas contiene varias funciones integradas, para verificar si el valor en la celda de un marco de datos es NA o no, y también para realizar agregaciones sobre estos valores NA.
Método n.º 1: usar los métodos integrados isna() y sum() en el marco de datos.
La función isna() se usa para detectar valores faltantes/ningunos y devolver una array booleana de longitud igual al elemento del marco de datos sobre el que se aplica y el método sum() se usa para calcular un total de estos valores faltantes.
Python3
# importing necessary packages import pandas as pd import numpy as np # creating data data = [[1, "M", np.nan], [5, "A", 3.2], [ np.nan, np.nan, 4.6], [1, "D", np.nan]] # converting data to data frame data_frame = pd.DataFrame(data, columns=["col1", "col2", "col3"]) # printing original data frame print("\nOriginal Data Frame:") print(data_frame) # counting NaN values of col1 cnt = data_frame["col1"].isna().sum() # printing count of NaN values print("\nNan values in col1:", cnt)
Producción:
Método #2: Usar la longitud del marco de datos
El recuento de los valores contenidos en cualquier columna particular del marco de datos se resta de la longitud del marco de datos, es decir, el número de filas en el marco de datos. El método count() nos da el número total de valores NaN en una columna específica y la longitud (marco de datos) nos da la longitud del marco de datos, es decir, el número total de filas en el marco.
Python3
# importing necessary packages import pandas as pd import numpy as np # creating data data = [[1, "M", np.nan], [5, "A", 3.2], [np.nan, np.nan, 4.6], [1, "D", np.nan]] # converting data to data frame data_frame = pd.DataFrame(data, columns=["col1", "col2", "col3"]) # printing original data frame print("\nOriginal Data Frame:") print(data_frame) # counting NaN values of col1 length = len(data_frame) count_in_col3 = data_frame['col3'].count() cnt = length - count_in_col3 # printing count of NaN values print("\nNan in col3:", cnt)
Producción:
Publicación traducida automáticamente
Artículo escrito por mallikagupta90 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA