NaN significa Not A Number y es una de las formas comunes de representar el valor que falta en los datos. Es un valor de punto flotante especial y no se puede convertir a ningún otro tipo que no sea flotante. El valor de NaN es uno de los principales problemas en el análisis de datos. Es muy esencial tratar con NaN para obtener los resultados deseados.
Las formas de verificar NaN en Pandas DataFrame son las siguientes:
- Verifique NaN en una sola columna de DataFrame:
- Cuente el NaN en una sola columna de DataFrame:
- Verifique NaN en todo el marco de datos:
- Cuente el NaN en todo el DataFrame:
Método 1: Usar el método isnull().values.any()
Ejemplo:
Python3
# importing libraries import pandas as pd import numpy as np num = {'Integers': [10, 15, 30, 40, 55, np.nan, 75, np.nan, 90, 150, np.nan]} # Create the dataframe df = pd.DataFrame(num, columns=['Integers']) # Applying the method check_nan = df['Integers'].isnull().values.any() # printing the result print(check_nan)
Producción:
También es posible obtener las posiciones exactas donde están presentes los valores de NaN. Podemos hacerlo eliminando .values.any() de isnull().values.any() .
Python3
check_nan = df['Integers'].isnull()
Producción:
Método 2: Uso de isnull().sum()
Ejemplo de método:
Python3
# importing libraries import pandas as pd import numpy as np num = {'Integers': [10, 15, 30, 40, 55, np.nan, 75, np.nan, 90, 150, np.nan]} # Create the dataframe df = pd.DataFrame(num, columns=['Integers']) # applying the method count_nan = df['Integers'].isnull().sum() # printing the number of values present # in the column print('Number of NaN values present: ' + str(count_nan))
Producción:
Método 3: Usar el método isnull().values.any()
Ejemplo:
Python3
# importing libraries import pandas as pd import numpy as np nums = {'Integers_1': [10, 15, 30, 40, 55, np.nan, 75, np.nan, 90, 150, np.nan], 'Integers_2': [np.nan, 21, 22, 23, np.nan, 24, 25, np.nan, 26, np.nan, np.nan]} # Create the dataframe df = pd.DataFrame(nums, columns=['Integers_1', 'Integers_2']) # applying the method nan_in_df = df.isnull().values.any() # Print the dataframe print(nan_in_df)
Producción:
Para obtener las posiciones exactas donde están presentes los valores de NaN, podemos hacerlo eliminando .values.any() de isnull().values.any() .
Método 4: Uso de isnull().sum().sum()
Ejemplo de método:
Python3
# importing libraries import pandas as pd import numpy as np nums = {'Integers_1': [10, 15, 30, 40, 55, np.nan, 75, np.nan, 90, 150, np.nan], 'Integers_2': [np.nan, 21, 22, 23, np.nan, 24, 25, np.nan, 26, np.nan, np.nan]} # Create the dataframe df = pd.DataFrame(nums, columns=['Integers_1', 'Integers_2']) # applying the method nan_in_df = df.isnull().sum().sum() # printing the number of values present in # the whole dataframe print('Number of NaN values present: ' + str(nan_in_df))
Producción:
Publicación traducida automáticamente
Artículo escrito por shardul_singh_tomar y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA