Buscar NaN en Pandas DataFrame

NaN significa Not A Number y es una de las formas comunes de representar el valor que falta en los datos. Es un valor de punto flotante especial y no se puede convertir a ningún otro tipo que no sea flotante. El valor de NaN es uno de los principales problemas en el análisis de datos. Es muy esencial tratar con NaN para obtener los resultados deseados.
 

img

Las formas de verificar NaN en Pandas DataFrame son las siguientes: 

  • Verifique NaN en una sola columna de DataFrame:
  • Cuente el NaN en una sola columna de DataFrame:
  • Verifique NaN en todo el marco de datos:
  • Cuente el NaN en todo el DataFrame:

Método 1: Usar el método isnull().values.any()
Ejemplo: 

Python3

# importing libraries
import pandas as pd
import numpy as np
  
  
num = {'Integers': [10, 15, 30, 40, 55, np.nan,
                    75, np.nan, 90, 150, np.nan]}
  
# Create the dataframe
df = pd.DataFrame(num, columns=['Integers'])
  
# Applying the method
check_nan = df['Integers'].isnull().values.any()
  
# printing the result
print(check_nan)

Producción: 

img

También es posible obtener las posiciones exactas donde están presentes los valores de NaN. Podemos hacerlo eliminando .values.any() de isnull().values.any() . 

Python3

check_nan = df['Integers'].isnull()

Producción: 

img

Método 2: Uso de isnull().sum()
Ejemplo de método: 

Python3

# importing libraries
import pandas as pd
import numpy as np
  
  
num = {'Integers': [10, 15, 30, 40, 55, np.nan,
                    75, np.nan, 90, 150, np.nan]}
  
# Create the dataframe
df = pd.DataFrame(num, columns=['Integers'])
  
# applying the method
count_nan = df['Integers'].isnull().sum()
  
# printing the number of values present
# in the column
print('Number of NaN values present: ' + str(count_nan))

Producción:

img

Método 3: Usar el método isnull().values.any()

Ejemplo: 

Python3

# importing libraries
import pandas as pd
import numpy as np
  
nums = {'Integers_1': [10, 15, 30, 40, 55, np.nan, 75,
                       np.nan, 90, 150, np.nan],
        'Integers_2': [np.nan, 21, 22, 23, np.nan, 24, 25,
                       np.nan, 26, np.nan, np.nan]}
  
# Create the dataframe
df = pd.DataFrame(nums, columns=['Integers_1', 'Integers_2'])
  
# applying the method
nan_in_df = df.isnull().values.any()
  
# Print the dataframe
print(nan_in_df)

Producción: 

img

Para obtener las posiciones exactas donde están presentes los valores de NaN, podemos hacerlo eliminando .values.any() de isnull().values.any() . 

Método 4: Uso de isnull().sum().sum()
Ejemplo de método: 

Python3

# importing libraries
import pandas as pd
import numpy as np
  
nums = {'Integers_1': [10, 15, 30, 40, 55, np.nan, 75,
                       np.nan, 90, 150, np.nan],
        'Integers_2': [np.nan, 21, 22, 23, np.nan, 24, 25,
                       np.nan, 26, np.nan, np.nan]}
  
# Create the dataframe
df = pd.DataFrame(nums, columns=['Integers_1', 'Integers_2'])
  
# applying the method
nan_in_df = df.isnull().sum().sum()
  
# printing the number of values present in
# the whole dataframe
print('Number of NaN values present: ' + str(nan_in_df))

Producción:

img

Publicación traducida automáticamente

Artículo escrito por shardul_singh_tomar y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *