Un conjunto de datos puede contener varios tipos de valores, a veces consiste en valores categóricos. Entonces, para usar esos valores categóricos para programar de manera eficiente, creamos variables ficticias. Una variable ficticia es una variable binaria que indica si una variable categórica separada toma un valor específico.
Explicación:
Como puede ver, se crean tres variables ficticias para los tres valores categóricos del atributo de temperatura. Podemos crear variables ficticias en python usando el método get_dummies() .
Sintaxis: pandas.get_dummies(datos, prefijo=Ninguno, prefijo_sep=’_’,)
Parámetros:
- datos = datos de entrada, es decir, incluye el marco de datos de pandas. lista . establecer . arrays numpy, etc.
- prefijo= valor inicial
- prefix_sep= Separación de valores de datos.
Tipo de devolución: variables ficticias.
Enfoque paso a paso:
- Importar módulos necesarios
- Considere los datos
- Realice operaciones en los datos para obtener dummies
Ejemplo 1:
Python3
# import required modules import pandas as pd import numpy as np # create dataset df = pd.DataFrame({'Temperature': ['Hot', 'Cold', 'Warm', 'Cold'], }) # display dataset print(df) # create dummy variables pd.get_dummies(df)
Producción:
Ejemplo 2:
Considere las arrays de listas para obtener maniquíes
Python3
# import required modules import pandas as pd import numpy as np # create dataset s = pd.Series(list('abca')) # display dataset print(s) # create dummy variables pd.get_dummies(s)
Producción:
Ejemplo 3:
Aquí hay otro ejemplo, para obtener variables ficticias.
Python3
# import required modules import pandas as pd import numpy as np # create dataset df = pd.DataFrame({'A': ['hello', 'vignan', 'geeks'], 'B': ['vignan', 'hello', 'hello'], 'C': [1, 2, 3]}) # display dataset print(df) # create dummy variables pd.get_dummies(df)
Producción:
Publicación traducida automáticamente
Artículo escrito por vivekahimamsh y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA