La correlación es una técnica estadística que muestra cómo se relacionan dos variables. El método pandas dataframe.corr() se utiliza para crear la array de correlación. Se utiliza para encontrar la correlación por pares de todas las columnas en el marco de datos. Cualquier valor de na se excluye automáticamente. Para cualquier columna de tipo de datos no numérico en el marco de datos, se ignora.
Para crear una array de correlación usando pandas, se deben seguir estos pasos:
- Obtener los datos.
- Cree el DataFrame usando Pandas.
- Crear array de correlación usando Pandas
Ejemplo 1:
Python3
# import pandas import pandas as pd # obtaining the data data = {'A': [45, 37, 42], 'B': [38, 31, 26], 'C': [10, 15, 17] } # creation of DataFrame df = pd.DataFrame(data) # creation of correlation matrix corrM = df.corr() corrM
Producción:
Los valores en la diagonal muestran la correlación de una variable consigo misma, por lo tanto, la diagonal muestra la correlación 1.
Ejemplo 2:
Python3
import pandas as pd data = {'A': [45, 37, 42, 50], 'B': [38, 31, 26, 90], 'C': [10, 15, 17, 100], 'D': [60, 99, 23, 56], 'E': [76, 98, 78, 90] } df = pd.DataFrame(data) corrM = df.corr() corrM
Producción:
Ejemplo 3:
Python3
import pandas as pd # Integer and string values can # never be correlated. data = {'A': [45, 37, 42, 50], 'B': ['R', 'O', 'M', 'Y'], } df = pd.DataFrame(data) corrM = df.corr() corrM
Producción:
Ejemplo 4:
Python3
import pandas as pd data = {'A': [45, 37, 42, 50], 'B': ['R', 'O', 'M', 'Y'], 'C': [56, 67, 68, 60], } df = pd.DataFrame(data) corrM = df.corr() corrM
Producción:
Publicación traducida automáticamente
Artículo escrito por romy421kumari y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA