Un gráfico de dispersión es un conjunto de puntos punteados para representar datos individuales en el eje horizontal y vertical. Un gráfico en el que los valores de dos variables se trazan a lo largo del eje X y el eje Y, el patrón de los puntos resultantes revela una correlación entre ellos.
R – Gráficos de dispersión
Podemos crear un diagrama de dispersión en el lenguaje de programación R usando la función plot() .
Sintaxis: plot(x, y, main, xlab, ylab, xlim, ylim, ejes)
Parámetros:
- x: este parámetro establece las coordenadas horizontales.
- y: este parámetro establece las coordenadas verticales.
- xlab: este parámetro es la etiqueta para el eje horizontal.
- ylab: este parámetro es la etiqueta para el eje vertical.
- main: este parámetro main es el título del gráfico.
- xlim: este parámetro se utiliza para trazar valores de x.
- ylim: este parámetro se utiliza para representar los valores de y.
- ejes: este parámetro indica si ambos ejes deben dibujarse en el gráfico.
Gráfico de diagrama de dispersión simple
Para crear un gráfico de diagrama de dispersión:
- Utilizamos el conjunto de datos «mtcars».
- Utilice las columnas «wt» y «mpg» en mtcars.
Ejemplo:
R
input <- mtcars[, c('wt', 'mpg')] print(head(input))
Producción:
Crear un gráfico de diagrama de dispersión
Para crear un gráfico de diagrama de dispersión:
- Estamos usando los parámetros requeridos para trazar el gráfico.
- En este ‘xlab’ describe el eje X y ‘ylab’ describe el eje Y.
Ejemplo:
R
# Get the input values. input <- mtcars[, c('wt', 'mpg')] # Plot the chart for cars with # weight between 1.5 to 4 and # mileage between 10 and 25. plot(x = input$wt, y = input$mpg, xlab = "Weight", ylab = "Milage", xlim = c(1.5, 4), ylim = c(10, 25), main = "Weight vs Milage" )
Producción:
Arrays de diagramas de dispersión
Cuando tenemos dos o más variables y queremos correlacionar entre una variable y otras, usamos una array de diagrama de dispersión.
La función pairs() se utiliza para crear arrays de diagramas de dispersión.
Sintaxis: pares (fórmula, datos)
Parámetros:
- fórmula: Este parámetro representa la serie de variables utilizadas en pares.
- data: Este parámetro representa el conjunto de datos del cual se tomarán las variables.
Ejemplo:
R
# Plot the matrices between # 4 variables giving 12 plots. # One variable with 3 others # and total 4 variables. pairs(~wt + mpg + disp + cyl, data = mtcars, main = "Scatterplot Matrix")
Producción:
Diagrama de dispersión con valores ajustados
Para crear un gráfico de diagrama de dispersión:
- Estamos utilizando el paquete ggplot2 que proporciona la función ggplot() y geom_point() para crear un diagrama de dispersión.
- También estamos usando las columnas «wt» y «mpg» en mtcars.
Ejemplo:
R
# Loading ggplot2 package library(ggplot2) # Creating scatterplot with fitted values. # An additional function stst_smooth # is used for linear regression. ggplot(mtcars, aes(x = log(mpg), y = log(drat))) + geom_point(aes(color = factor(gear))) + stat_smooth(method = "lm", col = "#C42126", se = FALSE, size = 1 )
Producción:
Agregar título con nombre dinámico
Para crear un gráfico de diagrama de dispersión, agregue un subtítulo:
- Usamos la función adicional, en ggplot agregamos el conjunto de datos «mtcars» con este agregado ‘aes’, ‘geom_point’.
- Utilice el Título, Leyenda, Subtítulo.
Ejemplo:
Python3
# Loading ggplot2 package library(ggplot2) # Creating scatterplot with fitted values. # An additional function stst_smooth # is used for linear regression. new_graph<-ggplot(mtcars, aes(x = log(mpg), y = log(drat))) + geom_point(aes(color = factor(gear))) + stat_smooth(method = "lm", col = "#C42126", se = FALSE, size = 1) # in above example lm is used for linear regression # and se stands for standard error. # Adding title with dynamic name new_graph + labs( title = "Relation between Mile per hours and drat", subtitle = "Relationship break down by gear class", caption = "Authors own computation" )
Producción:
Diagramas de dispersión 3D
Aquí usaremos el paquete scatterplot3D para crear diagramas de dispersión en 3D, este paquete puede trazar diagramas de dispersión en 3D usando métodos scatterplot3d().
R
# 3D Scatterplot library(scatterplot3d) attach(mtcars) scatterplot3d(mpg, cyl, hp, main = "3D Scatterplot")
Producción:
Publicación traducida automáticamente
Artículo escrito por shivanisinghss2110 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA