Diagramas de dispersión en lenguaje R

Un gráfico de dispersión es un conjunto de puntos punteados para representar datos individuales en el eje horizontal y vertical. Un gráfico en el que los valores de dos variables se trazan a lo largo del eje X y el eje Y, el patrón de los puntos resultantes revela una correlación entre ellos.

R – Gráficos de dispersión

Podemos crear un diagrama de dispersión en el lenguaje de programación R usando la función plot() .

Sintaxis: plot(x, y, main, xlab, ylab, xlim, ylim, ejes)

Parámetros: 

  • x: este parámetro establece las coordenadas horizontales.
  • y: este parámetro establece las coordenadas verticales.
  • xlab: este parámetro es la etiqueta para el eje horizontal.
  • ylab: este parámetro es la etiqueta para el eje vertical.
  • main: este parámetro main es el título del gráfico.
  • xlim: este parámetro se utiliza para trazar valores de x.
  • ylim: este parámetro se utiliza para representar los valores de y.
  • ejes: este parámetro indica si ambos ejes deben dibujarse en el gráfico.

Gráfico de diagrama de dispersión simple

Para crear un gráfico de diagrama de dispersión:

  1. Utilizamos el conjunto de datos «mtcars».
  2. Utilice las columnas «wt» y «mpg» en mtcars.

Ejemplo: 

R

input <- mtcars[, c('wt', 'mpg')]
print(head(input))

Producción:

Crear un gráfico de diagrama de dispersión

Para crear un gráfico de diagrama de dispersión: 

  1. Estamos usando los parámetros requeridos para trazar el gráfico.
  2. En este ‘xlab’ describe el eje X y ‘ylab’ describe el eje Y.

Ejemplo: 

R

# Get the input values.
input <- mtcars[, c('wt', 'mpg')]
 
# Plot the chart for cars with
# weight between 1.5 to 4 and
# mileage between 10 and 25.
plot(x = input$wt, y = input$mpg,
    xlab = "Weight",
    ylab = "Milage",
    xlim = c(1.5, 4),
    ylim = c(10, 25),       
    main = "Weight vs Milage"
)

Producción: 

Arrays de diagramas de dispersión

Cuando tenemos dos o más variables y queremos correlacionar entre una variable y otras, usamos una array de diagrama de dispersión.

La función pairs() se utiliza para crear arrays de diagramas de dispersión.

Sintaxis: pares (fórmula, datos)

Parámetros: 

  • fórmula: Este parámetro representa la serie de variables utilizadas en pares.
  • data: Este parámetro representa el conjunto de datos del cual se tomarán las variables.

Ejemplo: 

R

# Plot the matrices between
# 4 variables giving 12 plots.
 
# One variable with 3 others
# and total 4 variables.
pairs(~wt + mpg + disp + cyl, data = mtcars,
    main = "Scatterplot Matrix")

Producción: 

Diagrama de dispersión con valores ajustados

Para crear un gráfico de diagrama de dispersión: 

  1. Estamos utilizando el paquete ggplot2 que proporciona la función ggplot() y geom_point() para crear un diagrama de dispersión.
  2. También estamos usando las columnas «wt» y «mpg» en mtcars.

Ejemplo: 

R

# Loading ggplot2 package
library(ggplot2)
     
# Creating scatterplot with fitted values.
# An additional function stst_smooth
# is used for linear regression.
ggplot(mtcars, aes(x = log(mpg), y = log(drat))) +
        geom_point(aes(color = factor(gear))) +
        stat_smooth(method = "lm",
        col = "#C42126", se = FALSE, size = 1
)

Producción:

Agregar título con nombre dinámico

Para crear un gráfico de diagrama de dispersión, agregue un subtítulo: 

  1. Usamos la función adicional, en ggplot agregamos el conjunto de datos «mtcars» con este agregado ‘aes’, ‘geom_point’.
  2. Utilice el Título, Leyenda, Subtítulo.

Ejemplo: 

Python3

# Loading ggplot2 package
library(ggplot2)
     
# Creating scatterplot with fitted values.
# An additional function stst_smooth
# is used for linear regression.
new_graph<-ggplot(mtcars, aes(x = log(mpg),
                              y = log(drat))) +
                    geom_point(aes(color = factor(gear))) +
                    stat_smooth(method = "lm",
                                col = "#C42126",
                    se = FALSE, size = 1)
 
# in above example lm is used for linear regression
# and se stands for standard error.
# Adding title with dynamic name
new_graph + labs(
        title = "Relation between Mile per hours and drat",
        subtitle = "Relationship break down by gear class",
        caption = "Authors own computation"
)

Producción:

Diagramas de dispersión 3D

Aquí usaremos el paquete scatterplot3D para crear diagramas de dispersión en 3D, este paquete puede trazar diagramas de dispersión en 3D usando métodos scatterplot3d().

R

# 3D Scatterplot
library(scatterplot3d)
attach(mtcars)
 
scatterplot3d(mpg, cyl, hp,
              main = "3D Scatterplot")

Producción:

Publicación traducida automáticamente

Artículo escrito por shivanisinghss2110 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *