Crear diagrama de dispersión de CSV en R

En el lenguaje de programación R usamos la función plot() para mostrar el diagrama de dispersión. Toma ocho parámetros.

Sintaxis: plot(x, y, main, xlab, ylab, xlim, ylim, ejes)

Parámetros:

  • x: establece la variable que se utilizará para las coordenadas horizontales.
  • y: establece la variable que se utilizará para las coordenadas verticales.
  • xlab: etiqueta para el eje horizontal.
  • ylab: etiqueta para el eje vertical.
  • main: título del gráfico.
  • xlim: límites de x para graficar valores de x.
  • ylim: límites de y para graficar valores de y.
  • ejes: indica si se deben dibujar ambos ejes en el gráfico.

Para establecer los atributos del diagrama de dispersión, como el color y la forma de los puntos del diagrama de dispersión, usamos el atributo «col» para establecer el color del diagrama de dispersión y para establecer la forma usamos «pch», donde pch toma valores numéricos entre 0 y 25.

Creación de marco de datos:

Aquí vamos a crear un marco de datos a partir de este conjunto de datos . Usamos read.csv() para leer el archivo csv y almacenar esos datos en una variable.

R

csv_data<-read.csv("diamonds.csv")
print(csv_data)

Producción:

Ejemplo 1: En este ejemplo, creamos un diagrama de dispersión simple, donde x se establece en quilates e y se establece en precio. Etiquetamos la trama como Precio frente a quilates.

Sintaxis: plot(x, y, main, xlab, ylab, col, pch) 

Donde x son datos de quilates, y son datos de precios, xlab es la etiqueta para x como «Carat» e ylab es la etiqueta para y como «Precio». 

R

plot(x = csv_data$carat,
     y = csv_data$price,
     xlab = "Carat",
     ylab = "Price",
     main = "Price vs Carat")

Producción:

Ejemplo 2: En este ejemplo tratamos de establecer atributos del gráfico de dispersión como el color y la forma de los puntos del gráfico de dispersión. Establecemos el valor de pch en 4, donde el valor 4 se representa como «x» y el color se establece en verde.

R

plot(x = csv_data$carat,
     y = csv_data$price,
     xlab = "Carat",
     ylab = "Price",
     col = "green",
     pch = 4,
     main = "Price vs Carat")

Producción:

Ejemplo 3: También podemos agregar una línea de regresión a nuestro diagrama de dispersión usando la función abline(). Pasamos 2 parámetros en los que primero pasamos la función lm() (la función lm() se usa para ajustar modelos lineales). Donde especificamos x e y de nuestro conjunto de datos y el nombre de nuestros datos y el segundo parámetro es el color de la línea. .

R

plot(x = csv_data$carat,
     y = csv_data$price,
     xlab = "Carat",
     ylab = "Price",
     col = "green",
     pch = 4,
     main = "Price vs Carat")
 
abline(lm(csv_data$price ~ csv_data$carat,
          data = csv_data), col = "black")

Producción:

Publicación traducida automáticamente

Artículo escrito por devangj9689 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *