¿Cómo colorear los puntos del diagrama de dispersión en R?

Un gráfico de dispersión es un conjunto de puntos punteados para representar datos individuales en el eje horizontal y vertical. Pero por defecto, el color de estos puntos es negro y, a veces, puede ser necesario cambiar el color de estos puntos. 

En este artículo, discutiremos cómo cambiar el color de los puntos en el diagrama de dispersión en el lenguaje de programación R.

Método 1: Usar plot()

El diagrama de dispersión simple se crea utilizando la función plot() .

Sintaxis: plot(x, y, main, xlab, ylab, xlim, ylim, ejes)

Primero creemos un diagrama de dispersión sin ningún color para que la diferencia sea evidente.

Ejemplo:

R

df<-read.csv("bestsellers.csv")
  
plot(df$Reviews,df$Price,pch=16)

Producción:

Ahora, para cambiar los colores de un diagrama de dispersión usando plot(), simplemente seleccione la columna en base a la cual se deben asignar diferentes colores a varios puntos. Pase la columna que ayudará a diferenciar entre puntos al atributo «col».

Ejemplo:

R

df<-read.csv("bestsellers.csv")
  
plot(df$Reviews,df$Price,pch=16,col=df$Genre)

Producción:

Método 2: Usar ggplot

El módulo ggplot2 admite la función geom_point() que puede ayudar a trazar un diagrama de dispersión. Veamos primero cómo aparecerá un diagrama de dispersión sin proporcionar ningún mecanismo para cambiar los colores.

Ejemplo:

R

library("ggplot2")
  
df<-read.csv("bestsellers.csv")
  
ggplot(df,aes(x=Reviews,y=Price))+geom_point()

Producción:

Al usar ggplot, hay varias formas de agregar colores a un diagrama de dispersión. Analicemos primero cómo se cambian los colores de forma predeterminada. Para ello basta con pasar la columna diferenciadora al atributo col.

Ejemplo:

R

library("ggplot2")
  
df<-read.csv("bestsellers.csv")
  
ggplot(df,aes(x=Reviews,y=Price,col=Genre))+geom_point()

Producción:

Otra forma de producir el mismo resultado es proporcionar la columna de agrupación para agrupar el atributo y nuevamente para colorear en geom_point() 

Ejemplo:

R

library("ggplot2")
  
df<-read.csv("bestsellers.csv")
  
ggplot(df,aes(x=Reviews,y=Price,group=Genre))+
   geom_point(aes(color=Genre))

Producción:

También podemos agregar colores personalizados usando la función scale_color_manual() con la lista de colores para elegir.

Ejemplo

R

library("ggplot2")
  
df<-read.csv("bestsellers.csv")
  
ggplot(df,aes(x=Reviews,y=Price,group=Genre))+
   geom_point(aes(color=Genre))+
   scale_color_manual(values=c('Yellow','Green'))

Producción:

Un diagrama de dispersión también puede mostrar colores solo desde la escala de grises, para esto use la función scale_color_grey().

Ejemplo:

R

library("ggplot2")
  
df<-read.csv("bestsellers.csv")
  
ggplot(df,aes(x=Reviews,y=Price,group=Genre))+
   geom_point(aes(color=Genre))+
   scale_color_grey()

Producción:

La función scale_color_brewer() también es un método para agregar colores a un diagrama de dispersión. Esta función toma el nombre de la paleta de la que elegir los colores.

Ejemplo:

R

library("ggplot2")
  
df<-read.csv("bestsellers.csv")
  
ggplot(df,aes(x=Reviews,y=Price,group=Genre))+
  geom_point(aes(color=Genre))+
  scale_color_brewer(palette="Accent")

Producción:

Publicación traducida automáticamente

Artículo escrito por vanshikagoyal43 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *