El lenguaje R se usa principalmente con fines estadísticos y de análisis de datos para representar los datos gráficamente en el software. Para representar esos datos gráficamente, se utilizan tablas y gráficos en R.
R-gráficos
Hay cientos de cuadros y gráficos presentes en R. Por ejemplo, gráfico de barras, gráfico de caja, gráfico de mosaico, gráfico de puntos, coplot, histograma, gráfico circular, gráfico de dispersión, etc.
Tipos de R – Gráficos
- Diagrama de barras o gráfico de barras
- Diagrama circular o gráfico circular
- Histograma
- Gráfico de dispersión
- diagrama de caja
Diagrama de barras o gráfico de barras
El gráfico de barras o gráfico de barras en R se utiliza para representar los valores en el vector de datos como la altura de las barras. El vector de datos pasado a la función se representa sobre el eje y del gráfico. El gráfico de barras puede comportarse como un histograma usando la función table() en lugar del vector de datos.
Sintaxis: gráfico de barras (datos, xlab, ylab)
dónde:
- data es el vector de datos que se representará en el eje y
- xlab es la etiqueta dada al eje x
- ylab es la etiqueta dada al eje y
Nota: Para conocer más parámetros opcionales en la función barplot() , use el siguiente comando en la consola R:
help("barplot")
Ejemplo:
R
# defining vector x <- c(7, 15, 23, 12, 44, 56, 32) # output to be present as PNG file png(file = "barplot.png") # plotting vector barplot(x, xlab = "GeeksforGeeks Audience", ylab = "Count", col = "white", col.axis = "darkgreen", col.lab = "darkgreen") # saving the file dev.off()
Producción:
Diagrama circular o gráfico circular
El gráfico circular es un gráfico circular dividido en diferentes segmentos según la proporción de datos proporcionados. El valor total del pastel es 100 y los segmentos indican la fracción del pastel completo. Es otro método para representar datos estadísticos en forma gráfica y la función pie() se usa para realizar lo mismo.
Sintaxis: pie(x, etiquetas, columna, principal, radio)
dónde,
- x es un vector de datos
- etiquetas muestra los nombres dados a las porciones
- col llena el color en las rebanadas como parámetro dado
- principal muestra el nombre del título del gráfico circular
- radio indica el radio del gráfico circular. Puede estar entre -1 y +1
Nota: Para conocer más parámetros opcionales en la función pie() , use el siguiente comando en la consola R:
help("pie")
Ejemplo:
Suponga que el vector x indica la cantidad de artículos presentes en el portal GeeksforGeeks en las categorías nombres (x)
R
# defining vector x with number of articles x <- c(210, 450, 250, 100, 50, 90) # defining labels for each value in x names(x) <- c("Algo", "DS", "Java", "C", "C++", "Python") # output to be present as PNG file png(file = "piechart.png") # creating pie chart pie(x, labels = names(x), col = "white", main = "Articles on GeeksforGeeks", radius = -1, col.main = "darkgreen") # saving the file dev.off()
Producción:
El gráfico circular en 3D también se puede crear en R usando la siguiente sintaxis, pero requiere la biblioteca plotrix .
Sintaxis: pie3D(x, etiquetas, radio, principal)
Nota: Para conocer más parámetros opcionales en la función pie3D(), use el siguiente comando en la consola R:
help("pie3D")
Ejemplo:
R
# importing library plotrix for pie3D() library(plotrix) # defining vector x with number of articles x <- c(210, 450, 250, 100, 50, 90) # defining labels for each value in x names(x) <- c("Algo", "DS", "Java", "C", "C++", "Python") # output to be present as PNG file png(file = "piechart3d.png") # creating pie chart pie3D(x, labels = names(x), col = "white", main = "Articles on GeeksforGeeks", labelcol = "darkgreen", col.main = "darkgreen") # saving the file dev.off()
Producción:
Histograma
El histograma es una representación gráfica utilizada para crear un gráfico con barras que representan la frecuencia de los datos agrupados en un vector. El histograma es lo mismo que el gráfico de barras, pero la única diferencia entre ellos es que el histograma representa la frecuencia de los datos agrupados en lugar de los datos en sí.
Sintaxis: hist(x, col, border, main, xlab, ylab)
dónde:
- x es un vector de datos
- col especifica el color de las barras a rellenar
- borde especifica el color del borde de las barras
- main especifica el nombre del título del histograma
- xlab especifica la etiqueta del eje x
- ylab especifica la etiqueta del eje y
Nota: Para conocer más parámetros opcionales en la función hist() , use el siguiente comando en la consola R:
help("hist")
Ejemplo:
R
# defining vector x <- c(21, 23, 56, 90, 20, 7, 94, 12, 57, 76, 69, 45, 34, 32, 49, 55, 57) # output to be present as PNG file png(file = "hist.png") # hist(x, main = "Histogram of Vector x", xlab = "Values", col.lab = "darkgreen", col.main = "darkgreen") # saving the file dev.off()
Producción:
Gráfico de dispersión
Un diagrama de dispersión es otro tipo de representación gráfica utilizada para trazar los puntos para mostrar la relación entre dos vectores de datos. Uno de los vectores de datos se representa en el eje x y otro en el eje y.
Sintaxis: plot(x, y, type, xlab, ylab, main)
Dónde,
- x es el vector de datos representado en el eje x
- y es el vector de datos representado en el eje y
- tipo especifica el tipo de gráfico que se va a dibujar. Por ejemplo, “l” para líneas, “p” para puntos, “s” para escalones, etc.
- xlab especifica la etiqueta para el eje x
- ylab especifica la etiqueta para el eje y
- main especifica el nombre del título del gráfico
Nota: Para conocer más parámetros opcionales en la función plot() , use el siguiente comando en la consola R:
help("plot")
Ejemplo:
R
# taking input from dataset Orange already # present in R orange <- Orange[, c('age', 'circumference')] # output to be present as PNG file png(file = "plot.png") # plotting plot(x = orange$age, y = orange$circumference, xlab = "Age", ylab = "Circumference", main = "Age VS Circumference", col.lab = "darkgreen", col.main = "darkgreen", col.axis = "darkgreen") # saving the file dev.off()
Producción:
Si se debe dibujar un gráfico de dispersión para mostrar la relación entre 2 o más vectores o para trazar la array del gráfico de dispersión entre los vectores, entonces se utiliza la función pairs() para satisfacer los criterios.
Sintaxis: pares (~ fórmula, datos)
dónde,
- ~formula es la fórmula matemática como ~a+b+c
- data es el formulario del conjunto de datos donde los datos se toman en la fórmula
Nota: Para conocer más parámetros opcionales en la función pairs(), use el siguiente comando en la consola R:
help("pairs")
Ejemplo :
R
# output to be present as PNG file png(file = "plotmatrix.png") # plotting scatterplot matrix # using dataset Orange pairs(~age + circumference, data = Orange, col.axis = "darkgreen") # saving the file dev.off()
Producción:
diagrama de caja
El diagrama de caja muestra cómo se distribuyen los datos en el vector de datos. Representa cinco valores en el gráfico, es decir, mínimo, primer cuartil, segundo cuartil (mediana), tercer cuartil, el valor máximo del vector de datos.
Sintaxis: boxplot(x, xlab, ylab, muesca)
dónde,
- x especifica el vector de datos
- xlab especifica la etiqueta para el eje x
- ylab especifica la etiqueta para el eje y
- muesca, si es VERDADERO entonces crea una muesca en ambos lados de la caja
Nota: Para conocer más parámetros opcionales en la función boxplot() , use el siguiente comando en la consola R:
help("boxplot")
Ejemplo:
R
# defining vector with ages of employees x <- c(42, 21, 22, 24, 25, 30, 29, 22, 23, 23, 24, 28, 32, 45, 39, 40) # output to be present as PNG file png(file = "boxplot.png") # plotting boxplot(x, xlab = "Box Plot", ylab = "Age", col.axis = "darkgreen", col.lab = "darkgreen") # saving the file dev.off()
Producción:
Publicación traducida automáticamente
Artículo escrito por utkarsh_kumar y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA