Cuando hables de análisis de datos, ¡no olvides la visualización de datos! Es una parte muy importante del análisis de datos que puede revelar tendencias ocultas y proporcionar más información sobre los datos. La visualización de datos puede proporcionar información con solo mirarlos, mientras que tomaría mucho más tiempo obtener esa misma información de hojas de cálculo o informes de texto. Y es por eso que la visualización de datos es tan popular. Y en este artículo, discutiremos las principales bibliotecas R para visualización de datos.
Dado que R es uno de los lenguajes de programación más populares en el análisis de datos, no sorprende que haya muchas bibliotecas R para la visualización de datos. ¡Estas bibliotecas son tan populares porque permiten a los analistas de datos crear fácilmente las visualizaciones que desean a partir de sus datos al proporcionar convenientemente tanto la interfaz como las herramientas en un solo lugar! Entonces, lo único importante es saber qué quiere transmitir la visualización a los usuarios y crearlo utilizando todas las herramientas disponibles. ¿Qué más podría querer un analista de datos?
Entonces, echemos un vistazo a algunas de estas bibliotecas R principales para la visualización de datos que se usan comúnmente en estos días.
1. ggplot2
ggplot2 es una biblioteca de visualización de datos R que se basa en The Grammar of Graphics. ggplot2 puede crear visualizaciones de datos como gráficos de barras, gráficos circulares, histogramas, diagramas de dispersión, gráficos de error, etc. utilizando una API de alto nivel. También le permite agregar diferentes tipos de componentes o capas de visualización de datos en una sola visualización. Una vez que se le ha dicho a ggplot2 qué variables asignar a qué estética en la trama, hace el resto del trabajo para que el usuario pueda concentrarse en interpretar las visualizaciones y dedicar menos tiempo a crearlas. Pero esto también significa que no es posible crear gráficos altamente personalizados en ggplot2. Pero hay muchos recursos en la comunidad RStudio y Stack Overflow que pueden brindar ayuda en ggplot2 cuando sea necesario. Al igual que dplyr, si desea instalar ggplot2, puede instalar eltidyverse o simplemente puede instalar ggplot2 usando install.packages («ggplot2»)
2. trama
Plotly es una biblioteca gráfica gratuita de código abierto que se puede utilizar para formar visualizaciones de datos. Plotly es un paquete R que se basa en la biblioteca Plotly JavaScript (plotly.js) y se puede usar para crear visualizaciones de datos basadas en la web que se pueden mostrar en cuadernos Jupyter o aplicaciones web usando Dash o guardar como archivos HTML individuales. Plotly proporciona más de 40 tipos de gráficos únicos, como gráficos de dispersión, histogramas, gráficos de líneas, gráficos de barras, gráficos circulares, barras de error, diagramas de caja, ejes múltiples, minigráficos, dendrogramas, gráficos en 3D, etc. Plotly también proporciona gráficos de contorno, que no son tan comunes en otras bibliotecas de visualización de datos. Además de todo esto, Plotly se puede usar sin conexión sin conexión a Internet. Puede instalar Plotly desde CRAN usando install.packages(‘plotly’) o instalar la última versión de desarrollo desde GitHub usando devtools:
3. Esquisse
Esquisse es una herramienta de visualización de datos en R que le permite crear visualizaciones de datos detalladas utilizando el paquete ggplot2. Puede crear todo tipo de diagramas de dispersión, histogramas, gráficos de líneas, gráficos de barras, gráficos circulares, barras de error, diagramas de caja, ejes múltiples, minigráficos, dendrogramas, gráficos en 3D, etc. usando Esquisse y también exportar estos gráficos o acceder a la código para crear estos gráficos. Esquisse es una herramienta de visualización de datos tan famosa y fácil de usar debido a su capacidad de arrastrar y soltar que la hace popular incluso entre los principiantes. Puede instalar Esquisse desde CRAN usando install.packages («esquisse») o instalar la versión de desarrollo desde GitHub usando remotes::install_github («dreamRs/esquisse»).
4. Enrejado
Lattice es una herramienta de visualización de datos que se usa principalmente para implementar gráficos de Trellis en R. Estos gráficos de Trellis se usan para ver muchos conjuntos de datos complicados y de múltiples variables al mismo tiempo para poder compararlos. Dado que todos estos gráficos diferentes terminan pareciéndose a un Trellis, esto se llama un gráfico de Trellis. Dado que Lattice es una biblioteca de visualización de datos de alto nivel, puede manejar muchos de los gráficos típicos sin necesidad de muchas personalizaciones. En caso de querer ampliar las capacidades de Lattice, pueden descargar el paquete LatticeExtra que es una versión extendida. Puede instalar Lattice desde CRAN usando install.packages («lattice») o instalar la versión de desarrollo desde GitHub usando remotes::install_github («deepayan/lattice»).
5. RGL
El paquete RGL en R se creó específicamente para realizar visualizaciones de datos en 3D y gráficos de datos. Tiene muchos comandos de gráficos que funcionan en 3 dimensiones, pero está modelado libremente a partir de los gráficos 2D clásicos en R. RGL también está inspirado en el paquete de cuadrícula en R, pero es incompatible con él. Sin embargo, los codificadores de R experimentados pueden usar fácilmente RGL debido a la familiaridad existente con la cuadrícula. ¡Y RGL es genial! Tiene muchas opciones para formas 3-D, varios efectos de iluminación, creación de nuevas formas y también animaciones. Puede instalar RGL desde CRAN usando install.packages («rgl»).
6. Gráficos
El paquete dygraphs es una interfaz R para la biblioteca de gráficos de JavaScript dygraphs que se utiliza para proporcionar varios gráficos para visualizar conjuntos de datos. Este paquete se puede usar para crear varias visualizaciones interactivas con opciones de zoom y desplazamiento junto con etiquetas predeterminadas para pasar el mouse. dygraphs también brinda soporte para varias superposiciones de gráficos, como anotaciones de puntos, regiones sombreadas, líneas de eventos, etc. También puede trazar los objetos de la serie temporal xts automáticamente. Sin embargo, todas estas características no se obtienen a expensas de la velocidad en dygraph. Más bien, puede proporcionar la máxima interactividad incluso con millones de puntos de datos en la visualización. Puede instalar RGL desde CRAN usando install.packages («dygraphs»).
7. Folleto
Al igual que Dygraphs, el paquete Leaflet es una interfaz R para la biblioteca de JavaScript Leaflet que es extremadamente popular. Leaflet es muy útil para crear mapas interactivos pero livianos que se ven en varios sitios web, como el Washington Post, el New York Times, etc. combine polígonos, líneas, ventanas emergentes, etc. para crear gráficos, incrustar mapas en knitr, crear mapas en proyecciones Mercator que no son esféricas, etc. El paquete Leaflet se puede usar en la consola R después de instalarlo desde CRAN usando el comando install.packages («folleto»).
Todas estas bibliotecas R para visualización de datos son excelentes opciones si desea crear visualizaciones de datos. Cada una de estas bibliotecas tiene sus puntos fuertes y puede elegir la mejor según el tipo de visualización o proyecto de ciencia de datos que desee crear. Ahora que conoce estas bibliotecas, continúe y cree visualizaciones de datos hermosas pero informativas usándolas.
Publicación traducida automáticamente
Artículo escrito por harkiran78 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA