Dora es una biblioteca diseñada para simplificar el análisis exploratorio de datos, que es una parte tan dolorosa. Automatiza las tareas repetitivas que consumen la mayor parte del tiempo.
La biblioteca tiene funciones que son muy convenientes para la limpieza de datos, visualización, extracción y selección de características, visualización. Aparte de esto, también se utiliza para la validación de modelos mediante la partición de datos y las transformaciones de datos.
Esta biblioteca usa scikit-learn , pandas y matplotlib . La intención de esta biblioteca es agregar funciones adicionales a la biblioteca general mencionada anteriormente para el análisis exploratorio de datos.
Instalación:
pip install Dora
Uso:
Para implementarlo en conjuntos de datos, use la siguiente sintaxis:
Python3
from Dora import Dora
Se puede utilizar para:
- Lectura de datos y configuración
- Limpieza
- Selección y extracción de características
- Visualización
- Modelo de validación
- Control de versiones de datos
A continuación se muestra la implementación más básica del módulo Dora en un conjunto de datos en Python:
Python
# Import required module from Dora import Dora # Create object dora = Dora() # Add dataset path as argument dora.configure(output = 'A', data = 'data.csv') # Display dataset dora.data
Producción: