¿Eres un completo principiante en el amplio espectro de Machine Learning? ¿Está dividido entre R, Python, GNU Octave y todos los demás lenguajes y marcos de programación de computadoras disponibles para el aprendizaje automático? ¿Simplemente no ‘entiendes’ la codificación?
¡No te preocupes, estás en el lugar correcto! El aprendizaje automático puede ser un hueso duro de roer, especialmente si uno no tiene experiencia previa en programación. Por ejemplo, los aficionados al aprendizaje automático que usan Python están familiarizados con los tipos de datos básicos, las definiciones de funciones y las llamadas, los módulos y bibliotecas populares como NumPy y Pandas, y las operaciones fundamentales para limpiar y visualizar datos, por nombrar algunos de los muchos requisitos previos. El aprendizaje automático sin programación parece ser un sueño descabellado. Sin embargo, el estudio ML de Microsoft Azure transformó este ansiado deseo en una realidad concreta. Este artículo busca conocer a los neófitos de ML sobre Azure ML Studio y proporciona un breve tutorial sobre cómo crear, entrenar y probar un modelo de ML básico con ML Studio de Azure.
ML Studio de Microsoft Azure es una interfaz gráfica de usuario que aprovecha una interfaz de usuario fácil de arrastrar y soltar para crear, entrenar e implementar modelos de aprendizaje automático resistentes a escala. Es una interfaz sin código que representa una tubería dinámica a través de flujos de trabajo visuales más pequeños. ML Studio agiliza todo el proceso, desde el preprocesamiento hasta la validación y visualización. Automatiza el proyecto y reduce la demanda de una infraestructura intrínseca al proporcionar una base sólida. ML Studio reduce drásticamente la complejidad asociada con los flujos de trabajo de ML y su simplicidad inherente lo hace perfecto para los novatos de ML.
Ahora intentaremos crear, entrenar y probar un modelo de aprendizaje automático simple que prediga el precio aproximado de los automóviles teniendo en cuenta su marca, motor, construcción, etc. en Azure ML Studio. Dado que el precio es una salida de valor continuo, utilizaremos un modelo de regresión lineal. Pero primero, profundizaremos en los conceptos básicos de la regresión.
REGRESIÓN Y REGRESIÓN LINEAL: UN ENFOQUE FÁCIL
La regresión se puede definir como un método estadístico para intentar estimar la relación entre las variables independientes (X) y las variables dependientes (Y). La regresión lineal es un subconjunto del análisis de regresión en el que los parámetros (variables) tienen una correlación lineal. Los modelos de regresión lineal se utilizan cuando necesitamos predecir una cantidad numérica no discreta de valor continuo como el precio, la edad, etc. Se puede dividir en 2 categorías amplias para nuestra evaluación. Más variantes están más allá del alcance de este artículo.
- Regresión lineal simple : supongamos que tiene que predecir el peso corporal de una persona basándose en UN solo criterio. Que ese criterio sea su altura. Entonces, en este caso, está prediciendo el valor de la etiqueta (variable dependiente) en función de una sola característica (variable independiente). El modelo de regresión lineal aprovechado en este caso es un modelo de regresión lineal simple. En este modelo, solo hay una variable predictora (altura) que se usa para predecir un solo resultado (peso corporal). La ecuación se puede representar en el formato pendiente-intersección , es decir
Dónde,
- Y= variable dependiente,
- X= variable independiente,
- m= pendiente/gradiente de la línea, y
- C= El intercepto en y.
- Regresión lineal múltiple : en este tutorial, analizaremos cómo predecir los precios de los automóviles en función de numerosos factores como la marca, el estilo de la carrocería, el número. de cilindros, etc. En este ejemplo, se usaron múltiples predictores para determinar una salida en forma de precios de automóviles. Este es un ejemplo de un modelo de regresión lineal múltiple. En este modelo, hay más de un predictor/variable independiente pero solo un resultado/variable dependiente. La ecuación se puede expandir como:
Dónde,
- Y= variable dependiente
- m,n…..z= Coeficientes
- x1,x2….xn= Variables independientes
- c=intersección Y
Ahora que se han aclarado los conceptos básicos sobre la regresión lineal, sigamos con el tutorial sobre Azure ML Studio.
PREDIGA PRECIOS DE AUTOMÓVILES EN AZURE ML STUDIO
Creación de un nuevo proyecto:
Paso 1: vaya a este enlace y regístrese para obtener una cuenta gratuita si no tiene una suscripción. Este plan gratuito es perfecto para principiantes que están experimentando con la plataforma.
Paso 2: Después de completar el inicio de sesión, abra la pestaña ‘ Proyectos’ ubicada en el panel de la izquierda. Ahora puede ver todos los proyectos creados por el usuario en el pasado. Si es un usuario nuevo, este panel permanecerá vacío. Presione el botón ‘Nuevo’ en la esquina inferior izquierda para crear un nuevo proyecto.
Paso 3: seleccione ‘Proyecto vacío ‘ en el panel que aparece. Aparecerá un cuadro de diálogo que le pedirá un nombre y una descripción para su proyecto. Asigne a su proyecto un nombre apropiado como «Predicción de precios de automóviles» y agregue una descripción opcional. Presione el botón ‘ marcar’ en la esquina inferior derecha del cuadro de diálogo.
Paso 4: Haga clic en el enlace ‘Agregar activos’ . Una vez que se le dirija a la ventana ‘Cambiar configuración del proyecto ‘, mueva los ‘conjuntos de datos’ y los ‘experimentos’ del panel ‘Todos los activos ‘ al panel ‘Activos del proyecto’ haciendo clic en la punta de flecha derecha. Ambos activos son suficientes para este proyecto. Haga clic en el botón ‘ marcar’ en la esquina inferior derecha de la página.
¡Tu nuevo proyecto está listo! Además, no es necesario crear un nuevo proyecto para trabajar con los experimentos. Incluso podría comenzar a trabajar en un nuevo experimento siguiendo los pasos que se indican a continuación sin crear ningún proyecto nuevo. Aunque, podrían simplificar un poco la organización del experimento.
Creación de un nuevo experimento:
Siga los pasos a continuación para crear un nuevo experimento:
Paso 1: Presiona la pestaña ‘Experimentos’ en el panel izquierdo. Ahora puede ver todos los experimentos realizados por el usuario en el pasado. Si es un usuario nuevo, este panel «Mis experimentos» permanecerá vacío. Para crear un nuevo experimento, presione el botón ‘Nuevo’ en la esquina inferior izquierda de la página.
Paso 2: Ahora, seleccione la opción ‘Experimento en blanco’ . También puede optar por varias plantillas predefinidas proporcionadas por ML Studio.
¡Se ha creado un nuevo experimento en blanco! Aparece el lienzo de este experimento en blanco.
Ahora, simplemente puede buscar elementos en el panel izquierdo, arrastrarlos al lienzo y soltarlos donde sea necesario. Para establecer un flujo de trabajo adecuado, los elementos deben estar conectados con los elementos anteriores y futuros. Estas relaciones se pueden establecer fácilmente arrastrando el puntero del mouse y soltándolo al llegar al elemento designado.
Ahora, cambie el nombre de su experimento de ‘Experimento creado en’ a un nombre válido. Agregue un resumen y una descripción apropiados.
Ahora, comenzaremos con el proceso principal de construcción, entrenamiento y prueba de los modelos.
- ML Studio proporciona numerosos conjuntos de datos de muestra para principiantes. En el panel de «búsqueda de elementos del experimento» a la izquierda, presione el botón «Conjuntos de datos guardados» y busque el conjunto de datos de precios de automóviles en «Muestras «. Una vez que lo encuentre, arrástrelo y suéltelo en el centro del lienzo. También puede cargar su propio conjunto de datos.
- En «Buscar elementos del experimento» , busque «Seleccionar columnas en el conjunto de datos» . Este módulo permite a los usuarios incluir o excluir ciertas columnas en un conjunto de datos. Arrástrelo y suéltelo debajo del módulo del conjunto de datos. En el panel «Propiedades» de la derecha, seleccione el selector de columna «Iniciar» . Ahora, queremos excluir la columna ‘Pérdidas normalizadas’ porque tiene numerosos valores faltantes. Seleccione ‘excluir’ -> ‘nombre de columna’ -> ‘Pérdidas normalizadas’. Presiona el botón ‘marcar’ en la esquina inferior derecha. La columna deseada será excluida del modelo.
Ahora, vincule el módulo de datos de precios de automóviles al módulo ‘Seleccionar columnas en el conjunto de datos’ simplemente arrastrando una punta de flecha desde el primer módulo y soltándola en el segundo módulo.
- Desde el panel ‘buscar elementos del experimento’ , acceda al módulo ‘limpiar datos faltantes’ . Arrástrelo y suéltelo debajo del módulo anterior. En el panel de ‘propiedades’ a la derecha, cambie el modo de limpieza a ‘eliminar toda la fila’ . Esto significa que si a una fila en particular le faltan valores, la fila se eliminará. También puede optar por sustituir los valores faltantes con varios métodos de tendencia central según el objetivo final. Vincularlo al módulo anterior.
- Seleccione de nuevo el módulo ‘seleccionar columnas en el conjunto de datos’ del panel más a la izquierda y suéltelo en el lienzo. Esta vez seleccionaremos las columnas que queremos incluir en el modelo de entrenamiento. Por lo tanto, presione el botón ‘lanzar selector de columna ‘ en el panel ‘Propiedades’ y elija las columnas de su elección.
Comience con Sin columnas y presione el botón ‘marcar’ en la esquina inferior derecha. después de la selección. Vincule este módulo al primer puerto del módulo anterior.
- Ahora, necesitamos dividir el conjunto de datos en la parte de entrenamiento y la parte de prueba. Entonces, arrastre el módulo ‘Dividir los datos’ desde el panel ‘Buscar elementos del experimento’ y suéltelo en el lienzo. En el panel ‘ Propiedades’ , cambie el valor de ‘fracción de filas en el primer conjunto de datos de salida’ a 0.7 y marque la casilla ‘división aleatoria’ . Esto hace que el 70 % de los datos estén disponibles para el entrenamiento de forma aleatoria y el resto se utilice para las pruebas. Vincularlo al módulo anterior.
- Ahora podemos seleccionar el algoritmo de aprendizaje automático para el entrenamiento. En el panel «Buscar elementos del experimento» , busque «Regresión lineal» y suéltelo en el lienzo. Además, suelte el módulo ‘Modelo de tren’ en el lienzo. Vincule el primer puerto del módulo ‘datos divididos’ al segundo puerto del módulo ‘Modelo de tren’ y el módulo de ‘Regresión lineal’ al primer puerto del módulo ‘Modelo de tren’.
- Presione el botón ‘Lanzar selector de columna’ en el panel más a la derecha y elija la columna que desea predecir. Presiona el botón ‘marcar’ en la esquina inferior derecha de la página.
- Coloque el módulo ‘Modelo de puntuación’ del panel ‘Buscar elementos del experimento’ en el lienzo. Conecte el módulo ‘Modelo de tren’ al primer puerto del ‘Modelo de puntuación’ y el segundo puerto del módulo ‘Dividir datos’ al segundo puerto del módulo ‘ Modelo de puntuación ‘. ML Studio sugiere el puerto con el que se deben conectar los enlaces correspondientes.
- Finalmente, suelte el módulo ‘Evaluar modelo’ del panel ‘Buscar elementos del experimento’ . Vincularlo con el módulo anterior.
- ¡Tu configuración está completa! Solo tienes que darle a ‘ejecutar’ en la barra ubicada en la parte inferior de la página.
Espere a que el modelo complete el entrenamiento y la validación. Una vez que estén completos, presione el número flotante que aparece en el módulo ‘Modelo de puntuación’ y seleccione la opción ‘Visualizar’ .
La columna ‘Etiquetas puntuadas’ predice los precios de los automóviles en función de las características que habíamos seleccionado. Puede comparar los precios pronosticados con los precios reales y determinar el nivel de precisión de nuestro modelo.
Agregando el Experimento al Proyecto:
Ahora que su experimento se ha completado, puede agregarlo a la carpeta del proyecto que había creado de antemano.
- Presiona la pestaña ‘Proyecto’ en el panel más a la derecha y selecciona ‘Agregar al proyecto’
- Seleccione la carpeta del proyecto ‘Predicción de precios de automóviles’ que habíamos creado anteriormente y presione el botón ‘marcar’ .
El experimento ahora se agrega al proyecto.
Publicación traducida automáticamente
Artículo escrito por ssanya0904 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA