ZS Associates es una de las mejores consultoras que además cuenta con un gran equipo de Data Scientists. La principal clientela de ZS son las empresas farmacéuticas, pero también consta de otros dominios. Los roles de consultor en ZS siguen la siguiente jerarquía:
- Asociado
- Consultor Asociado
- Consultor
- Gerente
Trabajar con ZS era un objetivo para mí cuando estaba en la universidad. Solicité el rol de DAA (Decision Analytics), pero no pude descifrarlo en ese momento. ZS contrata candidatos nuevos y experimentados de nivel de entrada para el puesto de Data Science Associate (DSA) . Cuando comencé con ML y Data Science, hice una lista de empresas objetivo de las que me gustaría formar parte. ZS fue uno de ellos considerando su ética de trabajo y cómo trata a sus empleados.
Proceso de solicitud: Solicité el puesto de DSA en marzo de 2020 inicialmente. No tenía a nadie a quien pedir una referencia, así que solicité directamente en su sitio web. El primer paso en la solicitud es la preselección de su currículum. Así que asegúrese de que el currículum sea adecuado para el trabajo que está solicitando. Pronto escribiré un blog sobre la redacción de currículums también. Volviendo al punto, recibí la invitación para enviar una prueba de aprendizaje automático en Hackerearth después de que mi currículum fuera preseleccionado.
Envié la prueba, pero poco después de que ocurriera el cierre, ¡ZS congeló su contratación! Eso fue un fastidio para mí, pero seguí ampliando mis habilidades de cualquier manera.
Avance rápido hasta octubre de 2020, ZS comenzó a contratar nuevamente después de una brecha de 6 meses. Solicité nuevamente y recibí la llamada para enviar la prueba nuevamente. El proceso constaba de 3 rondas y todas eran rondas eliminatorias.
Ronda 1 (desafío de aprendizaje automático): la primera ronda fue para resolver un problema de aprendizaje automático y enviar las predicciones CSV junto con el código fuente. El problema de ML que tuve fue una clasificación de texto que tenía descripciones de trabajo del portal de trabajo de una compañía farmacéutica. Mi tarea era hacer un modelo de aprendizaje automático que tomara el texto de la descripción del trabajo y predijera 2 objetivos: tipo de trabajo y categoría de trabajo. El envío debía ser un archivo CSV que contuviera las predicciones sobre los datos de prueba.
Problema y enfoque: el tipo de trabajo constaba de 6 clases y la categoría de trabajo constaba de 11 clases. En esencia, se trataba de un problema de clasificación multiclase y de 2 objetivos. Hice los siguientes pasos para resolver el problema y enviar la solución y las predicciones:
- Comprensión de datos
- AED
- Preprocesamiento de texto
- Tokenización
- Stemming/Lematización
- Vectorización de palabras y creación de incrustaciones con Word2Vec
- Modelados
- Ajuste de hiperparámetros
- Obtener predicciones sobre datos de prueba
- Guardar y enviar el código fuente y CSV
Me dieron casi 2,5 días para completar este desafío en HackerEarth. Envié la solución y crucé los dedos.
Ronda 2 (informe del caso): Recibí una llamada de recursos humanos con respecto a la segunda ronda 4 o 5 días después de enviar el problema de la ronda 1. Esta ronda fue una discusión técnica sobre el desafío de ML y mi solución. Tuve que hacer un PPT describiendo los pasos que hice, los resultados que obtuve y el código fuente.
La entrevista estaba programada en Zoom durante 1 hora y me pidió que compartiera mi pantalla y les presentara mi solución. La entrevista comenzó y les describí la solución completa paso a paso a través de mi presentación.
Discusión: Después de ver mi presentación de principio a fin, casi no me hicieron preguntas. ¡Y pensé que esto es fácil! Pero no era. Una vez que terminé de explicar la solución, comenzaron a hacerme preguntas sobre mi enfoque desde el primer paso. Algunos de ellos fueron:
- ¿Por qué no hiciste más EDA? ¿Qué más podrías haber hecho?
- Ignoraste la importancia de las palabras. ¿Alguna forma en la que podrías haber analizado la palabra importancia y agregarle otra característica?
- El primer objetivo tenía un desequilibrio de clase. ¿Cómo lidiaste con eso?
- ¿Qué hizo toda la ingeniería de funciones?
- Quitaste todos los valores numéricos del texto. ¿No podría darse el caso de que las descripciones de trabajo que tienen valores numéricos, como fechas, signifique que se trata de una pasantía o algo así?
- ¿Pensó en una mejor manera que eliminar todos los valores no alfabéticos?
- Usaste derivación. ¿Por qué no usaste la lematización? ¿Cuándo es útil la lematización sobre la lematización y viceversa?
- Usaste incrustaciones de palabras usando Word2Vec. ¿Fue uno pre-entrenado o lo entrenaste con estos datos? ¿No crees que una incrustación previamente entrenada hubiera funcionado mejor?
- ¿Usaste otras técnicas como Bolsa de palabras, TF-IDF, N-gramas, etc.? ¿Cómo se estaban desempeñando?
- Promediaste los vectores de palabras de todas las palabras en una oración para formar el vector de características completo. ¿No crees que esto habría resultado en una pérdida de información? ¿Qué mejor manera podrías haber usado aquí?
- ¿Qué modelos probaste correr y cuál fue el resultado?
- ¿Usaste Deep Learning también? ¿No crees que Deep Learning podría haber obtenido mejores resultados?
- ¿Cómo crees que se podrían haber mejorado las métricas? ¿Cuáles son las razones de una puntuación baja en la categoría de trabajo objetivo?
Después de responder a la mayoría de las preguntas anteriores, ¡estaba agotado! Pensé que podría haberlo hecho mucho mejor con mi solución y probé más técnicas para obtener mejores resultados. Sin embargo, crucé los dedos nuevamente y esperaba recibir una llamada para la tercera ronda.
Ronda 3 (Ronda técnica + ajuste): La tercera y última ronda fue una ronda técnica que pensé que estaría en mi currículum, proyectos y habilidades. Sin embargo, el entrevistador tenía otros planes.
Entrevista Técnica: El entrevistador me preguntó sobre mis áreas fuertes en Machine Learning, y respondí que es PNL. Comenzó la ronda dándome un escenario en el que tenemos un cliente que tiene datos de texto de correos electrónicos que son comentarios de los clientes sobre sus productos. Comenzó con el ciclo de vida completo de Data Science y fue paso a paso hasta el final.
- Los datos que tenemos no están etiquetados y queremos clasificarlos en diferentes clases según el departamento al que pertenece y el producto para el que es. ¿Cómo procederás?
- Una vez que lo haya etiquetado, ¿cómo lo limpiará y preprocesará?
- Una vez que los datos estén limpios, ¿qué próximo paso tomará para analizarlos y agregar funciones?
- ¿Cómo lo vectorizarás? ¿Cuáles son todas las formas que conoces?
- ¿Crees que podría haber un sesgo en los datos? ¿Cómo abordar eso?
- ¿Cuál será el siguiente paso? ¿Cómo te asegurarás de tener el mejor modelo?
- ¿Cómo se puede reducir el tiempo de formación?
- Una vez finalizado el modelo, ¿cómo se realizará la implementación y de qué se ocupará todo?
- ¿Qué y cómo se hará el reciclaje?
- ¿Cuáles son los tipos de agrupamiento?
- ¿Cómo hace suposiciones un modelo lineal? ¿Cuál será su inconveniente?
- ¿Cómo funcionan los conjuntos?
- ¿Alguna plataforma en la nube en la que hayas trabajado? ¿En qué elementos consiste Azure?
- ¿Cómo puede decidir si una característica es importante o no durante el análisis de regresión?
Hizo algunas preguntas más sobre estadísticas y conceptos de aprendizaje automático. También se dedicó un poco al aprendizaje profundo y las CNN. En general, respondí la mayoría de las preguntas que me hizo.
Le hice algunas preguntas sobre el trabajo allí, los clientes y los diferentes dominios involucrados, a las que respondió amablemente.
Tenía bastante confianza en mi solicitud ahora que la última ronda salió bastante bien. Crucemos los dedos, otra vez.
Carta de confirmación y oferta: El momento que había estado esperando finalmente llegó cuando recibí la llamada de confirmación de RRHH, ¡y quedé encantada! El trabajo duro y la persistencia de meses finalmente trajeron colores. Dentro de unos días, recibí la carta de oferta y la acepté felizmente. El proceso no podría haber sido más fluido y perfecto. ¡El trabajo duro tiene su recompensa!
Recibí toneladas de requests de la comunidad con respecto a mi experiencia de entrevistas y pensé que este blog les haría justicia a todas. Pronto estaría escribiendo blogs sobre preparación de currículums y estrategias de búsqueda de empleo.
Publicación traducida automáticamente
Artículo escrito por GeeksforGeeks-1 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA