Experiencia de entrevista de Paytm para ingeniero de datos (2 años de experiencia)

Ronda 1 (Técnica) [1 hora]:

  • Introducción
  • Discusión sobre el proyecto.
  • Algunas preguntas de SQL son de nivel fácil a difícil. me gusta
    • Elimina los duplicados de la tabla.
    • elemento de altura n en cada partición.
    • En una tabla, da el nombre del equipo de IPL y tienes que encontrar una combinación de partidos para jugar entre ellos con algunas condiciones. = usar auto unión
    • Ejecutar agregación en la tabla = usar la función de ventana con un rango
  • Algunas preguntas de codificación de calentamiento:
  • Pregunta de estructura de datos simple:
    • Invierta la pila sin utilizar espacio adicional.
  • Un poco de discusión sobre la técnica de optimización en chispa.
  • Colección Python.

Ronda 2 (Técnica) [1.5 h]:

  • Breve introducción.
  • Discusión del proyecto y su contribución al proyecto.
  • Pregunta SQL:
    • Diseñe el extracto bancario de la tabla de clientes en función de la columna de monto de débito y crédito.
  • Pregunta de codificación de calentamiento:
    • Cuántos caracteres agregar, para hacer un palíndromo de cuerdas.
    • Enmascaramiento de correo electrónico.
  • Pregunta de estructura de datos:
  • Algunas preguntas relacionadas con Hive y Spark como.
    • Arquitectura de chispa.
    • Tengo un archivo con nombre, dirección, puntaje como archivo de lectura de entrada en chispa y valido los campos para obtener un puntaje de error, digamos si el nombre consiste en numérico: el error es del 10% si la longitud de la dirección es <5, entonces el error es del 15% y si la puntuación es inferior a > 40, entonces un error es del 20 %, si el registro tiene un error de >= 20 %, escriba en el archivo de errores; de lo contrario, escriba en un archivo de éxito.
    • Únase a la optimización en Spark y Hive.
    • Cambiando lentamente las dimensiones y sus tipos.
    • Algunas preguntas relacionadas con el formato de archivo y la técnica de compresión.

Ronda 3 (Técnico + Gerencial) [1.5 h]:

  • Breve introducción.
  • Dime algo que no esté escrito en el currículum.
  • Discusión sobre la arquitectura del proyecto y algunas preguntas cruzadas sobre por qué usar esta tecnología.
  • Algunas preguntas relacionadas con la configuración del clúster.
  • Algunas preguntas basadas en situaciones sobre Spark.
    • Si un trabajo de chispa tarda 5 minutos en completarse y después de algunos meses tarda 2 horas. para completar, así que cuál podría ser la razón de la misma.
    • Diferencia entre repartición y fusión: en cuyo caso usará la repartición para disminuir el número de particiones.
    • Qué desafíos enfrentas en tu proyecto.
    • Si tiene que procesar 500 GB de datos y en su clúster, tiene 64 GB de RAM y 16 núcleos, la pregunta es cuántos ejecutores utilizará para este trabajo de chispa y cuál será la configuración de cada ejecutor.
    • En cuyo caso, utilizará el almacén de datos y el lago de datos.
    • Qué estructura de datos utilizará para almacenar los datos de la tarjeta aadhar.
  • Un problema de diseño de DSA:
    • escalera de serpiente de diseño.
      • Encuentre la tirada mínima de dados requerida para ganar, si mientras toma la entrada también está tomando el índice de posición de escalera y serpiente.
      • Qué estructura de datos elegirá para resolver esto.
  • Un rompecabezas:
    • Hay 5 carriles en una pista de carreras. Uno necesita averiguar los 3 caballos más rápidos entre un total de 25. Averigüe el número mínimo de carreras que se realizarán para determinar los tres más rápidos.

Después de esa discusión de recursos humanos ocurrió en una llamada telefónica.

Esto es todo acerca de mi experiencia durante el proceso de entrevista. Espero que esto te ayudará.

 ¡¡Mis mejores deseos!!

Publicación traducida automáticamente

Artículo escrito por GeeksforGeeks-1 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *