Telefónico :-
P.1. ¿Qué es el Árbol de Decisión? ¿Cómo dividir? ¿Cómo funciona el árbol de decisión?
P.2. ¿Qué contiene cada Node en un árbol de decisión?
P.3. ¿Qué es Entropy and Genie Index y cómo ayuda?
P.4. ¿Qué es el bosque aleatorio? ¿Qué es Random en Random Forest? ¿Cómo calcular el error OOB?
P.5. ¿Cómo funciona el bosque aleatorio?
P.6. Explique todo el proceso desde el momento en que obtiene los datos hasta que llega a la etapa final de predicción.
P.7. ¿Cómo funciona knn? ¿Qué algoritmo de distancia usar en knn cuando los datos son categóricos?
P.8. Tienes 10 documentos. Cada tema ha sido etiquetado con un tema. Una vez que llega un nuevo documento, ¿cómo etiquetarlo en uno de esos temas?
Enfoque principal: el candidato debe ser bueno en codificación y también debe tener un conocimiento sólido de los algoritmos de ML.
Cara a cara: –
Ronda de codificación en R
1. Cree un marco de datos de este formulario
Fecha Valor
01/01/2019 12:00 xx
. .
. .
. .
31/01/2019 11:59 .
El valor se puede generar aleatoriamente
2. Transponga el marco de datos a este formulario
Fecha Hora1 Hora2 Hora3 . . . Valor
01/01/2019 12:00 13:00 14:00 . . . xx
01/02/2019 12:00 13:00 14:00 . . . xx
_ . . . . .
. . . . . .
. . . . . .
31/01/2019 12:00 13:00 14:00 . . . XX
Entrevista técnica
P.1. Si quiero encontrar una relación entre Precio y Ventas, ¿debo usar regresión o correlación?
Respuesta: La regresión lineal simple se puede utilizar para comprender la relación entre
la variable dependiente (Ventas) y la variable independiente (Precio).
Suposición = No hay otros parámetros presentes.
El coeficiente de correlación o covarianza estandarizada (-1 < r < 1) nos dirá:
1. Si hay correlación positiva o negativa.
2. Da fuerza y relación entre 2 variables.
P.2. Si tengo varias características en mi conjunto de datos, ¿cómo sé cuáles incluir para la construcción de mi modelo?
Responder. Compruebe el coeficiente de determinación, es decir, R al cuadrado. Es el porcentaje de variación en la variable y que es explicable por la variable x.
Si r al cuadrado es 0, eso significa que no puedes predecir y a partir de x.
Si r al cuadrado es 1, significa que puede predecir y a partir de x sin ningún error.
Había respondido técnica de reducción de dimensionalidad como Análisis de Componentes Principales.
P.3. Preguntas sobre SSE, RMSE, MAPE.
P.4. Más preguntas sobre el proceso de análisis de datos de extremo a extremo.
P.5. Me preguntaron algunos problemas sobre escenarios prácticos:
a) Si quiero mejorar las condiciones del tráfico, ¿cuáles son los datos que pediría?
b) Qué algoritmo usar cuando tipo de preguntas.