4 votos

Modelización de datos/Aprendizaje estadístico - Preguntas de la entrevista

En una entrevista me hicieron las 2 preguntas siguientes. No me seleccionaron, lo que significa que mis respuestas eran incorrectas.

Ahora tengo que aprender de mis errores. He pensado bastante desde la entrevista y todavía no he llegado a ningún sitio concreto así que necesito vuestra ayuda

Pregunta 1 : Está lloviendo por la tarde y no puedes salir. El telediario dice que seguirá lloviendo durante las próximas 5 horas. ¿Qué probabilidades hay de ver el sol en las próximas 36 horas?

Mi respuesta en la entrevista : Dije algo así como que miraría los datos de todo el mes y de años anteriores (el mismo mes) para ver con qué frecuencia de media tenemos cielos despejados después de un día lluvioso.

Creo que debería haber dicho que este no es un escenario viable para aplicar el aprendizaje estadístico

Pregunta 2 : En una empresa que contaba con 1000 empleados, 100 de ellos se marcharon en un año. Ahora la empresa le ha pedido que examine a los empleados existentes y averigüe quiénes corren el riesgo de marcharse. La empresa puede proporcionarle todos los datos que desee.

Mi respuesta : Dije que miraría los sueldos de estas personas y de las que se fueron. Lo compararía con los estándares del mercado y vería si podía encontrar algún patrón. También dije que miraría las valoraciones de las personas que se marchan y vería si son estrellas del rendimiento o no, ya que las personas de alto rendimiento que no consiguen ascensos también pueden marcharse. Utilizaría la regresión logística para la clasificación.

Sentía que iba por buen camino, pero obviamente no fue así.

Creo que el entrevistador buscaba mi enfoque básico y no métodos complicados de aprendizaje estadístico.

7 votos

Google hizo un gran estudio en el que se relacionaban (1) las notas de los entrevistadores en este tipo de preguntas enigma y (2) el rendimiento laboral posterior. ¿Qué encontraron? Absolutamente CERO poder de predicción. Su conclusión final fue que las preguntas tipo puzzle existen sobre todo para que el entrevistador se sienta inteligente.

1 votos

@ Matthew : Jaja.. eso me hace sentir un poquito mejor..

0 votos

He aquí una buena lista de preguntas para entrevistas sobre modelado de datos. http://www.thetechdb.com/top-10-data-modeling-interview-questions-must-prepare/

3voto

J Doe Puntos 6

Para el segunda pregunta No creo que la gente quiera saber específicamente qué modelo se va a utilizar, porque normalmente se decide después de una validación cruzada. En este caso, el salario es una buena característica para incluir, pero también podría haber: años de experiencia, departamento, edad, titulación, sexo, estado civil, etc. Los datos proporcionados incluyen 100 etiquetas positivas y 900 negativas, así que yo diría cómo tratar esto datos desequilibrados es decir, un submuestreo o una infraponderación de esas 900 muestras con etiquetado negativo. Por último, me gustaría mencionar validación cruzada para elegir el mejor modelo, la mejor estrategia para tratar los datos desequilibrados y, tal vez, el mejor conjunto de características si hay demasiadas disponibles. Además, dado que nos interesa el riesgo de abandono, podría utilizar Área bajo la curva (AUC) en lugar de la tasa de error simple como métrica de evaluación .

Para el primera pregunta ya que viste el pronóstico del tiempo, deberías saber la respuesta. Construir un modelo está bien, pero es mucho más difícil y a menudo resulta en una predicción menos precisa, teniendo en cuenta que tienes menos recursos que los que lo hacen para la emisión televisiva. Buscar datos meteorológicos históricos es mucho más difícil que hacer una previsión de 48 horas.

0 votos

Entiendo tu lógica, espero que esto me prepare mejor para la próxima vez :)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X