72 votos

Preguntas de la entrevista de estadística

Estoy buscando algunas preguntas para entrevistas de estadística (y probabilidad, supongo), desde las más básicas hasta las más avanzadas. Las respuestas no son necesarias (aunque los enlaces a preguntas específicas en este sitio estarían bien).

0 votos

0 votos

Sería muy interesante que alguien diera ejemplos que ellos mismos dieran al ser entrevistados...

41voto

Brendan Puntos 7674

No estoy seguro de cuál es el trabajo, pero creo que "Explicar x a un novato" probablemente sería bueno

a) porque probablemente tendrán que hacerlo en el trabajo

b) es una buena prueba de comprensión, creo.

8 votos

(+1): No puedo contar las veces que he creído entender algo, pero luego no he sabido explicárselo a otra persona con palabras fáciles. Ejemplo: el valor p ;)

6 votos

"Si no puedes explicárselo a un niño de seis años, probablemente ni tú mismo lo entiendes" - Albert Einstein. Tal vez no sea tan extremo, pero se entiende... :)

2 votos

Me gusta "Explicar un valor p", con o sin la parte "a un novato".

21voto

Berek Bryan Puntos 349

La pregunta estándar donde yo trabajo está en la línea de:

Eche un vistazo a este resultado de una regresión logística múltiple de un paquete estadístico que diga haber utilizado (preferiblemente uno que también usemos nosotros). XXX es la variable independiente de mayor interés. ¿Cómo interpretarías los resultados para un colega con conocimientos del tema pero sin formación estadística formal? (Si es necesario, pida que interprete por separado la estimación puntual, el IC y el valor p).

15 votos

En contextos más académicos también se puede preguntar: "echa un vistazo al resultado de este modelo en este documento de la que es (co)autor . Dígame qué significa". Las respuestas poco convincentes son entonces fatales porque no hay excusas de desconocimiento disponibles, aunque son consternadoramente comunes.

4 votos

@conjugateprior No es cierto. Mientras haya al menos un coautor que no esté presente, era el área del coautor no presente. El principal uso de esta técnica es en las presentaciones de conferencias.

18voto

kjetil b halvorsen Puntos 7012

Muchas preguntas/respuestas en este sitio podrían dar ideas para buenas preguntas. Voy a dar una lista con algunos de esos enlaces que creo que son buenos. Las entradas a las que he respondido están sobrerrepresentadas, porque conozco mejor esas entradas, ¡no porque sean necesariamente las mejores! Doy comentarios cortos a cada enlace, para que puedas decidir si quieres seguir el enlace.

¿Cuál es la intuición de la SVD? "¿Puede explicar a uno de nuestros clientes cómo funciona el SVD?"

Estimación de máxima verosimilitud (MLE) en términos sencillos "¿Puede explicar en un lenguaje no técnico la idea de la estimación de máxima probabilidad?"

Taleb y el Cisne Negro "Dígame, ¿qué es un cisne negro y por qué es relevante? ¿Cuándo es relevante?"

Inferencia estadística cuando la muestra "es" la población "¿Qué se puede decir de la inferencia estadística cuando la muestra es toda la población?"

Bondad del ajuste y qué modelo elegir: regresión lineal o Poisson "Tenemos un problema de regresión en el que la respuesta es una variable de recuento. ¿Qué elegirías en este contexto, los mínimos cuadrados ordinarios o la regresión de Poisson (o quizás alguna otra)? Explica tu elección, ¿cuáles son las principales diferencias entre estos modelos?"

¿Cuál es la diferencia entre la varianza finita y la infinita? "¿Puede explicar, en un lenguaje lo más sencillo posible, qué significa que una variable aleatoria tenga una expectativa infinita o una varianza infinita? ¿Qué importancia práctica tiene esta distinción? Explíquelo con un ejemplo".

¿Cuáles son las alternativas modernas y fáciles de usar a la regresión por pasos? "¿Cómo construirías un modelo de regresión complejo cuando hay muchas variables predictoras posibles? Describa diferentes estrategias posibles, y cuente los problemas de cada una de ellas"

¿Cómo tratar la separación perfecta en la regresión logística? "¿Cuál es el problema de la separación en la regresión logística, sus causas, sus síntomas? ¿Qué se puede hacer para solucionarlo, si realmente es un problema?"

¿Por qué la matriz de correlación debe ser semidefinida positiva y qué significa ser o no semidefinida positiva? y
¿Qué me dice una matriz de covarianza no definida positivamente sobre mis datos? "Explique por qué una matriz de covarianza debe ser positiva (semi) definida, y qué significa eso. ¿Cómo se puede utilizar este hecho?"

Cuáles son las versiones multidimensionales de la mediana "¿Puedes proponer alguna forma de generalizar la mediana a los datos multivariantes?"

Interpretación de los términos de interacción en la regresión logit con variables categóricas y ¿Cuáles son las mejores prácticas para identificar los efectos de interacción? y ¿Dos efectos principales negativos y un efecto de interacción positivo? y Incluir la interacción pero no los efectos principales en un modelo y ¿Cómo interpretar los efectos principales cuando el efecto de interacción no es significativo? "Explique qué se entiende por interacción en los modelos de regresión. En concreto, ¿qué significa que la interacción sea significativa mientras que los efectos principales no lo son? ¿Hay alguna diferencia en la interpretación de la interacción entre la regresión lineal ordinaria y la regresión logística?"

¿Cuál podría ser la razón para utilizar la transformación de la raíz cuadrada en los datos? y Transformación adecuada de los datos "¿Cuándo, cómo y por qué se transforma la variable de respuesta en un modelo de regresión (o ANOVA)? ¿Existen alternativas?

¿Puedo confiar en los resultados del ANOVA para una VD no distribuida normalmente? "¿Cómo tratarías un ANOVA con residuos no normales?

¿Por qué es útil la estadística cuando muchas cosas que importan son de una sola vez?

¿Cómo puedo modelar eficazmente la suma de variables aleatorias Bernoulli?

¿Cuándo utilizar ecuaciones de estimación generalizadas frente a modelos de efectos mixtos?

¿Qué ocurre aquí, cuando utilizo la pérdida al cuadrado en la configuración de la regresión logística? "¿Por qué utilizamos la máxima verosimilitud para la regresión logística? ¿Por qué no los mínimos cuadrados?"

¿Cuál es la diferencia entre la regresión lineal de y con x y la de x con y?

17voto

Eric Davis Puntos 1542

También podría reflexionar sobre si la entrevista es el mejor medio para medir el constructo de interés. Si quiere medir los conocimientos previos sobre probabilidad o estadística, tal vez sea mejor recurrir a una prueba escrita. Puede hacer más preguntas y, por tanto, aumentar la fiabilidad de la medición. Está más estandarizado tanto en la administración como en la puntuación. Y una vez desarrollado el instrumento, probablemente se utilicen menos recursos para administrarlo.

A continuación, podría utilizar la entrevista como una herramienta más centrada en factores como las habilidades verbales e interpersonales.

16voto

Funkatron Puntos 757

Dos preguntas que me han hecho:

1) Usted ajusta una regresión múltiple para examinar el efecto de una variable concreta en la que está interesado un trabajador de otro departamento. La variable resulta insignificante, pero tu compañero de trabajo dice que es imposible, ya que se sabe que tiene un efecto. ¿Qué dirías/harías?

2) Tienes 1000 variables y 100 observaciones. Te gustaría encontrar las variables significativas para una respuesta concreta. ¿Qué harías?

0 votos

¿Podría publicar también las respuestas? En el caso de 1), supongo que puede haber alguna variable dependiente que cause el problema. Para la 2), probablemente optaría por la prueba estadística ² (chi-cuadrado)

2 votos

Hay muchas respuestas razonables a ambos, aquí están mis pensamientos rápidos: 1) el modelo de regresión procede de una muestra, esta muestra tiene una variación aleatoria y, por tanto, el modelo es sólo una estimación y puede dar lugar a errores de tipo 1 o de tipo 2. También podría haber una fuerte colinealidad entre los predictores. Para 2) es el problema de P grande frente a N pequeño. Hay muchas técnicas para manejar esta situación, como la reducción de las dimensiones y Lasso.

0 votos

2) hacer ajustes univariantes de las variables e identificar las más significativas para reducir el conjunto de variables

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X