4 votos

Comparación de datos simulados y reales

Digamos que tengo una regresión lineal simple con valores observados de y

y = a + bx

Luego tengo 1000 simulaciones en las que he generado y al azar. (No es cuestión de barajar y ; generé y a través de un modelo separado). Para cada simulación tengo estimaciones independientes de b . Mi objetivo es comprobar si mi estimación real de b difiere de mi simulación b's . Normalmente, probaría si b está dentro del intervalo de confianza del 95% de las 1000 simulaciones b's . Sin embargo, cada b tiene su propio error estándar. ¿Cómo puedo tenerlo en cuenta?

Vi una publicación que daba el número de simulaciones que tienen un b +/i IC del 95% que se solapa con el IC del 95% del b de los datos observados. ¿Es esa la forma habitual de presentar los resultados? Además, ¿qué pasa si quiero mostrar los resultados (relación x-y) gráficamente? ¿Qué utilizaría para el intervalo de confianza del 95% de la pendiente de las simulaciones?

Merci !

3voto

AdamSane Puntos 1825

Si bien cada estimación de un parámetro tiene un error estándar, como usted dice, ¿de qué es una medida ese error estándar? Es un intento de estimar la desviación estándar de la distribución muestral del parámetro.

Pero tú tienen esa distribución a través de su simulación. La muestra $b$ de su simulación representan extracciones de la distribución de muestreo. Las estimaciones del error estándar son redundantes. No lo tengas en cuenta, haz lo que sugieres en 'normalmente' - el intervalo que generas por simulación debería comportarse como una muestra de la distribución muestral bajo las condiciones establecidas en tu simulación (personalmente usaría una muestra más grande, si es posible, pero eso es sólo cosa mía - mucha gente se conforma con n=1000).

¿Qué utilizaría para el intervalo de confianza del 95% de la pendiente de las simulaciones?

Lo típico sería la obviedad (2,5%ile, 97,5%ile) de las pendientes simuladas.

0 votos

Gracias Glen_b por tu respuesta. Mis regresiones son en realidad modelos mixtos, lo que complica las cosas. Mi objetivo es comparar las estimaciones y predicciones de mis datos reales con las de los datos simulados, comprobando si sus IC se solapan. Siguiendo los métodos de glmm.wikidot, se pueden calcular los intervalos de predicción teniendo en cuenta la incertidumbre de los efectos fijos y los efectos aleatorios. ¿Mi procedimiento de simulación tiene en cuenta la varianza de los efectos aleatorios? ¿Sería mejor generar intervalos de confianza mediante bootstrapping utilizando bootMER?

0 votos

Mis regresiones son en realidad modelos mixtos, lo que complica las cosas -- eso es más bien un eufemismo. ¿Por qué omitir esa información crítica? De hecho, la primera frase de su pregunta dice directamente regresión lineal simple '. ¿Por qué mi respuesta a la pregunta que has hecho se aplica a una situación muy diferente? No es un cambio trivial en las circunstancias y creo que ahora no entiendo claramente el procedimiento de simulación por el que preguntas. Esta es una pregunta totalmente nueva.

0 votos

Primero quería conocer el caso general. No estaba seguro de si seguir el caso simple con la situación más especializada de los modelos mixtos o si hacer una nueva pregunta. Elegí lo primero y parece que elegí mal.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X