8 votos

Ventajas relativas de la maximización de la imputación y expectativa múltiple (EM)

Tengo un problema donde

$$y = a + b $$

Observo y, pero ni $a$ ni $b$. Yo quiero estimar

$$b = f(x) + \epsilon$$

Me puede hacer una estimación de $a$, el uso de algún tipo de modelo de regresión. Esto le da a me $\hat b$. Entonces yo podría estimar

$$\hat b = f(x) + \epsilon$$

Primer problema: un modelo de regresión para predecir $a$ podría llevar a $\hat b$ ser negativo, lo cual no tendría ningún sentido. No está seguro de cómo conseguir alrededor de esto (no el tipo de problema que he tratado con muchísimo), pero parece que el tipo de cosa que otros se ocupen de manera rutinaria. Algún tipo de no-gaussiano GLM?

El principal problema es cómo dar cuenta de la incertidumbre en el modelo principal que proviene de la estimación de $\hat b$. He usado varios de imputación antes por falta de covariables. Pero esto es una falta "latente parámetro." Por otra parte, es el resultado de la investigación, que parece ACEPTAR la imputación. Sin embargo, a menudo escucho de EM se utiliza para "latente" de los parámetros. No estoy seguro de por qué, ni sé si EM es mejor en estos contextos. MI es intuitivo tanto para comprender, aplicar y comunicar. EM es intuitivo de entender, pero parece más difícil de implementar (y todavía no he hecho).

Es EM superior para el tipo de problema que tengo encima? Si es así, ¿por qué? Segundo, ¿cómo se implementan en R para un modelo lineal, o para un semiparamétrico (GAM) modelo?

1voto

AdamSane Puntos 1825

Si tiene sentido o no para el uso GLMs depende de la distribución de $y$. Yo estaría inclinado a usar una no lineal de mínimos cuadrados del modelo para el conjunto de la cosa.

Así que si tu modelo de regresión es $a = Z\alpha+\nu$ donde $Z$ son los predictores y $\alpha$ son los parámetros en el modelo de regresión para $a$, y el modelo para $b$ $b = f(x)+\epsilon$ pero donde $f(x)$ está restringido a ser no negativo, podría escribir $f(x) = \exp(\psi(x))$ y se ajustan a un modelo como este:

$$ y = Z\alpha+\exp(\psi(x))+\eta $$

donde $\eta$ es la suma de los dos individuales ruido términos. (Si usted realmente tiene la intención de que $y=a+b$ sin error en todo, tienes que hacerlo de otra manera; que no es realmente un stats problema tanto como una aproximación al problema y probablemente desee buscar en el infinito-normas a continuación.)

Si pones decir un cúbicos de regresión spline para $\psi$ que sería una forma fácil de conseguir algún general suave de la función. Que modelo puede ser equipado por no lineal de mínimos cuadrados. (De hecho, algunos de los algoritmos puede tomar ventaja de la linealidad de la $a$ a simplificar y acelerar la velocidad de cálculo).

Dependiendo de lo que usted asume acerca de $y$ o $f$, hay otras cosas que usted puede hacer en su lugar.

Que en realidad no abordar el problema de la imputación todavía. Sin embargo, este tipo de modelo de marco puede ser insertado en algo así como su sugerencia de que el uso de EM.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X