7 votos

¿Estimación de parámetros de Box-Cox cuenta hacia parámetros de AIC?

Supongamos que tengo un modelo de regresión, por ejemplo, con 2 parámetros

$y = ax + b$

Pero los datos no son normales, así que antes de regresión de transformar ambos lados con Box-Cox de estimación. Por lo tanto tengo dos Box-Cox parámetros, $\lambda_x$$\lambda_y$.

Ahora quiero calcular AIC para este modelo. Cuántos parámetros existen?

Mi instinto sería que $\lambda_y$ cuenta como un parámetro pero no $\lambda_x$, debido a que si el modelo se aplica a la previsión $y$ a partir de $x$, $\lambda_x$ puede ser estimada en cualquier momento a partir de la disposición a$x$, pero tenemos que recordar que $\lambda_y$ a uso como no sabemos el $y$ estamos tratando de predecir.

4voto

jldugger Puntos 7490

Escribir $p_\lambda(x)$ para el de Box-Cox transformación de $x$ con el parámetro $\lambda$, $-\infty\lt\lambda\lt\infty$. El pleno del modelo de datos de $(x_i,y_i)$ donde las respuestas $(y_i)$ son vistos como una realización de un vector aleatorio $(Y_i)$ se describe en la pregunta

$$\mathbb{E}(p_{\lambda_y}(Y_i)) = a + b\, p_{\lambda_x}(x_i).$$

Que explícitamente tiene cuatro parámetros de ${a, b, p_{\lambda_y}, p_{\lambda_x}}$, todos los cuales son identificables siempre hay al menos tres distintos valores de $x_i$ y tres valores distintos de $y_i$. De acuerdo a las respuestas a su pregunta anterior, usted cuenta cuatro parámetros cuando ninguno de los valores se establecen de forma independiente de los datos (y por lo tanto se estima a partir de los datos). Si en lugar de cualquiera de ellos (o ambos) $\lambda_x$ o $\lambda_y$ fueron establecidas en alguna otra forma, por ejemplo, si $\lambda_y$ se calcula a partir de un conjunto de datos separado, entonces no sería contado.

(Dependiendo de la distribución de los supuestos realizados acerca de la $p_{\lambda_y}(Y_i)$, no podría ser más parámetros que intervienen en el ajuste del modelo. Contando con ellos no es afectado por el Box-Cox transformaciones. El uno-a-uno, de propiedad de la Box-Cox de transformación indica que cualquier parámetro que es identificable en la ausencia de la transformación seguirá siendo identificable cuando la transformación se aplica.)

0voto

jlo Puntos 755

¿Por qué te la transformación de los datos?

Qué escala están preguntando a sus preguntas? Si no es la transformada de escala, entonces hay la cuestión de la parametrización.

Un ejemplo podría ayudar. Supongamos que algunos de respuesta $Y \sim \log N(\mu, \sigma)$, y desea comparar $Y$ a través de dos poblaciones independientes. Supongamos, además, que la cuestión de interés es, "Son los medios iguales en estas poblaciones?" Lo lógico en este caso es analizar $\log y_{ij}$ y la estimación de $\mu_1 - \mu_2$.

Que no iba a responder a la pregunta, sin embargo. $E\{Y_i\} = \exp (\mu_i+\sigma_i)$. Lo que usted necesita es un intervalo de confianza en $\mu_1-\mu_2 + \sigma_1-\sigma_2$.

Ahora, si en realidad usted está interesado en las cosas en la escala transformada nada de esto se aplica. Que sucede: los químicos y ambientales, los científicos están interesados en el pH (hasta el punto de medir el pH en lugar de $H^+$ concentraciones.)

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X