23 votos

¿Cómo calcular las bandas de predicción para la regresión no lineal?

En página de ayuda para Prism da la siguiente explicación de cómo calcula las bandas de predicción para la regresión no lineal. Disculpe la cita tan larga, pero no entiendo el segundo párrafo (que explica cómo $G|x$ se define y $dY/dP$ ). Cualquier ayuda será muy apreciada.

El cálculo de la confianza y la predicción estándar. Siga leyendo para conocer los detalles de cómo Prism calcula las bandas de predicción y de confianza de la regresión no lineal.

En primer lugar, definamos G|x, que es el gradiente de los parámetros en a valor particular de X y utilizando todos los valores de mejor ajuste de los parámetros parámetros. El resultado es un vector, con un elemento por parámetro. Para cada parámetro, se define como dY/dP, donde Y es el valor Y de la curva dado el valor particular de X y todos los valores de los parámetros que mejor se ajustan. y P es uno de los parámetros).

G'|x es ese vector gradiente transpuesto, por lo que es una columna en lugar de una fila de valores.

Cov es la matriz de covarianza (hessiana invertida de la última iteración). Es una matriz cuadrada con el número de filas y columnas igual al número de parámetros. Cada elemento de la matriz es la covarianza entre dos parámetros.

Ahora calcule c = G'|x * Cov * G|x. El resultado es un único número para cualquier valor de X.

La confianza y la pred y se extienden por encima y por debajo de la curva en igual medida.

Las bandas de confianza se extienden por encima y por debajo de la curva en: = sqrt(c)*sqrt(SS/DF)*CriticalT(Confianza%, DF)

Las bandas de predicción se extienden una distancia mayor por encima de un curva, igual a: = sqrt(c+1)*sqrt(SS/DF)*T(Confianza%, DF)

26voto

simmosn Puntos 304

Es el llamado método Delta.

Supongamos que tenemos una función $y = G(\beta,x) + \epsilon$ Tenga en cuenta que $G(\cdot)$ es una función de los parámetros estimados, $\beta$ y los valores de sus predictores, $x$ . Primero, halla la derivada de esta función con respecto a tu vector de parámetros, $\beta$ : $G^\prime(\beta, x)$ . Esto dice, si cambias un parámetro un poco, ¿cuánto cambia tu función? Tenga en cuenta que esta derivada puede ser una función de los propios parámetros, así como de los predictores. Por ejemplo, si $G(\beta,x) = \exp (\beta x)$ entonces la derivada es $x \exp (\beta x)$ que depende del valor de $\beta$ y el valor de $x$ . Para evaluarlo, se introduce la estimación de $\beta$ que da su procedimiento, $\hat{\beta}$ y el valor del predictor $x$ donde desea la predicción.

El método Delta, derivado de los procedimientos de máxima verosimilitud, establece que la varianza de $G\left(\hat{\beta}, x\right)$ va a ser $$G^\prime\left(\hat{\beta},x\right)^T \text{Var}\left(\hat{\beta}\right) G^\prime\left(\hat{\beta},x\right),$$ donde $\text{Var}\left(\hat{\beta}\right)$ es la matriz de varianza-covarianza de sus estimaciones (es igual a la inversa de la hessiana: las segundas derivadas de la función de verosimilitud en sus estimaciones). La función que emplean sus paquetes estadísticos calcula este valor para cada valor diferente del predictor $x$ . Esto es sólo un número, no un vector, para cada valor de $x$ .

Esto da la varianza del valor de la función en cada punto y se utiliza como cualquier otra varianza para calcular los intervalos de confianza: se toma la raíz cuadrada de este valor, se multiplica por el valor crítico de la normal o aplicable t relevante para un nivel de confianza concreto, y sumar y restar este valor a la estimación de $G(\cdot)$ en el punto.

Para los intervalos de predicción, necesitamos tomar la varianza del resultado dados los predictores $x$ , $\text{Var}(y \mid x) \equiv \sigma^2$ en cuenta. Por lo tanto, debemos aumentar nuestra varianza del Método Delta por nuestra estimación de la varianza de $\epsilon$ , $\hat{\sigma}^2$ para obtener la varianza de $y$ en lugar de la varianza del valor esperado de $y$ que se utiliza para los intervalos de confianza. Obsérvese que $\hat{\sigma}^2$ es la suma de los errores al cuadrado ( SS en notación del archivo de ayuda) dividido por los grados de libertad ( DF ).

En la notación utilizada en el archivo de ayuda anterior, parece que su valor de c no toma $\sigma^2$ es decir, la inversa de su hessiano es $\sigma^{-2}$ veces el que yo doy. No estoy seguro de por qué lo hacen. Podría ser una forma de escribir los intervalos de confianza y predicción de una forma más familiar (de $\sigma$ por algún número por algún valor crítico). La varianza que doy es en realidad c*SS/DF en su notación.

Por ejemplo, en el caso familiar de la regresión lineal, su c sería $\left(x^\prime x\right)^{-1}$ mientras que el $\text{Var}\left(\hat{\beta}\right) = \sigma^2 \left(x^\prime x\right)^{-1}$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X