¿Alguien puede decirme cómo obtener el 95% de intervalos de confianza para las coordenadas x e y del vértice (pico en mi caso) de una ecuación cuadrática en forma? Es allí una manera de conseguir estos CIs en R? Gracias.
Respuestas
¿Demasiados anuncios?Hay varias maneras de abordar este problema, pero la más sencilla que se me ocurre es esta:
Si la población de la ecuación es $y = \alpha x^2 + \beta x + \gamma$
a continuación, el vértice está en $x_v = -\frac{\beta}{2\alpha}$ (como $\alpha\neq 0$)
Equivalentemente, $2\alpha x_v-\beta=0$.
En consecuencia, el amueblada ecuación es $\hat y = a x^2 + b x + c$
y la estimación de su vértice está en $\hat{x}_v = -\frac{b}{2a}$ (si $a\neq 0$).
En consecuencia, un conjunto de valores que forman una $1-\alpha$ intervalo de confianza (tal vez mejor llamado consonancia intervalo, en este caso) por $x_v$ son los valores, $d$, lo que daría como resultado la aceptación de:
$H_0: 2\alpha d-\beta=0$
con un nivel de significación $\alpha$.
Un conjunto de valores que puede ser construido relativamente fácilmente. (De hecho, uno no necesita siquiera ser muy inteligente al respecto, ya que sin realizar ningún tipo de álgebra podemos trabajar nuestro camino de $\hat{x}_v$ hasta que la decisión sobre la prueba de hipótesis de los cambios de rechazo y, a continuación, realizar una búsqueda binaria, aunque se supone que el conjunto de los valores resultantes en la forma de aceptación de un solo intervalo.)
Sin embargo, a mí me parece que es razonablemente analíticamente sencillo, ya que podemos, para todas las $d$, escribir un t-intervalo y en un nivel de significación, para $2\alpha d-\beta$; lo que implicará $d$, tanto en el numerador y denominador de la estadística t, simples manipulaciones de rendimiento de una desigualdad cuadrática en $d$, $Q(d)<0$.
La igualdad se resuelve fácilmente (la participación de los coeficientes en términos de $a$, $b$ y sus varianzas y covarianzas), y es entonces una cuestión de comprobar que $Q(\hat x_v)$ es negativo y se encuentra entre los puntos de la igualdad, donde usted tiene un simple intervalo de valores de $x_v=d$ que no llevaría al rechazo y que contiene el ingenuo punto de estimación $Q(\hat x_v)$.
(crítica de esta idea se anima; que bien puede ser que falte alguna cuestión obvia)
Un segundo enfoque sería para simular o arranque de la distribución de $\hat x_v$.
El bootstrap de distribución de $\hat x_v$ podría ser obtenido por remuestreo (con reemplazo) $n$ filas de la aumentada de la matriz de datos de $A=[X|y]$ y el cálculo de la pseudo-punto de la muestra la estimación de $\hat x_v^*$ cada vez; hay varias técnicas para la generación de un intervalo de eso, incluyendo la relativamente sencillo 'tomar el centro $1-\alpha$ de la repetición de muestreo de la distribución de $\hat x_v^*$'.
Otra forma de bootstrap sería un bootstrap paramétrico (básicamente un tipo de simulación) - una manera de hacerlo: si nos condición observadas en las $x$, se podría simular a partir de la distribución de $y-\hat y$ generar nuevas muestras, $y^*$ y proceder de manera similar a lo que el test no paramétrico de bootstrap por encima (pero aquí estamos simulando sólo el ruido y el estado en $x$, en lugar de la bivariante $(X,y)$.
La simulación se puede realizar en un número de otras maneras. Podríamos por ejemplo, simular la distribución de $-\frac{\hat\beta}{2\hat\alpha}=-\frac{b}{2a}$ bajo condiciones normales de supuestos y el mismo patrón de $x$s, aunque creo que la forma de la que podría depender de $\sigma$ (mejor si algunos de los fundamental a la cantidad que se utiliza como base para la simulación).
Dado que estamos tratando de encontrar un intervalo para un determinado $x$, otra forma de mirar el problema, es como una especie de inversa de regresión problema, pero hay algunos detalles para ordenar aquí.
Referencia:
Florenz Plassmann y Neha Khanna (2007)
La evaluación de la Precisión de Punto de Inflexión Estimaciones de Regresión Polinomial Funciones
Econométricos Comentarios, vol. 26, número 5, páginas 503-528
La versión de 2003 de papel aquí
discute 3 enfoques:
a) expansión de Taylor/método Delta
b) cálculo basado en suponiendo que los coeficientes estimados son bivariante normal
c) muestra Finita estimaciones basadas en MCMC
Existen diferentes enfoques que sería bastante recta hacia adelante.
Una opción sería para adaptarse a la utilización de los no-lineal de mínimos cuadrados en donde el vértice es uno de los parámetros (por ejemplo y = a + b*(x-c)^2 ). A continuación, puede utilizar perfiles para calcular un intervalo de confianza del parámetro de interés.
Otra opción es hacer un ajuste Bayesiano utilizando métodos McMC y estimación de las coordenadas x e y de los vértices de cada iteración y el uso de los valores para estimar la parte posterior y creíble intervalo.
O, si los residuos se asume como normal (o al menos lo suficientemente cerca), a continuación, la estimación de los coeficientes del modelo lineal siguen una distribución normal multivariante. Usted puede generar muchas observaciones a partir de esta distribución, calcular las coordenadas x e y de los vértices de estos valores y las usan para estimar la distribución de los puntos de vértice y calcular el intervalo de confianza de que.