Estoy tratando de derivar (unilateralmente) intervalos de tolerancia relacionados con el modelo de regresión de Deming: $$ x_i=x^*_i + \epsilon_i $$ $$ y_i = ( \alpha + \beta x^*_i) + \epsilon '_i$$ donde el $x^*_i$ son números fijos no aleatorios, $ \epsilon_i \sim { \cal N}(0, \sigma_x ^2)$ , $ \epsilon '_i \sim { \cal N}(0, \sigma_y ^2)$ y todas las variables $ \epsilon_i , \epsilon '_i$ son mutuamente independientes. La proporción $ \sigma_x ^2/ \sigma_y ^2$ se supone que se conoce. Ponga $ \tau ^2= \sigma_x ^2+ \sigma_y ^2$ .
Dada una nueva "verdad" $x$ valor de '' $x^*_ \text {new}$ Estoy buscando un límite superior de tolerancia de la diferencia $$y_ \text {new} - x_ \text {new} \sim { \cal N}( \alpha +( \beta -1)x^*_ \text {new}, \tau ^2).$$ En realidad, este límite superior de tolerancia no es más que un límite superior $100(1- \alpha )\%$ -confianza ligada a la $100p\%$ -cantidad de $y_ \text {new} - x_ \text {new}$ . En cuanto a los modelos clásicos gausianos, busco una tolerancia que tenga forma $$B(x,y)=( \hat {y^*}_ \text {new} - x^*_ \text {new}) + K s$$ con $ \hat {y^*}_ \text {new} = \hat\alpha + \hat\beta x^*_ \text {new}$ y $s^2= \hat\tau ^2$ . Dotado por $F_ \text {new}$ la función de distribución acumulativa de la diferencia $y_ \text {new} - x_ \text {new}$ , el factor de tolerancia $K$ debe derivarse para que $$ \Pr\left ( F_ \text {new}(B(x,y)) > p \right ) = 1- \alpha $$ para algunos $p \in ]0,1[$ (el nivel de tolerancia) y el nivel de confianza $1- \alpha $ (por supuesto aquí $ \alpha $ no es el parámetro de intercepción $ \alpha $ de la modelo!)
Las estimaciones de $ \alpha $ , $ \beta $ y $ \tau ^2$ así como su matriz de variación asintótica $V$ y una estimación $ \hat V$ de esta matriz de variación asintótica están disponibles en algunos libros de texto y/o documentos de investigación (véase por ejemplo El libro de Fuller o Iles & Gillard's informe 1 y informe2 ). En particular $ \hat\tau ^2$ es asintóticamente independiente de $( \hat\alpha , \hat\beta )$ .
Ahora estoy tratando de derivar la tolerancia limitada por la imitación de la forma utilizada para derivar la tolerancia limitada en un el modelo clásico de regresión. Se basa en el siguiente lema.
Lemma Deje que $W \sim { \cal N}(0, \sigma ^2)$ independiente de $Q \sim \frac { \chi ^2_{d}}{d}$ . Entonces el número $K>0$ satisfactoria $$ \Pr\left ( \Phi (W+K \sqrt {Q}) > p \right ) =1- \alpha $$ está dada por una fórmula conocida $K=K( \sigma ,d,p, \alpha )$ (ver El libro de Krishnamoorthy y Mathew ).
Ahora pon $X_ \text {new}=(1,x_ \text {new})'$ . Uno tiene las tres variables aleatorias asintóticamente independientes $$ \frac {(y_ \text {new} - x_ \text {new} ) - ( \alpha +( \beta -1)x^*_ \text {new})}{ \sqrt { \tau ^2}} \sim { \cal N}(0,1),$$ $$ \frac {( \hat {y^*}_ \text {new} - x^*_ \text {new} ) - ( \alpha +( \beta -1)x^*_ \text {new})}{ \sqrt { \tau ^2}} \sim { \cal N} \left (0, \frac {X_ \text {new}'VX_ \text {new}}{ \tau ^2} \right ),$$ $$ \frac {s^2}{ \tau ^2} \sim \frac { \chi ^2_{n-2}}{n-2}$$
La definición de $K$ se convierte en $$ \Pr\left ( \Phi (W+K \sqrt {Q}) > p \right ) =1- \alpha $$ con $W \sim { \cal N} \left (0, \frac {X_ \text {new}'VX_ \text {new}}{ \tau ^2} \right )$ independiente de $Q \sim \frac { \chi ^2_{n-2}}{n-2}$ .
Aplicando el lema que obtenemos $K$ dependiendo de los valores desconocidos de $ \tau $ y $V$ . Sustituyendo con las estimaciones $ \hat\tau $ y $ \hat V$ da un factor de tolerancia aproximado $ \hat K$ .
Bueno, lo he hecho y he implementado todo en R. Pero la evaluación del rendimiento de mi tolerancia ligada a la simulación muestra que incluso con grandes tamaños de muestra no funciona excepto por el caso $ \beta =1$ . Estoy bastante seguro de mis fórmulas para las estimaciones y las matrices de varianza ya que también he implementado intervalos de confianza e intervalos de predicción y funcionan bien.
EDITAR: ¡De hecho, eso funciona! Hubo un error tonto en el código R que usé para las simulaciones. ¿Debería borrar este mensaje? Creo que no, porque el método podría interesar a otros.