2 votos

Demuestre este teorema relacionado con las pruebas de especificación

No soy matemático y necesito demostrar lo que dice este teorema. Creo que es fácil y sé cómo funciona, pero en definitiva no soy demasiado riguroso para hacer una demostración. ¿Alguien puede ayudarme?

Lo anuncio:

Si la estadística de la prueba tiene una distribución continua, entonces bajo H0 : = 0, el valor p tiene una distribución Uniforme[0, 1]. Por lo tanto, si rechazamos H0 cuando el valor p es menor que , la probabilidad de un error de tipo I es .

  • Por lo tanto, cuando H0 es verdadera, el valor p es como un sorteo de un Uniforme[0, 1].

  • Por otro lado, si H0 no es cierta, la distribución del valor p tiende a concentrarse más cerca de 0.

  • Un valor p grande puede ocurrir por dos razones:

    • H0 es verdadera, o
    • H0 es falsa, pero la prueba tiene poca potencia
  • No confunda el valor p con P(H0 | datos). El valor p no es la probabilidad de que la hipótesis nula sea verdadera.

¡Muchas gracias!

2voto

Awais Tariq Puntos 116

Tu teorema se deriva básicamente del resultado de la estadística teórica de que, para una variable aleatoria continua X con función de distribución acumulativa F, F(X) tiene una distribución uniforme. Eso es porque su valor p es $1-F_s(S)$ , donde $S$ es la estadística de la prueba y $F_s$ es la distribución de $S$ bajo la hipótesis nula.

La prueba es la siguiente:

Supongamos que $X$ tiene cdf $F$ . Entonces

$$ Prob(F(X) \leq t) = Prob(X \leq F^{-1}(t))=F(F^{-1}(t))=t$$

Y esa es la definición de un uniforme: $Prob(U \leq t) = t$ , para $t \in [0.1]$ .

¿Por qué importa que $X$ ser continua? Si $X$ tiene masas puntuales discretas de probabilidad, entonces $F$ puede no tener una inversa para cada valor posible de $t$ en el intervalo de la unidad.

Una variable aleatoria continua que se comporta bien tendrá una fdc estrictamente monótona sobre su dominio, y la inversa estará bien definida.

No estoy tan seguro de la afirmación de que la distribución del valor p tiende a 0 siempre y en todas partes cuando el nulo es falso. Consideremos una tabla de contingencia con recuentos de celdas demasiado regulares. El valor de chi-cuadrado será muy pequeño y el valor p cercano a uno.

Admito que es un ejemplo artificial, y funciona en parte porque la prueba de chi-cuadrado es unilateral.

Yo matizaría tu punto sobre las razones de los grandes valores p añadiendo "la prueba no fue diseñada para detectar la alternativa que realmente ocurrió". En efecto, ése es el problema de la prueba de chi-cuadrado en una tabla de contingencia: no está diseñada para detectar datos "amañados" con distribuciones de celdas demasiado uniformes.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X