Processing math: 100%

6 votos

Prueba de hipótesis: Justificación de la prueba de permutación

Contexto: Prueba de hipótesis utilizando pruebas de permutación sobre 2 poblaciones, asumiendo que tomo k1 y k2 elementos de la población 1 y 2, respectivamente, donde k1,k2Z1:

Ho: m1=m2; Ha:m1m2 donde mx se refiere a la mediana de la población x.

Preocupación: En las pruebas de permutación, calcularíamos la estadística de prueba de interés (¯m1¯m2) para cada permutación posible (es decir, (k1+k2)!) y usaríamos el histograma de estos valores como la distribución nula (es decir, distribución de muestreo de la estadística de prueba mencionada bajo la hipótesis nula), utilizándolo para obtener un valor p. Esto parece implicar que al asumir la hipótesis nula anterior, cada permutación de nuestra muestra es igualmente probable, y es esto con lo que no estoy de acuerdo. Me parece que para llegar a esta conclusión, la hipótesis nula tendría que ser mucho más general (es decir, que las dos poblaciones tienen distribuciones idénticas e independientes, como se menciona en http://sphweb.bumc.bu.edu/otlt/mph-modules/bs/bs704_nonparametric/bs704_nonparametric2.html), pero eso también significaría que rechazar la hipótesis nula sería rechazar una hipótesis mucho más amplia y no nuestra hipótesis deseada de que las medianas son iguales (es decir, que las dos poblaciones no tienen distribuciones idénticas e independientes, lo que puede o no significar que tengan la misma mediana).

Resumen de la Preocupación: ¿Qué justifica el uso de la distribución de la estadística de prueba al permutar nuestras muestras para representar la distribución nula anterior?


Estoy asumiendo que hay cierta justificación porque creo que realizamos pruebas de esta manera en mi curso de estadísticas, pero nunca me detuve a reflexionar sobre los pasos del procedimiento para asegurarme de que los entendía completamente.


También una pregunta adicional: ¿Cuando la estadística de prueba observada es 0, se rechaza la hipótesis nula o se falla al rechazar la hipótesis nula? (He leído que siempre se debe asumir que los datos son consistentes con la hipótesis nula por defecto, a menos que tus datos tengan un valor de estadística de prueba observado que se alinee con la hipótesis alternativa y que sea estadísticamente significativo.)

4voto

AdamSane Puntos 1825

Generalmente, las pruebas de hipótesis van acompañadas de suposiciones adicionales que deberán cumplirse (al menos cuando la hipótesis nula es verdadera), de modo que se pueda obtener la distribución nula del estadístico de prueba; esto es tan cierto para las pruebas no paramétricas como para las paramétricas.

Por ejemplo, la prueba t de dos muestras habitual viene con suposiciones de igualdad de varianza e independencia, en las que confiamos al encontrar la distribución nula del estadístico de prueba, incluso si ninguna de estas condiciones está en la hipótesis en sí misma.

Para las pruebas de permutación es necesario añadir al menos las suposiciones requeridas para obtener la intercambiabilidad, aunque típicamente usaríamos suposiciones algo más fuertes (como la independencia, por ejemplo).

0 votos

Para resumir: Hacemos supuestos adicionales "ocultos" sobre nuestro procedimiento de muestreo (por ejemplo, muestra aleatoria con reemplazo) y las poblaciones (por ejemplo, independientes y distribuidas de manera igual) para limitar cómo podría lucir la distribución nula. Esto parece justo dado que, después de todo, estamos tratando de razonar bajo incertidumbre. Pero esto me hace preguntar: ¿Estoy en lo correcto al decir que cuanto más se alejan estos supuestos ocultos de la realidad de la población y el procedimiento de muestreo, más propensos estamos a cometer errores de tipo I y tipo II?

0 votos

También, si es posible, ¿podrías por favor responder la pregunta adicional, también?

0 votos

Otra preocupación: no puedo pensar en un ejemplo específico de un conjunto de suposiciones razonables sobre el procedimiento de muestreo y las poblaciones que asegurarían que la distribución de muestreo de la estadística de prueba (me referiré a esta distribución como p-dist de ahora en adelante) sería aproximadamente idéntica a la verdadera distribución nula, para evitar errores en las conclusiones. En el caso de que los tamaños de muestra sean esencialmente iguales que los tamaños de las poblaciones originales, entonces estoy convencido de que la p-dist será aproximadamente igual a la distribución nula, pero en el caso de que el tamaño de la muestra sea pequeño, no lo estoy.

2voto

Dipstick Puntos 4869

Estás en lo cierto de que estás probando una suposición mucho más amplia de que las etiquetas de grupo son "aleatorias" y no juegan ningún papel en tus resultados. Como proxy para probar dicha hipótesis, utilizas alguna estadística de prueba que se evalúa en las muestras permutadas. En este caso es la mediana, pero también podría ser algo más. Por lo tanto, pruebas si las etiquetas son intercambiables como se prueban usando la mediana como criterio para evaluar eso. Al final, aprenderás cuán "probable" sería encontrar medianas diferentes en ambos grupos si las etiquetas de grupo no jugaran ningún papel en tus datos.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X