2 votos

Aclaración sobre los supuestos de la prueba t

No entiendo muy bien los supuestos del Prueba t Wikipedia da. Actualmente estoy tomando un curso de introducción a la estadística, y cuando cubrimos las pruebas t, aprendimos que los supuestos para una prueba t son que:

  1. Se supone que la población se distribuye normalmente
  2. Las muestras son aleatorias
  3. Si hay una desviación de cualquiera de los anteriores, el tamaño de la muestra debe ser mayor.

¿Son equivalentes a los tres que aparecen en la Wikipedia?

Supuestos dados por Wikipedia:

Los supuestos en los que se basa una prueba t son que

  • $X$ sigue una distribución normal con media $\mu$ y la varianza $\sigma^2$
  • $s^2$ sigue un $^2$ distribución con $p$ grados de libertad bajo la hipótesis nula, donde $p$ es una constante positiva
  • $Z$ y $s$ son independientes.

6voto

AdamSane Puntos 1825

¿Qué hace que algo sea una suposición?

Para calcular la distribución muestral de la estadística de la prueba bajo la hipótesis nula, se requieren algunos supuestos. En el caso de los estadísticos t "estándar" (los que realmente tienen distribuciones t si se cumplen las condiciones), si tiene observaciones normales independientes e idénticamente distribuidas (o diferencias de pares normales iid en el caso de una prueba emparejada), entonces el estadístico t tendrá una distribución t.


Ninguna de las listas que das funciona del todo como lista de supuestos para la prueba t.

  1. Se supone que la población se distribuye normalmente
  2. Las muestras son aleatorias

bien hasta ahora

  1. Si hay una desviación de cualquiera de los anteriores, el tamaño de la muestra debe ser mayor.

Esto no es una suposición de la prueba t -- es un consejo sobre lo que se necesita si la suposición de normalidad no se cumple (aunque no sirve de nada si la suposición 2 no se cumple), y entonces no es $t$ en cualquier caso; habría que invocar dos resultados (CLT + Slutsky) para argumentar que la estadística sería asintóticamente normal.

  • $X$ sigue una distribución normal con media $\mu$ y la varianza $\sigma^2$

Bueno, en realidad también necesitas independencia. Una vez que añades eso (que está relacionado con tu suposición de "muestreo aleatorio"), estás listo.

  • $s^2$ sigue un $χ^2$ distribución con $p$ grados de libertad bajo la hipótesis nula, donde $p$ es una constante positiva

Esto es una consecuencia de la primera suposición (una vez que se añade la independencia que falta)

  • $Z$ y $s$ son independientes.

Esto es también una consecuencia de la primera hipótesis (de nuevo, una vez que se añade la independencia que falta)

0voto

konus Puntos 123

Los dos conjuntos de supuestos no son idénticos, pero se solapan. Estos son los supuestos relevantes para las pruebas t sobre medias (no todas las pruebas t son sobre medias, por ejemplo, una prueba de correlación)

1) Las observaciones son variables aleatorias que están distribuidas de forma independiente e idéntica (iid).

Esto se aborda parcialmente en el supuesto número 2 de su clase (la parte aleatoria). La parte aleatoria no se indica claramente en la lista de la wikipedia, aunque véase más abajo lo relativo a la distribución idéntica.

2) Las observaciones proceden de una población con distribución normal.

El hecho de que la población se distribuya normalmente aparece en ambos conjuntos. La sutil diferencia entre los dos es que la versión de la wikipedia afirma que hay parámetros fijos de media y varianza, lo que implica que la media y la varianza de la población son constantes de una observación a otra (idénticamente distribuidas, como en el punto 1). Probablemente, esto está implícito, pero no se indica explícitamente en la hipótesis equivalente de su clase.

3) Si se toma una muestra de más de una población, las poblaciones tienen varianzas iguales (homogeneidad de varianza).

Esto no se indica en ninguna de las dos listas. En el caso del ejemplo de la wikipedia podría ser porque la fórmula está escrita para el caso de una sola muestra. Se podría considerar simplemente una extensión del punto 1, pero a menudo lo veo enumerado por separado.

OTRAS COSAS

A) El tercer supuesto que enumeras para tus cosas de clase es en parte incorrecto. Si bien es cierto que las muestras más grandes proporcionan cierta solidez contra la no normalidad, no es cierto que protejan contra el muestreo sesgado. Si tus observaciones no son una muestra aleatoria de la población, no creo que puedas arreglar el problema tomando una muestra más grande. En cualquier caso, el hecho de que las muestras más grandes puedan ser mejores en algunas circunstancias no es una SUPOSICIÓN de la prueba. Como mucho es una propiedad.

B) La segunda y tercera hipótesis de Wikipedia son unas que no he visto antes. Creo que están aseguradas en el caso de las pruebas t sobre una media en virtud de los otros supuestos que he enumerado (en particular, la naturaleza chi-cuadrado de s-cuadrado surge del supuesto de la normalidad de X en las pruebas de medias).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X