6 votos

¿Cuáles son las características deseables de una estadística de prueba?

He visto definiciones de estadísticas que combinan múltiples términos de una manera muy específica. ¿Cuáles son las ventajas de estas expresiones y por qué no utilizar cualquier cálculo en los datos? Por ejemplo, ¿por qué se utilizan formas específicas como para la prueba t, la prueba F, Jarque-Bera, ...?

¿Tiene que ser independiente de algunas propiedades de los datos? ¿Son algunas estadísticas más poderosas?

2voto

RGA Puntos 113

Para que una estadística de prueba sea una prueba estadística es necesario conocer la distribución de la muestra de esa estadística si la hipótesis nula es cierta. Para algunas estadísticas es más fácil derivar (asintóticamente) cuál sería esa distribución, y a esas estadísticas se les ha dado nombres como t-estadística, F-estadística, etc. Existen muchas estadísticas de prueba diferentes porque muchas sólo prueban diferentes hipótesis nulas. A veces la diferencia es enorme, a veces la diferencia es extremadamente sutil. A veces diferentes estadísticas de prueba prueban exactamente la misma hipótesis. En esos casos la diferencia podría ser el poder estadístico, y a veces resulta ser la misma prueba desarrollada dentro de diferentes subdisciplinas de la estadística y con diferentes nombres.

0voto

Colin Wren Puntos 11

tl;dr: su prueba necesita tener poder estadístico, el concepto de poder estadístico invalida toda la razón de ser de la prueba de hipótesis nulas

Suponga que ha hecho un experimento en un laboratorio y quiere probar un efecto. ¡Un anatema! ¿No sabes que sólo puedes rechazar la ausencia de un efecto? ¿No has leído a Popper? ¿No sabes que no es científico tratar de confirmar nada, sólo puedes tratar de refutar las cosas .

Muy bien dice usted, así que concibe una hipótesis nula, construye una estadística alrededor de ella, y prueba la probabilidad de obtener un valor tan extremo bajo la hipótesis nula. Sin embargo, encuentras el proceso tedioso, y te preguntas si podrías automatizarlo un poco más.

Entonces tienes una idea brillante. Para rechazar la hipótesis nula, escribirás un informe sobre tu experimento (con los datos). Luego, pondrá ese informe a través de un función criptográfica de hash como el sha2. Como este hash es muy impredecible, si no hay efecto, los primeros 6 bits sólo serán 0 alrededor de 1/128 del tiempo.

Por lo tanto, ahora tienes una prueba de hipótesis nula universal. Haz tu papel, y comprueba si los primeros 6 bits son 0. Si no lo son, entonces puedes rechazar la hipótesis nula en p=0.78%. Esto sugiere que puede haber un efecto, donde de alguna manera el molde de baba que has estado estudiando está invirtiendo la función de hash.

Por supuesto, en realidad, tienes un 0,78% de posibilidades de rechazar la hipótesis nula, y todos tus rechazos serán casualidades. Se dice que tu prueba no tiene ningún poder .

Muy bien, entonces, ¡utilicemos pruebas que tengan poder! ¿Y cómo lo hacemos? Bueno, necesitamos una idea de lo que pasaría si hubiera un efecto, veamos... ¡Horror! ¡Desesperación! Parece que debemos modelar nuestra hipótesis real... pero... eso es indeciblemente poco científico. ¡Hume demostró que la inducción era imposible!

Ahí está el sucio secreto. Todo el concepto de prueba de hipótesis nulas es una contorsión usada para mantener la pretensión de que no estamos haciendo suposiciones sobre el efecto que buscamos, que simplemente estamos rechazando hipótesis. Tonterías. El efecto se modela implícitamente en el momento en que empezamos a preocuparnos por el poder de la prueba.

0voto

John Fultz Puntos 576

Desde una perspectiva más introductoria, algunas pruebas son útiles con algunos datos y otras no. Por ejemplo, si tus datos están normalmente distribuidos (o si estás mirando los medios de muestras de más de 30 de tamaño) puedes usar una prueba Z. Son fáciles de calcular.

Si se ve obligado a utilizar una muestra pequeña, una mejor distribución en la que apoyarse es la distribución T, que tiene en cuenta el tamaño de la muestra. Pero una vez que el tamaño de la muestra es lo suficientemente grande, la distribución T comienza a parecerse a la Z (la curva normal).

Puedes construir un CI del 95% y luego calcular la T y encontrar que están de acuerdo: la media está en el intervalo de confianza - la T no es lo suficientemente grande como para rechazarla. No todo es T, pero especialmente en el nivel de intro stat, se trata de la cantidad de datos que tienes, la distribución de los datos, y lo que estás pidiendo.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X