15 votos

¿Se aplica el "No almuerzo gratis teorema" a general pruebas estadísticas?

Una mujer que trabajaba, me pidió hacer un ANOVA de una vía en algunos datos. Me respondió que los datos de medidas repetidas (series de tiempo) de datos, y que yo pensaba que el supuesto de independencia fue violado. Ella respondió que no debo preocuparme de los supuestos, acabo de hacer la prueba y que ella tendría en cuenta que la hipótesis puede que no se han cumplido.

Que no me parece correcto para mí. Me puse a investigar, y encontré este maravilloso post del blog de David Robinson, K-means clustering no es una comida gratis, que me expuestos a la que nada es Gratis en Teorema. He mirado en el documento original y algunos siguen en la materia, y, francamente, las matemáticas es un poco por encima de mi cabeza.

El quid de la cuestión-de acuerdo a David Robinson-parece ser que la potencia de una prueba estadística proviene de sus supuestos. Y da dos ejemplos. Como me meto a través de los artículos y entradas de blog sobre ella, parece que siempre se hace referencia en términos de aprendizaje supervisado o de búsqueda.

Así que mi pregunta es, ¿ este teorema se aplican a las pruebas estadísticas en general? En otras palabras, se puede decir que el poder de un t-test o test de ANOVA viene de su adhesión a la hipótesis, y citan los Hay Almuerzo Gratis Teorema?

Me debo a mi ex jefe de un documento final sobre el trabajo que yo hacía, y me gustaría saber si me puede hacer referencia a la No hay Almuerzo Gratis Teorema que indica que usted simplemente no puede ignorar la hipótesis de un estadístico de prueba y diga que va a tener en cuenta a la hora de evaluar los resultados.

13voto

dan90266 Puntos 609

No sé de una prueba, pero apuesto a que esto se aplica bastante en general. Un ejemplo es un experimento con 2 sujetos en cada uno de los 2 grupos de tratamiento. El test de Wilcoxon, no puede ser, posiblemente, significativa a nivel de 0.05, pero la prueba de t puede. Se podría decir que su poder viene más de la mitad de sus supuestos, y no sólo a partir de los datos. Para el problema original, no es conveniente proceder como si las observaciones por sujeto, son independientes. A tomar las cosas en cuenta después de que el hecho no es, ciertamente, una buena práctica de la estadística, excepto en circunstancias muy especiales (por ejemplo, en el grupo de sándwich estimadores).

2voto

Jon Smock Puntos 3921

Usted puede citar la Hay Almuerzo Gratis Teorema si quieres, pero también se puede simplemente citar el Modus Ponens (también conocida como la Ley del Desapego, la base del razonamiento deductivo), que es la raíz de la que nada es Gratis en Teorema.

Los Hay Almuerzo Gratis Teorema de abarcar más específica de la idea: el hecho de que no hay ningún algoritmo que puede adaptarse a todos los efectos. En otras palabras, No hay Almuerzo Gratis Teorema es, básicamente, diciendo que no hay algorítmica de la bala mágica. Esto raíces en el Modus Ponens, porque para que un algoritmo o una prueba estadística para dar el resultado correcto, usted necesita para satisfacer las premisas.

Al igual que en todos los teoremas matemáticos, si usted viola las premisas, entonces el estadístico de prueba es sólo vacía de sentido, y usted no puede derivar la verdad de ella. Así que si usted desea explicar sus datos a través de la prueba, usted debe asumir que las necesarias premisas se cumplen, si no lo son (y usted sabe que), luego de su prueba es absolutamente incorrecto.

Eso es porque el razonamiento científico se basa en la deducción: básicamente, la prueba/la ley/teorema es una implicación de la regla, que dice que si tienes el premisse A a continuación, se puede concluir B: A=>B, pero si usted no tiene A, entonces usted puede tener B o no B, y en ambos casos son verdaderas, que es uno de los principios básicos de la inferencia lógica/deducción (el Modus Ponens de la regla). En otras palabras, si usted viola las premisas, el resultado no importa, y usted no puede deducir cualquier cosa.

Recuerde que la tabla binaria de la implicación:

A   B   A=>B
F   F    T
F   T    T
T   F    F
T   T    T

Así que, en su caso, para simplificar, usted tiene Dependent_Variables => ANOVA_correct. Ahora, si el uso de variables independientes, por lo tanto Dependent_Variables es False, entonces la implicación es verdadera, ya que el Dependent_Variables supuesto es violado.

Por supuesto, esto es simplista, y en la práctica de su prueba de ANOVA todavía puede devolver resultados útiles porque casi siempre hay un cierto grado de independencia entre las variables dependientes, pero esto le da la idea de por qué simplemente no se puede confiar en la prueba sin el cumplimiento de los supuestos.

Sin embargo, también puede utilizar las pruebas de que las premisas no son satisfechas por el original por la reducción de su problema: explícitamente que la relajación de la independencia de restricción, su resultado puede ser aún significativa, althrough no garantizada (porque entonces sus resultados se aplican a la reducción de su problema, no el total de problema, por lo que no se puede traducir todos los resultados excepto si usted puede demostrar que las limitaciones de los nuevos problemas no afectan su prueba y por lo tanto sus resultados).

En la práctica, esto se utiliza a menudo para el modelo de datos prácticos, mediante el uso de Bayes Naive por ejemplo, mediante la modelización de la dependiente (en lugar de independiente) variables mediante un modelo que supone que las variables independientes, y , sorprendentemente, funciona a menudo muy bien, y a veces mejor que los modelos de contabilidad para las dependencias. Usted también puede estar interesado por esta cuestión acerca de cómo utilizar ANOVA cuando los datos no cumplen exactamente con todas las expectativas.

Resumen: si usted tiene la intención de trabajar en la práctica de los datos y su objetivo no es probar que cualquier resultado de la ciencia, pero para hacer un sistema que sólo funciona (es decir, un servicio web o cualquier aplicación en la práctica), los relativos a la independencia de la asunción (y tal vez otros supuestos) puede ser relajado, pero si usted está tratando de deducir/probar alguna verdad general, entonces usted debe utilizar siempre las pruebas que usted puede matemáticamente garantía (o, al menos, de forma segura y seguramente supongo) que satisfacer todas las premisas.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X