Por lo que he oído decir que no es una buena idea elegir una prueba estadística sobre la base del resultado de la otra. Esto parece extraño para mí, sin embargo. Por ejemplo, la gente suele elegir a utilizar una prueba paramétrica cuando alguna otra prueba sugiere que los residuos no están distribuidos normalmente. Este enfoque parece bastante ampliamente aceptado, pero no parecen estar de acuerdo con la primera frase de este párrafo. Yo estaba solo con la esperanza de obtener una aclaración sobre este tema.
Respuestas
¿Demasiados anuncios?Dado que el $p$ es la probabilidad de observar los datos de este extremo o más extrema si $H_0$ es cierto, entonces ¿cuál es la interpretación de $p$ cuando la $p$ se llega a través de un proceso donde hubo un contingente de decisión en la selección de la prueba producida que $p$? La respuesta es incognoscible (o al menos muy cerca incognoscible). Al tomar la decisión de ejecutar la prueba o no sobre la base de algunos otros probabilístico proceso que has hecho, la interpretación de sus resultados aún más complicado. $p$ valores son máximamente interpretables cuando el tamaño de la muestra y plan de análisis fue seleccionado de antemano. En otras situaciones, las interpretaciones se ponen difíciles, es por eso que "no es una buena idea'. Que siendo dicho, es una práctica ampliamente aceptada... después de todo, ¿por qué molestarse para ejecutar una prueba de que si usted descubre que la prueba que había planeado para funcionar no era válido? La respuesta a esa pregunta es mucho menos cierto. Todo esto se reduce al simple hecho de que la hipótesis nula pruebas de significación (el caso de uso principal de $p$) tiene algunos problemas que son difíciles de superar.
Los principales problemas han sido bien explicado por otros, pero son confundidos con subyacente o asociados
Sobre-la reverencia por los valores de P, a más de un tipo de evidencia en las estadísticas.
La renuencia a ver que los informes estadísticos son, inevitablemente, basado en una combinación de opciones, algunas firmemente basada en la evidencia, otros sobre la base de una mezcla de los anteriores análisis, la intuición, las conjeturas, el juicio, la teoría, así sucesivamente.
Supongamos que yo y mi cauteloso amigo de la Prueba de Todo lo que ambos escogieron una transformación logarítmica para una respuesta, pero me salto a esa conclusión basado en una mezcla de física del razonamiento y de la experiencia anterior con los datos, mientras que la Prueba de Todo lo que elige registro de escala basada en los Box-Cox pruebas y la estimación de un parámetro.
Ahora bien, ambos utilizan la misma regresión múltiple. Hacer nuestros los valores de P tienen interpretaciones diferentes? En más de una interpretación, de la Prueba de Todo lo que los P-valores son condicionales en su anterior inferencias. He utilizado inferencias demasiado, pero en su mayoría fueron informal, basado en una larga serie de los anteriores gráficos, cálculos, etc. en proyectos anteriores. Cómo es que para estar informado?
Naturalmente, los resultados de la regresión son exactamente los mismos para la Prueba de Todo y de mí mismo.
La misma mezcla de consejo sensato y dudosa filosofía se aplica a la elección de los predictores y la forma funcional. Los economistas, por ejemplo, son ampliamente enseñados a respetar anterior de los debates teóricos y a desconfiar de espionaje de datos, con buena razón en cada caso. Pero en los más débiles de los casos, la teoría en cuestión es sólo una sugerencia tentativa hecha previamente en la literatura, muy probablemente después de algunos análisis empíricos. Pero la literatura referencias santificar, mientras que el aprendizaje a partir de los datos en la mano es sospechoso, para muchos autores.
Por ejemplo, la gente suele elegir a utilizar una prueba paramétrica cuando alguna otra prueba sugiere que los residuos no están distribuidos normalmente. Este enfoque parece bastante ampliamente aceptado, pero no parecen estar de acuerdo con la primera frase de este párrafo. Yo estaba solo con la esperanza de obtener una aclaración sobre este tema.
Sí, un montón de personas que hacen este tipo de cosas, y cambiar su segunda prueba a la que se puede lidiar con heterocedasticidad cuando rechazan la igualdad de la varianza, y así sucesivamente.
Sólo porque algo es común, no significa que sea necesariamente sabio.
De hecho, en algunos lugares (no voy a nombrar el peor infractor disciplinas) mucho de este formales de la prueba de hipótesis depende formal de la prueba de hipótesis es que realmente se enseña.
El problema con esto es que los procedimientos no tienen su valor nominal de las propiedades, a veces ni siquiera cerca. (Por otro lado, suponiendo que las cosas así, sin consideración de potencialmente extrema violación podría ser incluso peor.)
Varios trabajos sugieren que para la heteroskedastic caso, es mejor que simplemente actúa como si las varianzas no son iguales que para la prueba de ella y sólo de hacer algo acerca de ello en el rechazo.
En la normalidad caso es menos claro. En muestras grandes, al menos, en muchos casos, la normalidad no es tan crucial (pero, irónicamente, con grandes muestras, la prueba de normalidad es mucho más propensos a rechazar), mientras que la no-normalidad no es demasiado salvaje. Una excepción es para los intervalos de predicción, donde usted realmente necesita su distribución supuesto de estar cerca de la derecha.
En parte, uno de los problemas es que las pruebas de hipótesis de contestar una pregunta diferente que el que debe ser contestada. Usted realmente no necesita saber 'es que los datos realmente normal" (casi siempre, no será muy normal que a priori). La pregunta es más bien "lo mal que va el alcance de la no-normalidad de impacto mi inferencia'.
La segunda cuestión es generalmente justo sobre independiente del tamaño de la muestra o en realidad se pone mejor con el aumento de tamaño de la muestra - sin embargo, las pruebas de hipótesis casi siempre rechazar en tamaños de muestra grandes.
Hay muchas situaciones donde hay robusta o incluso la distribución gratuita de los procedimientos que están muy cerca plenamente eficaz, incluso en la normal (y, potencialmente, mucho más eficiente en algunos bastante modesto salidas de ella) -, en muchos casos, parece tonto, no tomar el mismo criterio de prudencia.