4 votos

Prueba de normalidad con un gran conjunto de datos

Creo que estoy tratando este tema http://www.r-bloggers.com/normality-tests-don%E2%80%99t-do-what-you-think-they-do/

Tengo un gran conjunto de datos (10k puntos de datos) que divergen ligeramente de la normalidad, y obtengo un valor p de 0. Estoy interesado en tener quizás una prueba más cruda que me diga si los datos son extremadamente divergentes de la normalidad, frente a los que parecen distribuidos normalmente. Actualmente estoy probando con Kolmogorov-Smirnoff, y en ambos casos sólo obtengo un valor p de 0. ¿Alguna alternativa?

También he mirado esto: ¿Son las pruebas de normalidad "esencialmente inútiles"?

Entonces, teniendo en cuenta todo esto, ¿hay algún tipo de prueba que pueda realizar que distinga entre los datos que son aproximadamente normales y los que no lo son en absoluto?

Estoy usando scipy.

4voto

AdamSane Puntos 1825

una prueba más cruda que me dice si los datos son extremadamente divergentes de lo normal

Es muy probable que no quieras hacer pruebas de hipótesis, ya que no responden a esa pregunta.

Estás tratando de responder a una pregunta relacionada con el "tamaño del efecto" ("¿cuánto se aleja de la normalidad?" es una pregunta del tipo de tamaño del efecto), pero las pruebas de hipótesis no responden a esa pregunta.

Algunas estadísticas de bondad de ajuste (como Whuber sugirió en los comentarios) dan una medida de "qué tan lejos de la normalidad"..., al igual que mirar, por ejemplo, un gráfico Q-Q, como Nick Cox mencionó, pero apuesto a que usted tiene una pregunta más específica que no necesariamente sería bien respondida por el uso de alguna medida esencialmente al azar.

Por ejemplo, quizá tenga una pregunta subyacente más cercana a "¿En qué medida podría afectar a este tipo concreto de inferencia que deseo utilizar el tipo de (y el grado de) no normalidad de la distribución de la que se extrajeron mis datos?"

[La respuesta depende de lo que se quiera hacer. Diferentes formas de inferencia pueden ser sensibles a diferentes aspectos de la distribución, y en diferentes grados. Sería necesario dar más detalles antes de poder dar un consejo útil para una pregunta como esa].

Por supuesto, puedes tener algún otro tipo de pregunta, pero la forma de medir el impacto en lo que sea que estés tratando de hacer dependerá de nuevo de lo que estés tratando de lograr.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X