3 votos

Qué se puede decir de la superposición de dos distribuciones de probabilidad

Supongamos que tengo información sobre las siguientes dos distribuciones normales:

Red   { Mean = 7.4, Std = .501 }
Green { Mean = 9.7, Std = .465 }

¿Qué puede decirse de la zona de solapamiento representada en el diagrama siguiente?

Green and Red Balls

El área de solapamiento es del 9%.

La pregunta que intento responder es si la probabilidad de que el valor verdadero del Verde en la población sea mayor que el valor verdadero del Rojo en la población.

Me gustaría poder hacer una reclamación del tipo Hay al menos un 91% de probabilidades de que el Verde sea mayor que el Rojo en la población. ¿Es esa afirmación exacta?

¿Cuál es el significado estadístico o la explicación de este solapamiento en este contexto?

Edición: He simplificado la pregunta y he eliminado la información superflua. Espero que quede más claro.

2voto

Hoogendijk Puntos 45

Para que el solapamiento tenga sentido, tendría que ser relevante para alguna hipótesis o pregunta sobre los datos.

Para ello vamos a suponer un contexto para hacer un ejemplo. Suponiendo que para hacer un histograma se utilizara una simulación de Montecarlo con las medias y desviaciones estándar mostradas y las distribuciones normales, estaríamos generando una distribución de mezcla, si no ordenáramos por colores. En ese caso, las áreas de cola superpuestas se sumarían en esas categorías del histograma, y los métodos modernos que encuentran distribuciones no tendrían muchos problemas para segregar esa mezcla en dos modelos de distribución normal para recuperar los valores de entrada.

Eso no nos diría qué color es cuál, pero identificaría correctamente que dos distribuciones normales produjeron el histograma. Del mismo modo, si quisiéramos hacer la prueba t, podríamos, y eso identificaría que las poblaciones tienen valores medios diferentes, y si hiciéramos la prueba de Levene para diferencias de varianza, podríamos entonces hacer esa prueba.

Tal y como están las cosas, el solapamiento que muestra significa poco. Una distribución de mezcla tiene más naturalmente diferentes tamaños de muestra en cada subpoblación de esa mezcla, es decir, $\mathrm{pdf}_{mixture}=p N(\mu_1,\sigma_1^2)+(1-p)N(\mu_2,\sigma_2^2)$ , donde $0<p<1$ . Suponiendo una mezcla de 1/3 de rojo y 2/3 de verde, esto se vería así

enter image description here

Para lo cual la probabilidad relativa de los componentes de probabilidad Rojo a Verde en un gráfico logarítmico se vería así:

enter image description here

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X