1 votos

Probabilidad de eliminar cubos completos del histograma

Tengo unos datos y su distribución en forma de histograma. Digamos por ejemplo que hay los siguientes 20 datos:

  • 3 veces al A
  • 5 veces a B
  • 4 veces al C
  • 4 veces al D
  • 3 veces al E
  • 1 veces a F

Ahora quiero eliminar, por ejemplo, 5 datos elegidos al azar. ¿Cómo se puede calcular la probabilidad de que un tipo de valor se elimine por completo? Por ejemplo, que se eliminen las tres A o las cinco B.

Mi planteamiento sería calcular para cada tipo de valor la probabilidad de eliminar este tipo concreto contando las posibilidades de elegir 5 elementos de datos que incluyan, por ejemplo, las tres A. Después dividiría este recuento por el número de posibilidades de elegir 5 datos de un total de 20. Al final sumaría todas estas probabilidades y eliminaría de nuevo todas las probabilidades. Al final, sumaría todas estas probabilidades y eliminaría de nuevo todas las probabilidades contadas varias veces. Por ejemplo P(A o F eliminado) = P(A eliminado) + P(F eliminado) - P(A y F eliminado).

Pero si me imagino un histograma grande, esto sería un cálculo muy complejo. Así que mi pregunta es: ¿Puede haber una manera mejor?

0voto

Graham Kemp Puntos 29085

Sería menos confuso si etiquetaras las columnas con letras en lugar de con números.

  • 3 veces A
  • 5 veces B
  • 4 veces C
  • 4 veces D
  • 3 veces E
  • 1 vez F

Su enfoque parece el mejor.

La probabilidad, que $x$ específicos estarán entre los $5$ seleccionados de $20$ y $(5-x)$ artículos estarán entre los restantes $(20-x)$ es:

$$P(X_x) = \dfrac{20-x\choose 5-x}{20\choose 5}$$

Así pues, entendiendo que $P(A_3)$ mide la probabilidad de que las 3 columnas de tipo A estén entre las 5 eliminadas:

$$ P(F_1)=\dfrac{19\choose 4}{20\choose 5}, P(A_3) = P(E_3) = \dfrac{17\choose 2}{20\choose 5}, P(C_4)=P(D_4)=\dfrac{16}{20\choose 5}, P(B_5) = \dfrac{1}{20\choose 5}$$

Así que para los sindicatos:

$$P(A_3\cup F_1) = P(A_3)+P(F_1)-P(A_3\cap F_1) = \dfrac{{17\choose 2}+{16\choose 4}-{16}}{20\choose 5}$$

Etcétera...

Sin embargo, como sólo necesitamos excluir intersecciones de talla 5 o inferior.

$$P(A_3\cup B_5 \cup C_4 \cup D_4\cup E_3\cup F_1) \\ = P(F_1)+P(A_3)+P(E_3)+P(C_4)+P(D_4)+P(B_5)- P(A_3\cap F_1)-P(E_3\cap F_1)-P(C_4\cap F_1)-P(D_4\cap F_1) \\ = \frac{{19\choose 4}+2{17\choose 2}+2{16\choose 1}+{15\choose 0}-2{16\choose 1}-2{15\choose 0}}{20\choose 5} \\ = \frac{{19\choose 4}+2{17\choose 2}-{15\choose 0}}{20\choose 5} \\ =\frac {4147} {15504}$$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X