65 votos

Si seleccionamos al azar 25 enteros entre 1 y 100, ¿cuántos números enteros consecutivos debemos esperar?

Pregunta: Supongamos que tenemos un centenar de asientos, numeradas del 1 al 100. Se selecciona aleatoriamente 25 de estos asientos. ¿Cuál es el número esperado de pares seleccionados de los asientos que son consecutivos? (Para aclarar: podemos contar dos consecutivos seleccionados asientos como un único par.)

Por ejemplo, si el seleccionado asientos son todos consecutivos (por ejemplo, 1-25), entonces tenemos 24 pares consecutivos (por ejemplo, 1&2, 2&3, 3&4, ..., 24&25). La probabilidad de que esto ocurra es de 75/($_{100}C_{25}$). Así que esto contribuye $24\cdot 75/(_{100}C_{25}$) para el número esperado de pares consecutivos.

Motivación: yo enseño. Cerca del final de un examen, cuando la mayoría de los estudiantes han dejado, me doy cuenta de que todavía hay muchas parejas de estudiantes, uno junto a otro. Quiero saber si el número que quedan deberían ser esperado o no.

49voto

sewo Puntos 58

Si usted está interesado en la expectativa, puede utilizar el hecho de que la expectación es aditivo para calcular

  • El número esperado de enteros consecutivos entre $\{1,2\}$, además de
  • El número esperado de enteros consecutivos entre $\{2,3\}$, además de
  • ....
  • además, la previsión del número de enteros consecutivos entre $\{99,100\}$.

Cada uno de estos 99 expectativas es simplemente la probabilidad de que $n$ y $n+1$ son ambos elegido, lo cual es $\frac{25}{100}\frac{24}{99}$.

Por lo que el número esperado de pares es de $99\frac{25}{100}\frac{24}{99} = 6$.

19voto

bertzzie Puntos 999

Deja que me presente el enfoque propuesto por Henning en otra forma.

Tenemos $99$ posible pares: $\{(1,2),(2,3),\ldots,(99,100)\}$. Vamos a definir $X_i$ como

$$ X_i = \left \{ \begin{array}{ll} 1 & i\text{-ésimo par es elegido}\\ 0 & \text{en caso contrario}\\ \end{array} \right . $$

El $i$-ésimo par se denota como $(i, i+1)$. Que par es elegido cuando el número entero $i$ es elegido, con una probabilidad de $25/100 dólares, y el entero $i+1$ es también elegido, con una probabilidad de $24/99$. A continuación,

$$E[X_i] = P(X_i = 1) = \frac{25}{100}\frac{24}{99},$$

y esto vale para $i = 1,2,\ldots,99$. El número total de pares elegidos se da como

$$X = X_1 + X_2 + \ldots + X_{99},$$

y usando la linealidad de la expectativa, obtenemos

\begin{align} E[X] &= E[X_1] + E[X_2] + \cdots +E[X_{99}]\\ &= 99E[X_1]\\ &= 99\frac{25}{100}\frac{24}{99} = 6 \end{align}

12voto

bea Puntos 16

Henning Malcolm ya ha contestado a la pregunta acerca del valor esperado. Pero que dice muy poco acerca de que tan probable o improbable sería conseguir que las desviaciones del valor esperado - lo que si se observó que hubo 20 pares de 25 estudiantes de izquierda, pudo suceder por casualidad o hay algún otro factor en el trabajo? Para responder a preguntas como esta se necesita más detalles acerca de la distribución, como la varianza. Por desgracia, la analítica, la fórmula para la distribución (si es que la hay) es probable que sea muy complicado. Así, desde un punto de vista práctico, sería interesante investigar cosas numéricamente. Ese es el propósito de este post.

He aquí un histograma del número de pares generados numéricamente a partir de 10000 ensayos.

seating pairs histogram

Puedes ver esta y sacar sus propias conclusiones. Me gustaría concluir lo siguiente:

  • en cualquier lugar de 4 a 8 pares sería totalmente razonable,
  • 0 pares o 13+ pares sería una evidencia muy fuerte de que hay otro factor
  • nada en el medio sería inusual, pero posible

Aquí está el código de Matlab utilizado para generarlo:

n=100; 
k=25; 

num_trials = 1e4;
num_pairs = zeros(num_trials,1);
for ii=1:num_trials
    disp(ii)
    filled_seats = sort(randperm(n,k));
    gaps = filled_seats(2:end) - filled_seats(1:end-1);
    num_pairs(ii) = length(find(gaps == 1));
end

histogram(num_pairs)
title(sprintf('histogram of seating pairs (out of %d trials)',num_trials))

7voto

Marko Riedel Puntos 19255

No es difícil construir la bivariante de generación de función $G(z,u)$ de $25$-tuplas por el máximo del elemento (variable $z$) y el número de elementos adyacentes (variable $u$.) Para ello debemos elegir el primer elemento:

$$\frac{z}{1-z}$$

y, a continuación, elija $24$ brechas entre los elementos de la brecha de valor de una marca con $u:$

$$\left(uz + \frac{z^2}{1-z}\right)^{24}.$$

El producto de estos es de $G(z,u)$ pero estamos interesados en el máximo de valor en la mayoría de los $100$, así que conseguir

$$[z^{100}] \frac{1}{1-z} G(z, u) = [z^{100}] \frac{1}{1-z} \frac{z}{1-z} \left(uz + \frac{z^2}{1-z}\right)^{24}.$$

Necesitamos el total recuento del número de pares adyacentes de modo que podemos calcular $$[z^{100}] \left.\frac{\partial}{\partial u} \frac{1}{1-z} G(z, u) \right|_{u=1} =[z^{100}] \a la izquierda. \frac{z}{(1-z)^2} \times 24 \left(uz + \frac{z^2}{1-z}\right)^{23} \times z\right|_{u=1} \\ = [z^{100}] \frac{z}{(1-z)^2} \times 24 \left(\frac{z}{1-z}\right)^{23} \times z \\ = 24 [z^{100}] \frac{z^{25}}{(1-z)^{25}} = 24 [z^{75}] \frac{1}{(1-z)^{25}} = 24 {75+24\elija 24}.$$

Esto produce una respuesta final de $$ 24 {99\elegir 24} \times {100\elegir 25}^{-1} = 6.$$

5voto

Marko Riedel Puntos 19255

Supongamos que nos preguntan acerca de la máxima esperada de largo plazo cuando seleccionamos $m$ elementos de un total de $n.$

Para una longitud de ejecución en más de $k$ primero debemos elegir una carrera de algunos de longitud posiblemente precedido por una brecha, dando (la variable $w$ cuenta el número de los elementos de la tupla)

$$\frac{1}{1-z} \sum_{q=1}^k w^q z^p $$

seguido por una secuencia de brechas seguido por una carrera $$\frac{z}{1-z} \sum_{q=1}^k w^q z^p$$

posiblemente seguido en la final por otra brecha $$\frac{1}{1-z}.$$

Esto le da a la generación de la función $$f_k(z,w) = \frac{1}{(1-z)^2} \left(\sum_{q=1}^k w^q z^q \ \ derecho) \sum_{p\ge 0} \left( \frac{z}{1-z} \sum_{q=1}^k w^q z^q \ \ derecho)^p.$$

Estamos interesados en el número total de

$$[z^n] [w^m] \sum_{k=1}^m k (f_k(z,w) - f_{k-1}(z, w)) \\ = [z^n] [w^m] \left(m f_m(z,w) - \sum_{k=1}^{m-1} f_k(z, w)\right).$$

La suma de los componentes en $f_k(z, w)$ es $$\sum_{p\ge 0} \left( \frac{wz^2}{1-z} \sum_{q=0}^{k-1} w^q z^q \ \ derecho)^p \\ = \frac{1}{1-wz^2(1-w^k z^k)/(1-z)/(1-wz)}.$$

En este momento parece que estamos mucho mejor trabajar con

$$g_k(z,w) = \frac{1}{(1-wz)^2} \left(\sum_{q=1}^k z^q \ \ derecho) \sum_{p\ge 0} \left( \frac{wz}{1-wz} \sum_{q=1}^k z^q \ \ derecho)^p$$

que se da por la suma de componentes $$\sum_{p\ge 0} \left( \frac{wz^2}{1-wz} \sum_{q=0}^{k-1} z^q \ \ derecho)^p \\ = \frac{1}{1-wz^2(1-z^k)/(1-wz)/(1-z)}.$$

Este rendimientos $$g_k(z,w) = \frac{1}{1-wz} \left(\sum_{q=1}^k z^q \ \ derecho) \frac{1}{1-wz-wz^2(1-z^k)/(1-z)} \\ = \frac{1}{1-wz} \left(\sum_{q=1}^k z^q \ \ derecho) \frac{1}{1-w(z-z^2+z^2(1-z^k))/(1-z)} \\ = \frac{1}{1-wz} \left(\sum_{q=1}^k z^q \ \ derecho) \frac{1}{1-w(z-z^{k+2}))/(1-z)}.$$

Extraer el coeficiente de en $[w^{n-m}]$ obtenemos

$$\left(\sum_{q=1}^k z^q \ \ derecho) \sum_{p=0}^{n-m} z^{n-m-p} \frac{z^p(1-z^{k+1})^p}{(1-z)^p} \\ = z^{n-m} \left(\sum_{q=1}^k z^q \ \ derecho) \sum_{p=0}^{n-m} \frac{(1-z^{k+1})^p}{(1-z)^p} \\ = z^{n-m} \left(\left(\frac{1-z^{k+1}}{1-z}\right)^{n-m+1}-1\right).$$

Extraer el coeficiente de en $[z^n]$ obtenemos $$[z^n] z^{n-m} \left(\frac{1-z^{k+1}}{1-z}\right)^{n-m+1} = [z^m] \left(\frac{1-z^{k+1}}{1-z}\right)^{n-m+1}.$$

Este es $$\sum_{p=0}^{\lfloor m/(k+1)\rfloor} {n-m+1\elegir p} (-1)^p {n-m+m-p(k+1)\elegir n-m} \\ = \sum_{p=0}^{\lfloor m/(k+1)\rfloor} {n-m+1\elegir p} (-1)^p {n-p(k+1)\elegir n-m}.$$

Sustituir esto en la suma fórmula para obtener $$m {n\elegir m} - \sum_{k=1}^{m-1} \sum_{p=0}^{\lfloor m/(k+1)\rfloor} {n-m+1\elegir p} (-1)^p {n-p(k+1)\elegir n-m} \\ = {n\elegir m} - \sum_{k=1}^{m-1} \sum_{p=1}^{\lfloor m/(k+1)\rfloor} {n-m+1\elegir p} (-1)^p {n-p(k+1)\elegir n-m}.$$

Este es $${n\elegir m} + \sum_{p=1}^m {n-m+1\elegir p} (-1)^p {n-p\elegir n-m} \\ - \sum_{k=0}^{m-1} \sum_{p=1}^{\lfloor m/(k+1)\rfloor} {n-m+1\elegir p} (-1)^p {n-p(k+1)\elegir n-m} \\ = {n\elegir m} + \sum_{p=1}^m {n-m+1\elegir p} (-1)^p {n-p\elegir n-m} \\ - \sum_{1\le pq \le m} {n-m+1\elegir p} (-1)^p {n-pq\elegir n-m}.$$

Ahora debemos hacer una última simplificación en el primer y el segundo término juntos, los cuales son $$\sum_{p=0}^m {n-m+1\elegir p} (-1)^p {n-p\elegir n-m}$$

y presentar para su uso con el método Egorychev $${n-p\elegir n-m} = {n-p\elegir m-p} = \frac{1}{2\pi i} \int_{|z|=\epsilon} \frac{1}{z^{m-p+1}} (1+z)^{n-p} \; dz.$$

Tenga en cuenta que esto es igual a cero cuando p $\gt m$ así que podemos extender $p$ a infinito, llegar $$\frac{1}{2\pi i} \int_{|z|=\epsilon} \frac{1}{z^{m+1}} (1+z)^{n} \sum_{p\ge 0} {n-m+1\elegir p} (-1)^p \frac{z^p}{(1+z)^p} \; dz \\ = \frac{1}{2\pi i} \int_{|z|=\epsilon} \frac{1}{z^{m+1}} (1+z)^{n} \left(1-\frac{z}{1+z}\right)^{n-m+1} \; dz \\ = \frac{1}{2\pi i} \int_{|z|=\epsilon} \frac{1}{z^{m+1}} (1+z)^{n} \frac{1}{(1+z)^{n-m+1}} \; dz \\ = \frac{1}{2\pi i} \int_{|z|=\epsilon} \frac{1}{z^{m+1}} (1+z)^{m-1} \; dz = [z^m] (1+z)^{m-1} = 0.$$

Dividiendo por ${n\elegir m}$ para la expectativa de y sin el cero, la contribución de los dos primeros términos de este modo, obtener por la expectativa de la máxima longitud de

$${\large\color{#080}{{n\elegir m}^{-1} \sum_{1\le pq \le m} {n-m+1\elegir p} (-1)^{p+1} {n-pq\elegir n-m}}}.$$

El lector es invitado a probar esto de una manera diferente, quizás sin el uso ordinario de la generación de funciones.

El Arce de código que se utilizó para verificar estos incluyen un total la enumeración de rutina era la siguiente:

con(planta);

sr :=
proc(n, m)
 local sel, sel2, maxr, cur, res, pos;

 sel := firstcomb(n, m);
 res := 0;

 mientras que el tipo(sel, `set`) 
 sel2 := convert(sel, `lista`);

 maxr := -1; p := 1;

 para pos de 2 a m hacer
 si sel2[pos] = 1 + sel2[pos-1], a continuación,
 p := p + 1;
otra cosa
 si cur > maxr, a continuación,
 maxr := cur;
fi;
 cur := 1;
fi;
od;

 si cur > maxr, a continuación,
 maxr := cur;
fi;

 res := res + maxr;
 sel := nextcomb(sel, n);
od;

res;
end;

f :=
proc(k)
 de base local;

 base := añadir(w^q*z^q, q=1..k);

 1/(1-z)^2*base*sum((z/(1-z)*base)^p, p=0..infinity);
end;

Hf :=
proc(m)
 m*f(m)-añadir(f(k), k=1..m-1);
end;

Qf :=
proc(n, m)
 coeftayl(coeftayl(Hf(m), w=0, m), z=0, n);
end;

g :=
proc(k)
 de base local;

 base := añadir(z^q, q=1..k);

 1/(1-w*z)^2*base*sum((w*z/(1-w*z)*base)^p, p=0..infinity);
end;

Hg :=
proc(m)
 m*g(m)-agregar(g(k), k=1..m-1);
end;

Qg :=
proc(n, m)
 coeftayl(coeftayl(Hg(m), w=0, n-m), z=0, n);
end;

X :=
proc(n, m)
 locales CF;

 CF := (n,m,k)->
 agregar(binomial(n-m+1,p)*(-1)^p*binomial(n-p*(k+1), n-m),
p=0..piso(m/(k+1)));

 m*binomial(n,m) - agregar(CF(n,m, k), k=1..m-1);
end;

X1 :=
proc(n, m)
 local p, q, res;

 res := binomial(n,m) +
 agregar(binomial(n-m+1,p)*(-1)^p*binomial(n-p,n-m), p=1..m);

 para p a m hacer
 para q el suelo(m/p) ¿
 res := res -
binomial(n-m+1,p)*(-1)^p*binomial(n-p*q,n-m);
od;
od;

res;
end;

X2 :=
proc(n, m)
 local p, q, res;

 res := 0;

 para p a m hacer
 para q el suelo(m/p) ¿
 res := res +
binomial(n-m+1,p)*(-1)^(p+1)*binomial(n-p*q,n-m);
od;
od;

res;
end;

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X