7 votos

¿Teorema del binomio desde los primeros principios?

Supongo que daré un poco de contexto a esto...

Al principio estaba muy emocionado por la posibilidad de que las versiones de Bernoulli y Taylor de $e^x$ en realidad equivalen a lo mismo (cuando se amplía la definición de Bernoulli $\lim_{n\to\infty}(1+\frac{x}{n})^n$ se simplifica a la serie de Taylor $\sum_{n=0}^{\infty}\frac{x^n}{n!}$ - a diferencia de, por ejemplo, las funciones trigonométricas como $\sin(x)$ que parecen un poco más insatisfactorios). Sin embargo, al reflexionar un poco más, decir que una identidad "simplifica" a la otra parece casi circular, dado que presupone el teorema binomial.

Así que decidí investigar un poco en Internet y descubrí que el teorema del binomio podía demostrarse mediante una prueba por inducción. Pero, una vez más, me sentí insatisfecho, ya que parece que has adivinado una fórmula que funciona. ¿Cómo se te ocurrió en primer lugar?

Entonces pensé en la teoría de la probabilidad. Usamos una expresión binomial $^nC_{r}$ cuando buscamos el número de combinaciones que tenemos para ordenar las cosas. Podemos derivar esta fórmula muy intuitivamente, sin embargo, como no quiero que esta pregunta sea innecesariamente grande, no voy a entrar en detalles sobre esto aquí. Lo que cuenta, es que podemos deducir esta fórmula a partir de los primeros principios - no la sacamos de la nada.

Como seguro que ya sabes, $^nC_{r}$ es la clave para entender las distribuciones binomiales. Una vez más, no voy a explicar esto, pero un ejemplo de cálculo de probabilidades es $^{10}C_{4}(\frac{1}{6})^4(\frac{1}{6})^{10-4}$ por sacar 4 seises en 10 tiradas totales.

Según los axiomas (de Kolmogorov) de la probabilidad, la probabilidad de todos los resultados totales $P(\Omega)$ es 1. Consideremos el contexto de los resultados binomiales totales de 3 ensayos (escojo este número por razones simples e ilustrativas), donde designamos la probabilidad de éxito, $\frac{1}{5}$ y la del fracaso, $\frac{4}{5}$ (donde la suma de todos los resultados diferentes, aquí el éxito y el fracaso = 1). Bien, sabemos que como tenemos 3 ensayos, lógicamente, tendremos 4 posibilidades: 0 éxitos, 1 éxito, 2 éxitos, o 3 éxitos; podemos escribir nuestra probabilidad como: $^{3}C_{0}(\frac{1}{5})^3(\frac{4}{5})^0$ + $^{3}C_{1}(\frac{1}{5})^2(\frac{4}{5})^1$ + $^{3}C_{2}(\frac{1}{5})^1(\frac{4}{5})^2$ + $^{3}C_{3}(\frac{1}{5})^0(\frac{4}{5})^3$ = $(\frac{1}{5})^3$ + $3(\frac{1}{5})^2(\frac{4}{5})$ + $3(\frac{1}{5})(\frac{4}{5})^2$ + $(\frac{4}{5})^3$ $= 1$ .

Por supuesto, esto puede generalizarse a $\sum_{k=0}^{n}$$ ^{n}C_{k}{p}^k{q}^{n-k}$ donde $n$ es el número total de ensayos $k$ el número de éxitos, $p$ la probabilidad de éxito, $q$ la del fracaso.

Ahora consideremos la expansión binomial de $(a + b)^3$ . Bien, suponiendo que no sabemos nada de la teoría del binomio y lo hacemos a mano, nuestro álgebra se simplifica sin embargo a $a^3 + 3a^2b + 3b^2a + b^3$ . Hmmm... esto se parece sospechosamente a nuestro foro de probabilidad total ampliado anteriormente. Casi parece que $a$ podría estar representando nuestros éxitos, y $b$ nuestros fracasos.

Así que mi razonamiento es el siguiente: resulta que en el contexto de la probabilidad, la probabilidad total de sus resultados suma 1. Si $\Omega = \left\{ a, b \right\}$ Entonces, por los axiomas de Kolmogorov, $a + b = 1$ . Lo que estamos diciendo efectivamente es que para cualquier expansión binomial, podemos tratarlos como "resultados de probabilidad" donde $a + b \ne 1$ .

¿Es una prueba razonable?

5voto

Charles Kim Puntos 18

He aquí una forma de entender el teorema del binomio que no utiliza la inducción. Explicaré los vínculos entre esto y la probabilidad al final de esta entrada. En primer lugar, como la multiplicación es distributiva sobre la suma y conmutativa, sabemos que $$ a(x+y)=(x+y)a=ax+ay \, . $$ Al ampliar un paréntesis doble, se aplica el mismo principio. Para ampliar $(a+b)(c+d)$ podemos dejar que $k=c+d$ y así $$ (a+b)k=ak+bk=a(c+d)+b(c+d)=ac+ad+bc+cd \, . $$ Esto justifica el método 'FOIL' para expandir un paréntesis doble: $$ (a+b)(c+d)=\underbrace{ac}_{\text{First}}+\underbrace{ad}_{\text{Outside}}+\underbrace{bc}_{\text{Inside}}+\underbrace{bd}_{\text{Last}} \, . $$ En este punto, vemos algo interesante. La expansión de $(a+b)(c+d)$ es simplemente la suma de todas las formas de seleccionar un solo elemento de cada paréntesis. Este patrón se repite para tres paréntesis: \begin{align} (a+b)(c+d)(e+f) &= (ac+ad+bc+bd)(e+f) \\[4pt] &= e(ac+ad+bc+bd)+f(ac+ad+bc+bd) \\[4pt] &=ace+ade+bce+bde+acf+adf+bcf+bdf \, . \end{align} Considera que cada vez que añadimos un nuevo paréntesis, el número de términos de la expansión se duplica. Cuando multiplicamos $(a+b)(c+d)$ con $(e+f)$ la expansión resultante es simplemente la anterior con $e$ al final de cada trimestre, seguido del anterior con $f$ al final de cada trimestre. Esto significa que sigue siendo el caso que la expansión representa la suma de todas las formas diferentes de seleccionar un solo elemento de cada paréntesis. Si todavía no estás convencido, observa cómo la expansión de $(a+b)(c+d)$ es $ac+ad+bc+bd$ . Estos cuatro términos representan todas las formas diferentes en que se puede seleccionar un solo elemento de los corchetes $(a+b)$ et $(c+d)$ . Hay ocho formas de elegir un solo elemento de los paréntesis $(a+b)$ , $(c+d)$ y $(e+f)$ . Y podemos encontrar estas ocho formas dibujando un diagrama de árbol que se "ramifica" tres veces. Cuando consideramos el primer paréntesis, hay dos combinaciones: $a$ et $b$ . Si consideramos el segundo paréntesis, hay cuatro combinaciones: $ab$ , $ac$ , $bc$ y $bd$ . Si consideramos el tercer paréntesis, hay ocho combinaciones: $abe$ , $abf$ , $ace$ , $acf$ , $bce$ , $bcf$ , $bde$ y $bdf$ . Las ocho combinaciones provienen de la elección de si se debe hilvanar $e$ al final o un $f$ al final, lo que ocurre exactamente cuando multiplicamos $(ac+ad+bc+bd)$ con $(e+f)$ . Una vez aceptado esto, no es demasiado difícil entender, al menos intuitivamente, que la expansión de varios paréntesis siempre da como resultado una suma de todas las diferentes combinaciones posibles.

La expansión de $(a+b)^n$ es entonces el resultado de sumar todas las formas diferentes en que se puede seleccionar un solo elemento de cada paréntesis. La diferencia aquí es que muchos de los términos se repiten. $$ (a+b)^n = \underbrace{(a+b)(a+b)(a+b)\dots(a+b)}_{\text{$ n $ times}} \, . $$ Veamos la ampliación paso a paso. Si elegimos $a$ cero veces y $b$ $n$ veces, entonces el término con el que terminamos es $b^n$ . Si elegimos $a$ $1$ tiempo y $b$ $(n-1)$ veces, entonces el término que terminamos es $ab^{n-1}$ . Sin embargo, hay $n$ diferentes formas de recoger $a$ $1$ tiempo y $b$ $(n-1)$ tiempos. De ahí que el término $ab^{n-1}$ se repite $n$ veces, lo que significa que terminamos con $nab^{n-1}$ . Si elegimos $a$ $2$ tiempos y $b$ $(n-2)$ veces, entonces el término que obtenemos es $a^2b^{n-2}$ y el coeficiente es $^nC_2$ . (Por definición, $^nC_r$ es el número de formas que puede seleccionar $r$ elementos del grupo de $n$ .) El patrón continúa. En general, si elegimos $a$ $r$ veces, y $b$ $(n-r)$ veces, entonces el término que obtenemos es $a^rb^{n-r}$ y el coeficiente es $^nC_r$ . Esto nos da el teorema del binomio: $$ (a+b)^n = \sum_{r=0}^{n}{n \choose r}a^rb^{n-r} \, . $$ ¿Cómo se relaciona esto con esta probabilidad? Imagina que lanzas una moneda justa diez veces. Cada individual secuencia es tan probable como cualquier otra. Es tan probable que usted obtenga $\mathrm{HHHHHHHHHH}$ como es $\mathrm{HHTHHHHTTH}$ . Sin embargo, es mucho más que se le pueda dar a usted $5$ cabezas a diferencia de $0$ cabezas. ¿Por qué? Porque hay muchas maneras de que un grupo de $10$ los lanzamientos pueden dar lugar a $5$ cabezas, en comparación con una sola forma de conseguir $10$ cabezas. Para ser precisos, hay $^{10}C_5=252$ formas de conseguir $5$ cabezas, pero sólo $1$ manera de conseguir $10$ cabezas.

Galton board

0 votos

+1 por la aclaración. Como principiante, la imagen anterior del tablero de Galton era la forma más intuitiva para mí de entender el modelo binomial de valoración de opciones.

0 votos

Gracias, sinceramente es una explicación muy clara que va más allá. La forma en que usted hizo evidente que usted está recogiendo términos tiene mucho sentido. ¡Me upvote dos veces si pudiera!

0 votos

@Quasar: Gracias, estoy de acuerdo en que la tabla de Galton es una de las mejores formas de visualizar las cosas. (También sugiere correctamente que la distribución binomial tiende a una distribución normal a medida que se acerca el número de ensayos ). $\infty$ !)

4voto

Quasar Puntos 86

$a$ et $b$ ciertamente no tienen que ser probabilidades.

Considere

\begin{align*} (a+b)^n = (a+b)\cdot(a+b)\cdots(a+b) & \text{ to n terms} \end{align*}

Cualquiera de los términos de la expansión binomial de $(a+b)^n$ como $aa\cdots a$ , $ab\cdots a$ , $ba\cdots a$ , $bb\cdots a$ , $bb\cdots b$ etcétera requieren que usted haga $n$ selecciones independientes, un término - ya sea $a$ o $b$ de cada uno de los $n$ factores. De ahí que el término general $a^k b^{n-k}$ se produce ${n \choose k}$ tiempos.

2 votos

Me parece bien considerar que a y b no tienen por qué ser probabilidades. Supongo que mi problema es la justificación de cómo se puede decir que se produce esta selección. Cuando se expanden paréntesis a través de la multiplicación, habrá un paso de simplificación de términos colectivos similares que sigue - y sí, esto en última instancia le da el patrón de selección. Sin embargo, repito (a menos que esté muy equivocado) que la operación multiplicativa (expansión de paréntesis) no da lugar a este patrón de selección, por lo que he intentado utilizar resultados de la teoría de la probabilidad para justificar el patrón. ¿Quizás me estoy perdiendo algo?

1 votos

@ArmelFrançois: El patrón de selección se produce porque la multiplicación es distributivo sobre suma . Ahora mismo estoy escribiendo una respuesta que profundiza en esto, pero esta respuesta es un buen punto de partida, y por eso la he votado.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X