87 votos

¿Qué tienen de "momento" los "momentos" de una distribución de probabilidad?

SÉ lo que son los momentos y cómo calcularlos y cómo utilizar la función generadora de momentos para obtener momentos de orden superior. Sí, conozco las matemáticas.

Ahora que necesito engrasar mis conocimientos de estadística para el trabajo, he pensado que podría hacer esta pregunta - me ha estado dando vueltas desde hace unos años y en la universidad ningún profesor sabía la respuesta o simplemente descartaba la pregunta (honestamente).

¿Qué significa la palabra "momento" en este caso? ¿Por qué esta elección de palabra? No me parece intuitiva (o nunca la escuché así en la universidad :) Ahora que lo pienso, tengo la misma curiosidad con su uso en "momento de inercia" ;) pero no nos centremos en eso por ahora.

Entonces, ¿qué significa un "momento" de una distribución y qué pretende hacer y por qué esa palabra?) ¿Por qué alguien se preocupa por los momentos? En este momento me siento de otra manera sobre ese momento ;)

P.D.: Sí, probablemente he hecho una pregunta similar sobre la varianza, pero valoro más la comprensión intuitiva que el "buscar en el libro para averiguarlo" :)

71voto

Según el documento "Primera (?) aparición de términos comunes en la estadística matemática" por H.A. David, el primer uso de la palabra "momento" en esta situación fue en una carta de 1893 a Naturaleza por Karl Pearson titulado "Curvas de frecuencia asimétricas" .

Neyman's 1938 Biometrika papel "Nota histórica sobre la deducción de Karl Pearson de los momentos del binomio" ofrece una buena sinopsis de la carta y del trabajo posterior de Pearson sobre los momentos de la distribución binomial y el método de los momentos. Es una buena lectura. Espero que tengáis acceso a JSTOR porque ahora no tengo tiempo de hacer un buen resumen del trabajo (aunque lo haré este fin de semana). Aunque mencionaré un fragmento que puede dar una idea de por qué se utilizó el término "momento". Del documento de Neyman:

La memoria de Pearson trata principalmente de los métodos de aproximación de las curvas de frecuencia continuas. curvas de frecuencia continuas por medio de algunos procesos que implican el cálculo de fórmulas sencillas. Una de estas fórmulas consideradas fue la "punto-binomio" o el "binomio con ordenadas cargadas". La fórmula
difiere de lo que hoy llamamos binomio, es decir (4), sólo por un factor $\alpha$ que representa el área bajo la curva continua que se desea ajustar.

Esto es lo que finalmente condujo al "método de los momentos". Neyman repasa la derivación de Pearson de los momentos binomiales en el artículo anterior.

Y de la carta de Pearson:

Ahora procederemos a encontrar los cuatro primeros momentos del sistema de rectángulos alrededor de GN. Si la inercia de cada rectángulo puede considerarse como concentrada a lo largo de su vertical media, deberíamos tener para el $s^{\text{th}}$ momento redonda NG, escribir $d = c(1 + nq)$ .

Esto indica que Pearson utilizó el término "momento" como una alusión a "momento de inercia un término común en la física.

Aquí hay un escaneo de la mayor parte de Pearson Naturaleza carta:

enter image description here

enter image description here

Puede ver el artículo completo en la página 615 aquí .

12voto

Laurent Duval Puntos 229

Todo el mundo tiene su momento en los momentos. Yo tuve el mío en Nombres de cumulantes y momentos más allá de la varianza, la asimetría y la curtosis y pasé un rato leyendo este hilo tan gorgoroso.

Curiosamente, no encontré la "mención del momento" en el documento de H. A. David. Así que fui a Karl Pearson: La vida científica en la era de la estadística un libro de T. M. Porter. y Karl Pearson y los orígenes de la estadística moderna: Un elástico se convierte en estadístico . Por ejemplo, editó Historia de la teoría de la elasticidad y de la resistencia de los materiales desde Galilei hasta la actualidad .

Su formación era muy amplia, y en particular era profesor de ingeniería y elasticista, y se dedicaba a determinar los momentos flectores de un tramo de puente y a calcular las tensiones en las presas de mampostería. En el ámbito de la elasticidad, sólo se observa lo que ocurre (la rotura) de forma limitada. Al parecer, le interesaba (del libro de Porter):

cálculo gráfico o, en su forma más digna y matemática, la estática gráfica.

Más tarde :

Desde el principio de su carrera estadística, e incluso antes, él ajustaba las curvas utilizando el "método de los momentos". En mecánica, esto significaba ajustar un cuerpo complicado a uno simple o abstracto que tuviera el mismo centro de masa y "radio de giro", respectivamente el primer y el segundo momento. segundo momento. Estas cantidades correspondían en estadística a la media y la dispersión de las mediciones en torno a la media.

Y desde entonces:

Pearson se ocupaba de intervalos de medición discretos, se trataba de una suma más bien que una integral

Los momentos de inercia pueden representar un resumen de un cuerpo en movimiento: los cálculos pueden realizarse como si el cuerpo se redujera a un solo punto.

Pearson planteó estas cinco igualdades como un sistema de ecuaciones, que se combinaron en una de noveno grado. Una solución numérica sólo era posible posible mediante aproximaciones sucesivas. Podría haber habido hasta hasta nueve soluciones reales, aunque en este caso sólo había dos. dos. El autor graficó ambos resultados junto con el original y, en general, quedó satisfecho con el aspecto de la solución real. y, en general, se mostró satisfecho con la apariencia del resultado. Sin embargo, no se basó en No obstante, no se basó en la inspección visual para decidir entre ellos, sino que calculó el sexto momento para decidir la mejor coincidencia

Volvamos a la física. Un momento es una magnitud física que tiene en cuenta la disposición local de una propiedad física, generalmente con respecto a un determinado punto o eje ordinal (clásicamente en el espacio o el tiempo). Resume las cantidades físicas medidas a cierta distancia de una referencia. Si la cantidad no se concentra en un solo punto, el momento se "promedia" en todo el espacio, mediante integrales o sumas.

Al parecer, el concepto de momentos se remonta al descubrimiento del principio de funcionamiento de la palanca "descubierto" por Arquímedes. Una de las primeras apariciones conocidas es la palabra latina "momentorum" con el sentido aceptado actualmente (momento en torno a un centro de rotación). En 1565, Federico Commandino tradujo la obra de Arquímedes (Liber de Centro Gravitatis Solidorum) como:

El centro de gravedad de cada figura sólida es ese punto dentro de ella, alrededor del cual se encuentran partes de igual momento en todos los lados.

o

Centrum gravitatis uniuscuiusque solidae figurae est punctum illud intra positum, circa quod undique partes aequalium momentorum

Así que, aparentemente, la analogía con la física es bastante fuerte: a partir de una forma física discreta y complicada, encontrar cantidades que se aproximen lo suficiente, una forma de compresión o parsimonia.

11voto

Hoogendijk Puntos 45

Pregunta: ¿Qué significa la palabra "momento" en este caso? ¿Por qué esta elección de palabra? No me parece intuitiva (o nunca la escuché así en la universidad :) Ahora que lo pienso, tengo la misma curiosidad con su uso en "momento de inercia" ;) pero no nos centremos en eso por ahora.

Respuesta: En realidad, en un sentido histórico, el momento de inercia es probablemente de donde proviene el sentido de la palabra momentos. De hecho, se puede mostrar (como a continuación) cómo el momento de inercia se relaciona con la varianza. Esto también da una interpretación física de los momentos superiores.

En física, un momento es una expresión que implica el producto de una distancia por una cantidad física, y de este modo da cuenta de cómo se localiza o dispone la cantidad física. Los momentos suelen definirse con respecto a un punto de referencia fijo; tratan de cantidades físicas medidas a cierta distancia de ese punto de referencia. Por ejemplo, el momento de la fuerza que actúa sobre un objeto, a menudo llamado par de torsión, es el producto de la fuerza y la distancia desde un punto de referencia, como en el ejemplo siguiente.

enter image description here

Menos confuso que el nombres que se suelen dar para momentos superiores serían momentos del movimiento circular, por ejemplo, momentos de inercia para el movimiento circular de los cuerpos rígidos, que es una conversión sencilla. La aceleración angular es la derivada de la velocidad angular, que es la derivada del ángulo con respecto al tiempo, es decir, $ \dfrac{d\omega}{dt}=\alpha,\,\dfrac{d\theta}{dt}=\omega$ . Considera que el segundo momento es análogo al par aplicado a un movimiento circular, o si quieres una aceleración/deceleración (también segunda derivada) de ese movimiento circular (es decir, angular, $\theta$ ) moción. Del mismo modo, el tercer momento sería una tasa de cambio del par, y así sucesivamente para momentos aún más altos para hacer tasas de cambio de tasas de cambio, es decir, derivadas secuenciales del movimiento circular. Quizás sea más fácil visualizarlo con ejemplos reales.

Hay límites a la verosimilitud física, por ejemplo, dónde empieza y termina un objeto, es decir, su soporte, lo que hace que la comparación sea más o menos realista. Tomemos el ejemplo de una distribución beta, que tiene soporte (finito) en [0,1] y mostremos la correspondencia para ello. La función de densidad de la distribución beta ( pdf ) es $$\beta(x;\alpha,\beta)=\begin{array}{cc} \Bigg\{ & \begin{array}{cc} \dfrac{x^{\alpha -1} (1-x)^{\beta -1}}{B(\alpha ,\beta )} & 0<x<1 \\ 0 & \text{True} \\ \end{array} \\ \end{array}\,,$$ donde $B(\alpha,\beta)=\dfrac{\Gamma(\alpha)\,\Gamma(\beta)}{\Gamma(\alpha+\beta)}$ y $\Gamma(.)$ es el función gamma , $\Gamma(z) = \int_0^\infty x^{z-1} e^{-x}\,dx$ .

La media es entonces el primer momento de rotación alrededor de el $z$ -para la función beta representada como una hoja delgada de rotación rígida de densidad de área uniforme con el mínimo $x$ -fijado en el origen (0,0,0), con su base en el $x,y$ avión. $$\mu=\int_0^1r\,\beta(r;\alpha,\beta)\,dr=\frac{\alpha}{\alpha+\beta}\,,$$ como se ilustra en el caso de $\beta(r;2,2)$ es decir, $\mu=\dfrac{1}{2}$ , a continuación enter image description here

Obsérvese que nada nos impide trasladar la hoja fina de la distribución beta a otro lugar y volver a escalarla, por ejemplo, desde $0\leq r\leq1$ a $2\leq r\leq4$ o cambiar la forma vertical, por ejemplo para que sea una paleta en lugar de una joroba.

Para calcular la varianza de la distribución beta, calcularíamos el momento de inercia para una distribución beta desplazada con el $r$ -valor medio colocado en el $z$ -eje de rotación, $$\sigma^2=\int_0^1 (r-\mu)^2 \beta(r;\alpha,\beta) \, dr =\frac{\alpha \beta }{(\alpha +\beta )^2 (\alpha +\beta +1)}\,,$$ que para $\beta(r;2,2)$ es decir, $I=\sigma^2=\dfrac{1}{20}$ , donde $I$ es el momento de inercia, se ve así,

enter image description here

Ahora, para una mayor así llamado momentos "centrales", es decir, momentos en torno a la media, como la asimetría, y la curtosis calculamos el $n^{\text{th}}$ momento alrededor de la media de $$\int_0^1 (r-\mu)^n \beta(r;\alpha,\beta) \, dr\,.$$ Esto también puede entenderse como la $n^{\text{th}}$ derivada del movimiento circular.

¿Y si queremos calcular al revés, es decir, tomar un objeto sólido en 3D y convertirlo en una función de probabilidad? Entonces las cosas se complican un poco más. Por ejemplo, tomemos un toro . enter image description here

Primero tomamos su sección transversal circular, luego la convertimos en una media elipse para mostrar la densidad de cualquier moneda plana como rebanada, luego convertimos la moneda en una moneda en forma de cuña para dar cuenta del aumento de la densidad con el aumento de la distancia ( $r$ ) del $z$ -y finalmente normalizamos por el área para hacer una función de densidad. A continuación se presenta un gráfico, dejando las matemáticas a cargo del lector.

enter image description here

Por último, nos preguntamos cómo se relacionan estas equivalencias con el movimiento. Obsérvese que, como en el caso anterior, el momento de inercia $I$ se puede relacionar con el segundo momento central, $\sigma^2$ También conocido como la varianza. Entonces $I=\dfrac{\tau}{a}$ , es decir, la relación del par, $\tau$ y la aceleración angular, $a$ . A continuación, diferenciaríamos para obtener tasas de cambio de orden superior en el tiempo.

5voto

jimx Puntos 101

Siendo demasiado simplistas, los momentos estadísticos son descriptores adicionales de una curva/distribución. Estamos familiarizados con los dos primeros momentos, que suelen ser útiles para distribuciones normales continuas o curvas similares. Sin embargo, estos dos primeros momentos pierden su valor informativo para otras distribuciones. Por lo tanto, otros momentos proporcionan información adicional sobre la forma de la distribución.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X