18 votos

¿Por qué el inverso de un promedio de números no es lo mismo que el promedio del inverso de esos mismos números?

Tengo un conjunto de números (en mi caso: tiempo medio de retención (MRT) en el estómago (h)) del cual quiero calcular la tasa media de paso gástrico (/h). La tasa de paso gástrico = 1/MRT.

Mi pregunta es ¿por qué 'el promedio de las tasas de paso gástrico calculadas de esos números' no es lo mismo que 'la tasa de paso gástrico calculada de los MRT promediados'. La siguiente pregunta es: ¿cuál es la forma correcta?

Entonces, por ejemplo:

$x = 5; 10; 4; 2.$ Promedio $= 5.25 h \Rightarrow 1/5.25 = 0.19$/h

$1/x = 0.2; 0.1; 0.25; 0.5.$ Promedio $= 0.26$/h

Entonces, ¿debería primero tomar el promedio de los MRT y luego tomar la inversa para calcular la tasa de paso gástrico (primer método) o debería primero tomar la inversa de todos los números para calcular las tasas de paso gástrico y luego tomar el promedio de ese número (segundo método)?

¡Gracias de antemano!

2 votos

Bienvenido a la comunidad de Mathematics Stack Exchange. Un tour rápido del sitio te ayudará a aprovechar al máximo tu tiempo aquí. Para el formato de tus ecuaciones, por favor utiliza MathJax. Aquí tienes una excelente referencia.

3 votos

38 votos

Ponerse los calcetines y luego ponerse los zapatos no es lo mismo que ponerse los zapatos y luego ponerse los calcetines. Comprar un seguro de auto y luego chocar tu auto no es lo mismo que chocar tu auto y luego comprar un seguro. ¿Por qué debería ser lo mismo promediar números y luego invertir los promedios que invertir números y luego promediar los inversos? El orden en el que haces las cosas importa, en la vida y en la aritmética.

32voto

CodeMonkey1313 Puntos 4754

Aquí hay un rompecabezas diario que puede ayudar.

Si viajas de aquí para allá a $30$ millas por hora y de regreso a $60$ millas por hora, ¿cuál es tu velocidad promedio? El instinto dice que debería ser el promedio, que sería $45$ millas por hora.

Pero la velocidad es (distancia total)/(tiempo total). No tienes una distancia dada, pero puedes inventar una. Supongamos que tu destino estaba a $60$ millas de distancia. Entonces te tomó $2$ horas llegar allí y $1$ para regresar. Condujiste $120$ millas en $3$ horas, por lo que tu velocidad promedio fue de $40$ millas por hora.

La moraleja de la historia es que no puedes promediar ingenuamente promedios, y una tasa es un promedio. Así que ten cuidado cuando tengas que calcular una tasa promedio.

En tu caso, tu MRT es como el recíproco de la velocidad, cuyas unidades son horas/milla. En mi ejemplo, son $2$ horas por $60$ millas para el viaje lento y $1$ hora por $60$ millas para el rápido regreso. Puedes promediar esos para obtener el número promedio de horas por milla. El promedio es de $1.5$ horas por $60$ millas. El recíproco es de $60$ millas por $1.5$ horas, o $40$ millas por hora.

Así que esto es correcto:

toma el promedio de los MRT y luego toma la inversa para calcular la tasa de paso gástrico (primer método)

Editar a la luz de muchos comentarios y aclaraciones.

La pregunta importante es "¿cuál es la forma correcta de promediar los valores de MRT?", no "¿por qué difieren estos dos métodos?" o incluso "¿cuál de estos dos es correcto?"

La respuesta depende de lo que realmente mide la MRT. Si el material se mueve a través del intestino a una velocidad constante, entonces tu primer método es correcto, como se discutió anteriormente. Pero si el material sale del intestino a una velocidad proporcional a la cantidad presente - es decir, una fracción de la cantidad sale por hora - entonces el proceso es como una decaimiento exponencial. No sé cuál es la forma correcta de calcular la tasa promedio en ese caso. Si tienes muy pocos valores para promediar y no son muy diferentes, entonces puedes argumentar que cualquier resultado que obtengas es esencialmente independiente de la forma en que promedias las tasas.

0 votos

Entonces, ¿esto en realidad significa que primero tengo que sumar todos los valores de los MRT y luego tomar el inverso? Porque el otro comentario de "Servaes" dice lo contrario.

0 votos

Quizás es importante decir que todos los valores se refieren a diferentes estudios publicados. Por lo tanto, son independientes entre sí. El estudio A encontró un MRT de 4 h, el estudio B encontró un MRT de 5 h, etc. y luego quiero tener un número promedio para la tasa de paso gástrico de todos esos estudios, que puedes calcular tomando el inverso del MRT. Así que entiendo tu ejemplo, pero tengo la idea de que no se aplica a mi caso (?)

1 votos

¡Gracias por tu edición! Pero, ¿por qué el MRT es el recíproco de la velocidad? El MRT está expresado en horas. Es simplemente el tiempo de retención en el estómago y la tasa de paso gástrico (GPR) es el inverso de eso, por lo que 1/MRT es la fracción de nutrientes que está saliendo del estómago (/h). Entiendo que no puedes promediar promedios, pero la tasa de paso es simplemente el inverso del MRT, por lo que están relacionados, no es un número promedio ¿o me equivoco?

12voto

Tim Almond Puntos 1887

Te has encontrado con un fenómeno llamado la desigualdad AM-HM, $\frac{1}{n}\sum_{i=1}^n x_i\ge\frac{n}{\sum_{i=1}^n\frac{1}{x_i}}$ para $x_i>0$, con igualdad si y solo si todos los $x_i$ son iguales. En general, las funciones no conmutan con la toma de expectativas; este es el ejemplo con la función $1/x$.

Lo que hagas con tus datos depende de la forma que asumas que tiene la distribución de los tiempos de retención. Por ejemplo, supongamos que piensas que tiene una distribución Exponencial, con parámetro de tasa $\lambda$. El hecho de que $1/\lambda$ sea el TMR es entonces $1/\lambda=\int_0^\infty\lambda x\exp (-\lambda x)\mathrm{d}x$. No aconsejo intentar estimar $\lambda$ a partir de los recíprocos promediados, ya que $\int_0^\infty\frac{\lambda}{x}\exp (-\lambda x)\mathrm{d}x$ es infinito.

Supongamos para el bien del argumento que estimamos $1/\lambda$ como el tiempo de retención promedio del conjunto de datos. Este es un ejemplo del método de momentos. Se puede mostrar que la estimación de máxima verosimilitud recomendaría el mismo estimador. Las páginas 3 y 4 aquí discuten qué sucede con la estimación bayesiana, y llega a casi lo mismo para un tamaño de muestra grande. Así que si fuera tú, estimaría $1/\lambda$ como la media GPR.

0 votos

Desafortunadamente, soy un estudiante con habilidades básicas en matemáticas y no entiendo la última parte de tu respuesta, pero la relación que describes arriba (esto > aquello) es en realidad al revés para mi conjunto de datos (esto < aquello). ¿Podrías intentar explicarlo de forma más sencilla para mí? Quizás un poco más de explicación ayude. El MRT se estima en base al T50 (50% de recuperación) de un marcador que sigue la digesta en el intestino. El gráfico de "%recuperación (acumulativa) x tiempo" sigue una función sigmoidea. Así que se asume que el T50 es igual al MRT y se asume que la media es igual a la mediana.

0 votos

@Nena En resumen, la estimación de parámetros es un tema generalmente complicado que ofrece consejos bastante simples cuando la distribución es exponencial. Dado que es sigmoide, tendré que reconsiderar. Tu datos no contradicen mi desigualdad porque realmente comparaste 1/MA con 1/HA.

0 votos

@Nena Lo siento, acabo de darme cuenta: la distribución del tiempo de retención no puede ser logística, ya que tiene soporte $\Bbb R$ en lugar de $[0,\,\infty)$. Por favor edita tu pregunta para hacer explícita la distribución de probabilidad conjeturada del tiempo de retención; luego añadiré una discusión revisada de su estimación de parámetros.

9voto

tugberk Puntos 221

Una forma de abordar preguntas como esta es reducirla a la versión más simple posible de la pregunta y luego examinar ese problema. En este caso,

 ¿Por qué el inverso del promedio de x e y no es igual al promedio de los inversos de x e y?

Entonces estás preguntando "¿Por qué esto no es cierto?" $$\dfrac{1}{\left( \dfrac{x+y}{2} \right)} = \dfrac{\left( \dfrac 1x + \dfrac 1y \right)}{2}$$

Personalmente, me sorprendería si los dos lados resultaran ser iguales. Pero podemos resolver la ecuación y ver qué sucede.

\begin{align} \dfrac{1}{\left( \dfrac{x+y}{2} \right)} &= \dfrac{\left( \dfrac 1x + \dfrac 1y \right)}{2} \\ \dfrac{1}{\left( \dfrac{x+y}{2} \right)} \cdot \dfrac 22 &= \dfrac{\left( \dfrac 1x + \dfrac 1y \right)}{2} \cdot \dfrac{xy}{xy} \\ \dfrac{2}{x+y} &= \dfrac{x+y}{2xy} \\ (x+y)^2 &= 4xy \\ x^2 - 2xy + y^2 &= 0 \\ (x-y)^2 &= 0 \\ x-y &= 0 \\ x &= y \end{align}

Los dos lados son iguales cuando $x = y$. De lo contrario, no lo son.

Si la pregunta no funciona, en general, para dos variables, entonces probablemente tampoco funcionará, en general, para más de dos variables.

0 votos

Entonces, ¿solo cuando todos los valores son iguales al promedio? ¡Interesante...!

0 votos

Desigualdad AM-HM como en la respuesta de J.G.

4voto

Timkin Puntos 41

También debes considerar, al determinar un método de solución apropiado, que 'promedio' es un término común utilizado para describir la media aritmética. Hay muchas otras opciones de función de promediado que podrías seleccionar para estos datos. Como primera sugerencia, prueba la media geométrica: $$G(\mathbb{x}) = \sqrt[\leftroot{-3}\uproot{3}n]{x_1 \cdot x_2 \cdots x_n}$$ Debes notar que si $\mathbb{y}=(\frac{1}{x_1},\frac{1}{x_2},\ldots,\frac{1}{x_n})$ entonces $$\frac{1}{G(\mathbb{y})} = G(\mathbb{x}).$$

4voto

GmonC Puntos 114

La respuesta corta es que tomar inversos no es una operación lineal. Esto es casi tautológico, en la medida en que una operación lineal es aquella que "se comporta bien" con respecto a las combinaciones lineales, en el sentido de que la operación aplicada a una combinación lineal de valores da el mismo resultado que tomar la misma combinación lineal de los resultados de la operación aplicada a esos valores; el promedio de $n$ valores es un caso especial de una combinación lineal de esos valores (es decir, la suma de $\frac1n$ veces cada valor).

La única razón por la que esta respuesta corta es interesante es que las operaciones lineales han sido clasificadas, por lo que uno generalmente puede determinar por inspección si una operación es lineal o no lo es. Para operaciones que producen un solo número a partir de otro número, las únicas operaciones lineales son la multiplicación por un número fijo (por lo tanto, triplicar es una operación lineal). Tomar el inverso de un número no tiene esta forma, y no es lineal. Tampoco lo son tomar el cuadrado, la raíz cuadrada o el logaritmo; encontrarás que cada una de esas operaciones tampoco se comportan bien (el término técnico es "conmutar con") al tomar promedios en el sentido de tu pregunta (el cuadrado del promedio no es el promedio de los cuadrados, y así sucesivamente).

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X