11 votos

Suma de promedios vs promedio de sumas

Tengo básicamente una tabla de números, una serie temporal de mediciones. Cada fila en la tabla tiene 5 valores para las 5 categorías diferentes, y una fila de suma para el total de todas las categorías.

Si tomo el promedio de cada columna y sumo los promedios juntos, ¿debería ser igual al promedio de las sumas de las filas (ignorando errores de redondeo, por supuesto)?

(Tengo un caso donde los dos valores siguen saliendo diferentes por alrededor del 30% y me pregunto qué tan loco estoy.)

Actualización: Ver abajo - estaba (ligeramente) loco y tenía un error en mi código.

0 votos

¿Es el número de filas 14?

0 votos

De hecho, es un promedio móvil exponencial con N de 50.

0 votos

(Es decir, la dimensión temporal vertical se calcula con un promedio móvil. Para que lo sepas, los valores de las columnas tienden a diferir por un factor de aproximadamente 50, con una columna predominante.)

12voto

user8269 Puntos 46

El promedio de las entradas en una columna es la suma de las entradas en esa columna, dividida por el número de entradas. El número de entradas es el número de filas. Entonces, la suma de los promedios es la suma de todas las entradas en la tabla, dividida por el número de filas.

El promedio de las sumas de las filas es la suma de todas las entradas en la tabla dividida por el número de filas, por lo que deberías obtener el mismo número de cualquier manera.

10voto

tejas Puntos 19

Por lo general, no es correcto, solo es lo mismo en casos específicos.

es decir, por lo general

Sum(x) / Sum(y) no es igual a Sum (x/y) / n

donde n es el total de entradas, x son entradas de fila y son entradas de columna.

solo es cierto si todas las y son iguales

por ejemplo: (1/2 + 3/5)/2 = 11/20 (1+3)/(2+5) = 4/7

Mientras que si y es igual (1/7 + 4/7)/2 = 5/14 (1+4)/(7+7) = 5/14

PD: Perdón por publicar en un hilo inactivo, solo quiero que sea correcto para cualquiera que lo esté buscando.

3voto

Param Puntos 26

¡¡Suspiro!! Encontré mi problema -- fue un error "duplicado" estúpido en mi código. Estaba buscando un error en la lógica del "promedio de sumas", pero estaba en la lógica del "suma de promedios" -- referenciando la variable incorrecta.

Bueno, de todos modos, hemos demostrado de mil maneras que la suma de promedios realmente ES igual al promedio de sumas, en caso de que sea importante para alguien en el futuro.

1 votos

Quizás esto debería ir como una actualización a la pregunta? De cualquier manera está bien. Asegúrate también de aceptar una respuesta ahora que tu problema está resuelto.

2voto

user9876 Puntos 5385

En realidad Steve podría estar en lo cierto. Te daré un ejemplo sencillo y luego te explicaré por qué personas inteligentes pueden llegar a respuestas diferentes porque, en cierto modo, ambas tienen su razón.

Primera fila: 5; 6; Segunda fila: 1; 2; Tercera fila: 3; 4;

Si haces la suma de los promedios o el promedio de las sumas como pidió Daniel, entonces obtendrás 7 como respuesta. Sin embargo, si eliminas el 1 dejando un agujero en tu tabla, entonces tu promedio de las sumas baja a 6 2/3 y tu suma de los promedios aumenta a 8.

Si tu tabla de datos tiene celdas en blanco o puntos de datos faltantes, entonces los dos casi nunca serán iguales. Si la tabla de datos está distribuida de manera equitativa sin puntos faltantes o agujeros en la tabla, entonces siempre deberían ser iguales. Cualquiera puede probar esto con MS Excel y la función =RAND(). Genera una tabla con cualquier número de filas/columnas y llena las filas y columnas con números aleatorios o deja que genere números aleatorios por ti. Luego usa =PROMEDIO() para promediar las columnas y =SUMA() para sumar los promedios. Luego invierte el proceso y usa =SUMA() para sumar las filas y =PROMEDIO() para promediar las sumas. Si la tabla está completa, entonces los dos números serán exactamente iguales. Sin embargo, si por alguna razón faltan entradas en tus datos, entonces pueden variar en gran medida. Simplemente comienza a borrar puntos de datos en el medio de la tabla y observa cómo los dos resultados fluctúan considerablemente.

También cabe destacar que si intercambias las filas y columnas, obtendrás resultados completamente diferentes, así que asegúrate de ser consistente. Si promedias las filas en el ejemplo anterior y sumas los promedios, o sumas las columnas y promedias las sumas, entonces obtienes 10.5 con una tabla completa y 11 y 10, respectivamente, con el 1 faltante.

1 votos

Tenga en cuenta que OP escribió en uno de los comentarios que no hay espacios en blanco en la tabla. También tenga en cuenta que si la respuesta de Steve se elimina, nadie sabrá qué significa su primera oración.

0voto

Remi.b Puntos 161

La matemática mixta es correcta. Tome 3 columnas; 10 10s, 5 1s y 2,3,5,6,6,7,9,10 (8 valores aleatorios), no promedie los espacios en blanco. El promedio de promedios es 5.67; el promedio de todos los valores es 6.65. @Matemática mixta; está bien responder a un hilo antiguo. Esta cosa, verdad o verídico, vive para siempre en internet

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X