4 votos

¿Cómo se puede interpretar una media aritmética sin conocer la distribución subyacente?

Buscando en Google Analytics, no puedo ayudar, pero creo que el resumen de las estadísticas que se presentan los promedios tienen el potencial de ser muy engañoso (y probablemente son, en la práctica). Para algunas de estas estadísticas de resumen, no parece ser una manera fácil de determinar la distribución de los números subyacente en los datos. Para otras estadísticas, es al parecer no hay manera de determinar la distribución subyacente. Es suficientemente claro que el subyacente de las distribuciones de algunas de estas estadísticas son de no-Gaussiano.

Así que me gustaría saber si tiene "promedio" estadísticas de resumen sin conocer la distribución de la base de números, ¿cómo se puede interpretar o deducir el significado de ellos?

4voto

AdamSane Puntos 1825

Como Gertrude Stein podría haber escrito si hubiera sido un estadístico, "¿vamos a suponer que todo lo que ella significa es que un medio es un medio es un medio"$^{\,*}$.

Usted no tiene que tener la normalidad de la media para ser significativo. Yo lo uso bastante feliz cuando pienso en una exponencial o un modelo de Poisson, o de un binomio, o con un uniforme discreta, por ejemplo, y aun cuando no tengo realmente un buen modelo para la distribución. (No necesariamente es la única estadística que importa, sin embargo, pero es una cosa muy útil en una amplia gama de situaciones.)

La media de la muestra (dejando a un lado cualquier interés en su derecho propio, como un tipo de datos-resumen) es un estimador imparcial de la población (cuando la hay -, sino que, probablemente, se aplican a todos o al menos casi todas las medidas que estamos viendo en la práctica), y converge a ella.

Dos grandes consideraciones cuando se trata de estimar la población cantidades:

  1. Qué cantidades son de interés para usted?

  2. Lo que es una buena manera de estimar ellos?

Si se incluyen "la media" en 1. pero no sé mucho acerca de la distribución que se está muestreo, entonces usted no sabe una buena manera de estimar la media (es decir, es difícil decir mucho acerca de 2.); al menos la media de la muestra tiene algunas propiedades útiles, y debe llegar con el tiempo, al menos si la población está de muestreo es la población de interés. En ese caso, usted todavía puede interpretar la media como, también, la media, y como una estimación de la media de población.

Imaginemos, por ejemplo, yo era el muestreo de una distribución logarítmico-normal (pero no sé que). La media de la muestra se va a "trabajar" como una estimación de la media de población. [Aunque dependiendo de cuánto la asimetría con la que estamos tratando, puede ser bastante ruidoso, y si queremos dar un intervalo para la media, que es peor.]

Sin embargo, mientras que la media tiene unas buenas propiedades cuando estás de muestreo de lo que usted desea para hacer inferencias acerca de, usted tiene razón para acercarse a la media, con la precaución (no es muy robusto, por ejemplo, por lo que incluso un poquitín de la contaminación es un problema para él, y que sin duda puede engañar a nosotros si estamos interesados en conocer algo acerca de la población ausente el proceso de contaminación$^\dagger$), pero, del mismo modo que no tiene que ser demasiado centrado en la distribución Gausiana, si usted realmente quiere saber acerca de la media de población.


$*$ que si ella había escrito que haya sido en una obra llamada Óperas y promedios

$\dagger$ podría ser mejor aceptar un potencial considerable sesgo inducido por un leve robustification de una cantidad potencialmente ilimitada si la contaminación es salvaje suficiente

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X