23 votos

Es la mediana de un tipo de media, para algunos la generalización de "media"?

El concepto de "media", que deambula mucho más amplio que el tradicional de la media aritmética; no se extienden tan lejos como para incluir la mediana? Por analogía,

$$ \text{datos raw} \desbordado{\text{id}}{\longrightarrow} \text{datos raw} \desbordado{\text{media}}{\longrightarrow} \text{raw significa} \desbordado{\text{id}^{-1}}{\longrightarrow} \text{media aritmética} \\ \text{datos raw} \desbordado{\text{recip}}{\longrightarrow} \text{recíprocos} \desbordado{\text{media}}{\longrightarrow} \text{significa recíproca} \desbordado{\text{recip}^{-1}}{\longrightarrow} \text{media armónica} \\ \text{datos raw} \desbordado{\text{log}}{\longrightarrow} \text{registros} \desbordado{\text{media}}{\longrightarrow} \text{media log} \desbordado{\text{log}^{-1}}{\longrightarrow} \text{media geométrica} \\ \text{datos raw} \desbordado{\text{cuadrado}}{\longrightarrow} \text{plazas} \desbordado{\text{media}}{\longrightarrow} \text{cuadrada de la media aritmética} \desbordado{\text{cuadrado}^{-1}}{\longrightarrow} \text{root mean square} \\ \text{datos raw} \desbordado{\text{rango}}{\longrightarrow} \text{filas} \desbordado{\text{media}}{\longrightarrow} \text{puntuación media} \desbordado{\text{rango}^{-1}}{\longrightarrow} \text{mediana} $$

La analogía estoy dibujo es la cuasi-media aritmética, dada por:

$$M_f(x_1,\dots,x_n)=f^{-1}\left(\frac{1}{n}\sum_{i=1}^{n}f(x_i) \right)$$

Para la comparación, cuando decimos que la mediana de los cinco elemento del conjunto de datos es igual al tercer elemento, podemos ver que a medida equivalente a la clasificación de los datos de uno a cinco (lo que podríamos denominar una función $f$); tomando la media de los datos transformados (que es de tres); y leyendo el valor del elemento de datos que tenía el rango tres (una especie de $f^{-1}$).

En los ejemplos de la media geométrica, media armónica y RMS, $f$ es una función fija que puede ser aplicado a cualquier número en el aislamiento. En contraste, para asignar un valor, o la de trabajar a partir de los rangos de los datos originales (interpolando en caso necesario) requiere un conocimiento de la totalidad del conjunto de datos. Además, en las definiciones que he leído de la cuasi-media aritmética, $f$ que se requiere para ser continua. Es la mediana siempre considerada como un caso especial de cuasi-media aritmética, y si es así ¿cómo es el $f$ definido? O es la mediana jamás descrita como una instancia de alguna otra noción más amplia de "media"? El cuasi-media aritmética no es ciertamente la única generalización disponible.

Parte del problema es terminológica (¿qué "significa" significa de todos modos, especialmente en contraste con la "tendencia central" o "promedio"?). Por ejemplo, en la literatura de sistemas de control borroso, una función de agregación $F:[a,b] \times [a,b] \to [a,b]$ es una función creciente con $F(a,a)=a$$F(b,b)=b$; una función de agregación para que $\min(x,y) \leq F(x,y) \leq \max(x,y)$ todos los $x,y \in [a,b]$ se llama un "medio" (en un sentido general). Tal definición es, ni que decir, muy amplia! Y en este contexto, la mediana es de hecho conoce como un tipo de media.$^{[1]}$ Pero tengo curiosidad de saber si menos amplia de las caracterizaciones de la media puede extender lo suficiente como para abarcar la mediana de los llamados generalizada media (que podría ser mejor descrito como la "potencia media") y los de Lehmer decir no, pero otros pueden. Para lo que vale, la Wikipedia incluye la "mediana" en su lista de "otros medios", pero sin más comentarios o citas.

$[1]$: Una definición tan amplia de la media, convenientemente se extendió por más de dos entradas, parece estándar en el campo del control borroso y surgieron muchas veces durante las búsquedas en internet de las instancias de la mediana que se describe como una mediana; voy a citar por ejemplo, Fodor, J. C., & Rudas, I. J. (2009), "En Algunas Clases de Funciones de Agregación que se Migrative", IFSA/EUSFLAT Conf. (p 653-656). Por cierto, en este documento se señala que uno de los primeros usuarios del término "medio" (moyenne) fue de Cauchy, en el Cours d'analyse de l'École royale polytechnique, 1ère partie; Analizar algébrique (1821). Más tarde contribuciones de Aczél, Chisini, Kolmogorov y de Finetti en el desarrollo de conceptos más generales de "media" de Cauchy, que se reconocen en Fodor, J., y Roubens, M. (1995), "Sobre la significatividad de los medios", Journal of Computational and Applied Mathematics, 64(1), 103-115.

13voto

Mike Anderson Puntos 131

Si usted piensa de la media como el punto de minimizar la función de pérdida cuadrática de la ESS, entonces la mediana es el punto de minimizar el lineal de la función de pérdida LOCO, y el modo es el punto de minimizar algunos 0-1 función de pérdida. No hay transformaciones necesarias.

Así que la mediana es un ejemplo de un Fréchet media.

9voto

AdamSane Puntos 1825

Aquí está una manera de que usted podría considerar una mediana como un "general de ordenación de la media" -- en primer lugar, definir cuidadosamente sus ordinaria de la media aritmética en términos de estadísticas de orden:

$$\bar{x} = \sum_i w_i x_{(i)},\qquad w_i=\frac{_1}{^n}\,.$$

A continuación, mediante la sustitución de que el común de la media de estadísticas de orden con alguna otra función peso, tenemos una noción de "generalizada significa" que las cuentas de orden.

En ese caso, una gran cantidad de posibles medidas de centro de convertirse en "generalizada tipo de medios". En el caso de la mediana, por extraño $n$, $w_{(n+1)/2}=1$ y todos los demás son 0, y aún $n$, $w_{\frac{n}{2}}=w_{\frac{n}{2}+1}=\frac{1}{2}$.

Del mismo modo, si nos fijamos en M-estimación, ubicación estimaciones podrían también considerarse como una generalización de la media aritmética (donde para la media, $\rho$ es cuadrática, $\psi$ es lineal, o el peso de la función es plana), y la mediana también cae en esta clase de generalizaciones. Este es un poco diferente de la generalización de la anterior.

Hay una variedad de otras maneras podríamos extender la noción de 'decir', que podría incluir la mediana.

5voto

jldugger Puntos 7490

La pregunta que nos invita a caracterizar el concepto de "media" en una lo suficientemente sentido amplio para abarcar todos los medios habituales--el poder significa, $L^p$ medias, medianas, cortadas significa, pero no de una forma tan amplia que se vuelve casi inútil para el análisis de datos. Esta respuesta se analizan algunas de las propiedades axiomáticas que cualquier razonablemente útil la definición de "media" debe tener.


Axiomas Básicos

Una útil definición amplia de "media" para el propósito de análisis de datos podría ser cualquier secuencia bien definida, funciones deterministas $f_n:A^n\to A$ $A\subset\mathbb{R}$ $n=1, 2, \ldots$ tal que

(1) $\newcommand{\x}{\mathrm{x}} \newcommand{\min}{\text{min}}\min (\x)\le f_n(\x)\le \max(\x)$ todos los $\x = (x_1, x_2, \ldots, x_n)\in A^n$ (una media se encuentra entre los dos extremos),

(2) $f_n$ es invariante bajo permutaciones de sus argumentos (los medios no se preocupan por el orden de los datos), y

(3) cada una de las $f_n$ es no decreciente en cada uno de sus argumentos (como el aumento de los números, su media no puede disminuir).

Nos debe permitir $A$ a ser un subconjunto de los números reales (como el de todos los números positivos) debido a que un montón de medios, tales como el geométrico medio, se definen sólo en dichos subconjuntos.

Podríamos añadir también que

(1') existe, al menos en algunos $\x\in A$ que $\min(\x)\ne f_n(\x)\ne \max(\x)$ (no extremos). (No podemos exigir que este siempre espera. Por ejemplo, la mediana de $(0,0,\ldots,0,1)$ es igual a $0$, que es el mínimo.)

Estas propiedades parecen captar la idea detrás de un "significa" ser algún tipo de "valor medio" de un conjunto de (desordenada) de datos.

La consistencia de los axiomas

Estoy más tentado a estipular el lugar menos obvio consistencia criterio

(4.a) El rango de $f_{n+1}(t, x_1, x_2, \ldots, x_n)$ $t$ varía a lo largo del intervalo de $[\min(\x), \max(\x)]$ incluye a $f_n(\x)$. En otras palabras, siempre es posible salir de la media sin cambios por contigua a un valor adecuado $t$ a un conjunto de datos. En conjunción con (3), implica que el adyacentes valores extremos a un conjunto de datos se tire de la media hacia los extremos.

Si deseamos aplicar el concepto de media para una distribución o infinito de la población", a continuación, una forma sería la de obtener en el límite de arbitrariamente grandes muestras aleatorias. Por supuesto, el límite no siempre existe (no existe para la media aritmética cuando la distribución no tiene ninguna expectativa, por ejemplo). Por lo tanto yo no quiero imponer un cargo adicional axiomas para garantizar la existencia de tales límites, pero la siguiente que parece natural y útil:

(4.b) Siempre que $A$ es limitado y $\x_n$ es una secuencia de muestras de una distribución $F$ apoyado en $A$, entonces el límite de $f_n(\x_n)$ casi seguro que existe. Esto evita que la media de siempre "rebotando" dentro de $A$ incluso como tamaños de muestra más grandes y más grandes.

A lo largo de la misma línea, se podría limitar aún más la idea de un medio para insistir en que se convierta en un mejor estimador de la "ubicación" de la muestra aumento de tamaño:

(4.c) Cuando $A$ es acotado, entonces la varianza de la distribución de muestreo de $f_n(X^{(n)})$ para una muestra aleatoria $X^{(n)} = (X_1, X_2, \ldots, X_n)$ $F$ es no decreciente en $n$.

Axioma de continuidad

Podríamos considerar la posibilidad de pedir medios para variar "muy bien" con los datos:

(5) $f_n$ es separadamente continua en cada argumento (un pequeño cambio en los valores de los datos no debe inducir un salto repentino en su media).

Este requisito podría eliminar alguna extraña generalizaciones, pero no se descarta cualquier bien sabido decir. Va a descartar algunas funciones de agregación.

Una invariancia axioma

Podemos concebir de medios como la aplicación de cualquiera de intervalo o relación de datos (en Stevens conocido sentido). No podemos exigir un invariante bajo cambios de ubicación (la media geométrica no es), pero se puede requerir

(6) $f_n(\lambda \x) = \lambda f_n(\x)$ todos los $\x \in A^n$ y todos los $\lambda \gt 0$ que $\lambda \x \in A^n$. Esto solo nos dice que somos libres para calcular $f_n$ utilizando las unidades de medida que nos gusta.

Todos los medios mencionados en la pregunta se cumple este axioma, excepto para algunas funciones de agregación.


Discusión

General funciones de agregación $f_2$, tal como se describe en la pregunta, ¿ que no necesariamente satisfacen los axiomas (1'), (2), (3), (5), o (6). Si se satisfacen cualquier consistencia de los axiomas puede depender de cómo se extienden a $n\gt 2$.

La habitual muestra de mediana disfruta de todas estas propiedades axiomáticas.

Podríamos aumentar la consistencia de los axiomas para incluir

(4.d) $f_{2n}(\x;\x) = f_n(\x)$ todos los $\x \in A^n.$

Esto implica que, cuando todos los elementos de un conjunto de datos se repiten con la misma frecuencia, la media no cambia. Esto puede ser demasiado fuerte, sin embargo: el Winsorized significa que no tiene esta propiedad (excepto asintóticamente). El propósito de Winsorizing en el $100\alpha\%$ nivel es proporcionar resistencia contra los cambios en al menos $100\alpha\%$ de los datos en cualquiera de los extremos. Por ejemplo, el 10% Winsorized media de $(1,2,3,6)$ es la media aritmética de $(2,2,3,3)$, igual a $2.5$, pero el 10% Winsorized media de $(1,1,2,2,3,3,6,6)$$3.5$.

No sé que de la consistencia de los axiomas (4.a), (4.b), o (4.c) sería más deseable o útil. Ellos parecen ser independientes: no creo que dos de ellos implican el tercero.

4voto

Nick Cox Puntos 22819

Uno fácil, pero fructífera generalización es a medios ponderados, $\sum_{i=1}^n w_i x_i / \sum_{i=1}^n w_i,$ donde $\sum_{i=1}^n w_i = 1$. Claramente el común o de jardín de la media es la más simple caso especial con el mismo peso $w_i = 1/n$.

Dejar que los pesos dependen del orden de los valores de magnitud, desde el más pequeño al más grande, los puntos a varios otros casos especiales, en particular la idea de una media limitada, que es conocido por otros nombres también.

Para evitar el excesivo uso de la notación, donde no es necesario o útil, en especial, imaginemos por ejemplo, ignorando el más pequeño y el más grande de los valores y tomar el (mismo peso) media de los otros. O imaginar ignorando a las dos más pequeñas y dos grandes y tomando la media de los otros; y así sucesivamente. El más vigoroso de recorte sería ignorar a todos, pero el uno o dos valores del medio en orden, dependiendo de si el número de valores era par o impar, que es, naturalmente, sólo el familiar mediana. Nada en la idea de recortar compromete a ignorar la igualdad de los números en la cola de un ejemplo, pero diciendo más sobre asimétrica recorte nos llevaría más lejos de la idea principal en este hilo.

En resumen, los medios (sin calificar) y las medianas son extremas, limitando los casos de la familia de (simétrica) tapizados en medios. La idea general es permitir a los compromisos entre un ideal de utilizar toda la información en los datos y otro ideal de proteger a sí mismo de los extremos de puntos de datos, que puede ser poco fiable de los valores atípicos.

Ver la referencia aquí para uno bastante reciente revisión.

2voto

Sean Hanley Puntos 2428

Creo que la mediana puede ser considerado un tipo de una generalización de la media aritmética. En concreto, la media aritmética y la mediana (entre otros) pueden ser unificados como casos especiales de la Chisini media. Si vas a realizar alguna operación sobre un conjunto de valores, el Chisini significa que es un número que puede sustituir para todos los valores originales de la serie y aún así obtener el mismo resultado. Por ejemplo, si desea que la suma de sus valores, la sustitución de todos los valores de la media aritmética se dan la misma suma. La idea es que un cierto valor es representativo de los números en el conjunto en el contexto de una determinada operación sobre los números. (Una consecuencia interesante de esta forma de pensar es que un determinado valor de la media aritmética, sólo puede considerarse representativa, bajo el supuesto de que se están haciendo ciertas cosas con los números.)

Esto es menos evidente para la mediana (y que me tenga en cuenta que la mediana no está en la lista como uno de los Chisini significa en Wolfram o Wikipedia), pero si se permitiera que las operaciones sobre las filas, la mediana podría encajar dentro de la misma idea.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X