41 votos

Hay una definición aceptada por la mediana de una muestra en el avión, o el aumento de pedidos de los espacios?

Si es así, ¿qué? Si no, ¿por qué no?

Para una muestra en la línea de la mediana, minimiza el total de la desviación absoluta. Parecería natural extender la definición a R2, etc., pero nunca he visto. Pero entonces, he estado en el campo de la izquierda por un largo tiempo.

25voto

Omar Kooheji Puntos 384

No estoy seguro de que no hay una definición aceptada por un multivariante de la mediana. El que yo estoy familiarizado con es Oja del punto medio, lo que minimiza la suma de los volúmenes de simplices formado a través de subconjuntos de puntos. (Vea el enlace para ver una definición técnica.)

Actualización: El sitio de referencia para la Oja definición anterior también tiene un papel bonito que abarcan una serie de definiciones de un multivariante de la mediana:

19voto

David Pokluda Puntos 4284

Como @Ars dijo que no hay una definición aceptada (y este es un buen punto). Hay alternativas general de las familias de maneras para generalizar cuantiles en $\mathbb{R}^d$, creo que las más importantes son:

  • Generalizar cuantil proceso de Dejar $P_n(Una)$ ser empírica de la medida (=la proporción de observaciones en $Un$). Luego, con $\mathbb{A}$ elegido subconjunto de los conjuntos de Borel en $\mathbb{R}^d$ y $\lambda$ a real con valores de medida, puede definir el empírica de los cuantiles de la función:

    $U_n(t)=\inf (\lambda(A) : P_n(A)\geq t\in\mathbb{A})$

    Suponga que usted puede encontrar uno $A_{t}$ que le da la mínima. Entonces el conjunto (o un elemento del conjunto) $A_{1/2-\epsilon}\cap A_{1/2+\epsilon}$ le da la mediana cuando $\epsilon$ se hace lo suficientemente pequeño. La definición de la mediana es recuperado cuando el uso de $\mathbb{A}=(]-\infty,x] x\in\mathbb{R})$ y $\lambda(]-\infty,x])=x$. Ars respuesta cae en ese marco, supongo... tukey de la mitad del espacio de ubicación puede ser obtenido usando $\mathbb{A}(a)=( H_{x}=(t\in \mathbb{R}^d :\; \langle a, t \rangle \leq x ) $ y $\lambda(H_{x})=x$ ($x\in \mathbb{R}$, $a\in\mathbb{R}^d$).

  • variacional definición y M-estimación La idea aquí es que el $\alpha$-cuantil $Q_{\alpha}$ de una variable aleatoria $Y$ en $\mathbb{R}$ puede ser definido a través de una variacional de la igualdad.

    • La definición más común es el uso de la función de regresión cuantil $\rho_{\alpha}$ (también conocido como pinball pérdida, supongo que por eso ? ) $Q_{\alpha}=arg\inf_{x\in \mathbb{R}}\mathbb{E}[\rho_{\alpha}(Y-x)]$. En el caso de que $\alpha=1/2$ da $\rho_{1/2}(y)=|y|$ y se puede generalizar que a mayor dimensión de uso $l^1$ distancias como se ha hecho en @Srikant Respuesta. Este es el teórico de la mediana, pero le da empírica de la mediana si reemplazar expectativa por el empírica expectativa (media).

    • Pero Kolshinskii propone el uso de Legendre-Fenchel de transformación: desde $Q_{\alpha}=Arg\sup_s (s\alpha-f(s))$ donde $f(s)=\frac{1}{2}\mathbb{E} [|s-S|-|Y|+s]$ para $s\in \mathbb{R}$. Él da un montón de razones profundas para que (ver el artículo ;)). La generalización de este a dimensiones superiores requieren trabajar con un vectorial $\alpha$ y colocación de $\alpha$ $\langle s,\alpha\rangle$, pero usted puede tomar $\alpha=(1/2,\dots,1/2)$.

  • Orden parcial puede generalizar la definición de los cuantiles en $\mathbb{R}^d$ as pronto como usted puede crear un orden parcial (con clases de equivalencia).

Obviamente hay puentes entre las diferentes formulaciones. No todos son obvias...

14voto

Oak Puntos 1366

Geométrica de la mediana es el punto con la menor media distancia euclidiana de las muestras

7voto

Patrick Puntos 183

Una definición que viene cerca de él, para distribuciones unimodales, es la de tukey halfspace mediana

http://cgm.cs.mcgill.ca/~athens/Geometric-Estimators/halfspace.html http://www.isical.ac.in/~statmath/html/publicación/Tukey_tech_rep.pdf

6voto

Faken Puntos 276

El Tukey halfspace mediana puede ser extendido a >2 dimensiones con DEEPLOC, un algoritmo debido a Struyf y Rousseeuw; ver aquí para más detalles.

El algoritmo que se utiliza para aproximar el punto de mayor profundidad de manera eficiente; ingenuo métodos que intentan determinar exactamente que generalmente se ejecuta en contra del (de los computacional versión de "la maldición de la dimensionalidad", donde el tiempo de ejecución requerido para calcular una estadística crece exponencialmente con el número de dimensiones del espacio.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X