21 votos

Cuándo podemos utilizar tantiles y el medial, en lugar de cuantiles y la mediana?

No puedo encontrar definiciones para tantile o medial en la Wikipedia o Wolfram Mathworld, pero la siguiente explicación es dada en Bílková, D. y Mala, I. (2012), "Aplicación de la L-momento de método cuando la modelización de la distribución de la renta en la República checa", de Austria Diario de Estadísticas, 41 (2), 125-132.

La media es el valor de una $50\%$ (muestra) tantile tal como la muestra la mediana es igual al valor de una $50\%$ de la muestra y los cuantiles. Muestra tantiles así como la muestra de cuantiles se basan en una orden de la muestra. Primero de todo, acumulado sumas de las observaciones en la orden de la muestra son evaluados. Entonces, para un determinado porcentaje de $p$, $0<p<100$, un $p\%$ tantile se define como el valor de la variable analizada que divide a todas las observaciones en la orden de la muestra en dos partes: la suma de menor o igual observaciones es $p\%$ de la suma total de las observaciones y la suma de las observaciones que están más representa el residual $(100-p)\%$ de esta suma.

¿Cuándo tiene sentido utilizar estas medidas de ubicación, en lugar de la forma más convencional de la mediana o de otros cuantiles? Una situación posible, los ingresos de los hogares, es en dicho artículo:

Puede ser derivada a partir de esta definición, la medial puede ser utilizado como un razonable característica del nivel de ingresos, ya que los hogares con ingresos menores o iguales a la media de recibir la mitad de la renta total de la muestra, aquellos con los ingresos más altos que la media de la recepción de la otra mitad.

En este caso, el ingreso medio de los hogares fue encontrado para ser CZK 117,497 (es decir, la mitad de los hogares ganado más de esta y la otra mitad ganó de arriba), en comparación con una media de ingresos del hogar de CZK 133,930 (hogares con un ingreso por encima de esta figura recibe la mitad del total de ingresos). Tenga en cuenta que esta comparación no necesariamente reflejan la asimetría de los ingresos de los hogares, o incluso su no-uniformidad: incluso si los ingresos de los hogares fueron distribuidos de manera uniforme, la media sería todavía se encuentran por encima de la mediana. Entiendo que la definición de la media, sólo sería igual a la mediana de si en todos los hogares reciben el mismo ingreso.

Entonces, ¿hay alguna razón en particular para preferir la media, en este caso, o al menos utilizarlo como una medida adicional? Exactamente lo que hace que la comparación entre la mediana y medial nos dicen? No parece que el medial es directamente comparable con la de otras medidas de tendencia central, por las razones que acabo de señalar. Hay otras situaciones donde medial/tantiles son ampliamente utilizados o visto como particularmente informativo? Ejemplos prácticos de los que se usan, con la muestra de trabajos de investigación, sería muy bienvenido, y una idea intuitiva del contexto más amplio en el que podrían resultar útil sería aún mejor.

Se debe exigir a los totales y subtotales de ser significativo - algo que parece pertinente con el dinero, y cómo "el pastel" es distribuido - pero incluso el acto de adición sólo tiene sentido para ciertas cantidades. Para intensivas en lugar de extensas propiedades, tales como la densidad o la temperatura, cualquier clase de adición no sería físicamente significativa. A mí me parece que una propiedad extensiva es necesario pero no suficiente para tantiles a ser de gran ayuda, ya me puedo imaginar un envío analista interesado en lo que el peso de la carga transportada es de corte, de modo que el 50% de toda la carga (por peso) se realiza la carga de peso o por encima, sin embargo, no me puedo imaginar un ecologista interesado en lo que la longitud de tritón es tal que el 50% de la longitud total de todos los tritones es aportado por los tritones de la longitud o más.

5voto

kjetil b halvorsen Puntos 7012

Esto es realmente un comentario, pero demasiado largo para un comentario. Está tratando de aclarar la definición de "tantile" (en el $p=0.5$ caso análogo al de la mediana). Deje $X$ ser (por simplicidad) absolutamente variable aleatoria continua con función de densidad de $f(x)$. Suponemos que la expectativa $\mu= \mathbb E X$ no existe, que es la integral de la $\mu=\int_{-\infty}^\infty x f(x)\; dx $ converge. Definir, de forma análoga con la función de distribución acumulativa, un "acumulativa expectativa de la función" (nunca he visto tal concepto, tiene un nombre oficial?) por $$ G(t) = \int_{-\infty}^t x f(x) \; dx $$ A continuación, el "tantile" es la solución a $t^*$ de la ecuación de $G(t^*) = \mu/2$.

Es esta la interpretación correcta? Es esto lo que se pretendía?

Para volver a la pregunta original, en el contexto de una distribución de la renta, el tantile es el valor de los ingresos tal que la mitad del total de los ingresos es para la gente con la que por encima de los ingresos, y la mitad del total de los ingresos es para las personas que tienen menos que los ingresos.

EDIT

Esta cantidad ( función de $G(t)$ anterior) está relacionado con varias riesgo de medida que se utiliza en algunos literatura financiera, tales como "espera que el déficit". Tener una mirada en el papel de Un J Ostaszewski & M B Gietzmann: "la Creación de Valor con Tinte de Divulgación Opción: Óptimo del Riesgo de aislamiento con una parte Superior de la Cola a la Divulgación de la Estrategia" (mayo de 2006), especialmente alrededor de la página 15, donde se definen algo que ellos llaman "Hemi-significa" que se relaciona con $G(t)$ anterior, también "se espera que el déficit relativo de a $t$ y también se conoce como $primera baja parcial momento". Sería interesante indagar en esto de las conexiones ... Otro término que se usa para esta idea es "parcial expectativa", véase, por ejemplo, http://math.stackexchange.com/questions/1080530/the-partial-expectation-mathbbex-xk-for-an-alpha-stable-distributed-r y el uso de google!

También, el libro de Kotz Y Kleiber:"Estadística Distribuciones de Tamaño en la Economía y Ciencias Actuariales" dar la información pertinente, en la página 22 de definir (en este caso $X>0$) $$ F_k(x) = \frac1{E X^k} \int_0^x t^k f(t)\; dt $$ que es el "$k$th-momento de la distribución", tenga en cuenta que$G(t)=\mu F_1(t)$, por lo que es básicamente el primer momento de la distribución. Se refieren a Champernown (1974), que llama a $F_1$ en los ingresos de la curva", y denota el subyacente cdf $F$$F_0$. En términos del primer momento de la distribución de la curva de Lorenz puede ser dado como $$ \{(u, L(u))\} = \{(u,v)\colon u=F(x),v=F_1(x); x\ge 0\} $$

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X