6 votos

Una pregunta sobre una ecuación de estimación no paramétrica

Esta es una pregunta que surgió del estudio de Hogg y Craig "Introducción a la Estadística Matemática",7ª edición, página 568.

enter image description here

Se supone que hemos tomado una muestra aleatoria de $X_1,\ldots,X_{n1}$ y una muestra aleatoria de $Y_1,\ldots, Y_{n_2}$, $n$ denota la combinación de tamaño de la muestra, es decir, $n=n_1+n_2$ y sgn(.) es $1$ si la cantidad en la brackers es positivo,$0$ si es cero y $-1$ si es negativo. También clasificar las variables de baja a alta.

Podría usted por favor me ayuden a entender cómo los autores llegan a la conclusión de que la diferencia en las medianas calculista resuelve la ecuación? No hay ninguna explicación de su parte y la palabra "fácil" me parece fuera de lugar :)

Gracias.

4voto

jldugger Puntos 7490

Hay un problema aquí, muy bien captado por el último comentario a la pregunta:

No [Ecuación] 10.5.6 nos preguntan cuánto $Y$ a cambio de modo de que la mediana de $Y$ coincide con la mediana de $n=n_1+n_2$ valores? ¿Por qué es la mediana de $X$ lugar?

Cuando el significado de la ecuación se analiza--traducido de matemáticas-en ese sentido el inglés-la respuesta es clara.


La traducción de las Matemáticas inglés

Vamos a comenzar por aclarar el contexto. Dos conjuntos de datos $X=(x_i,\,i=1,\ldots,n_1)$ $Y=(y_i,\,i=1,\ldots,n_2)$ son cada supone que surgen de muestreo de dos distribuciones continuas. (La continuidad de la asunción es simplemente una conveniencia para permitir a asumir todos los valores son distintos.) El análisis se refiere con el cambio de los valores: todos los $y_i$ será reducido por una constante $\Delta$ (a determinar). Estos datos, es decir, el original de la $X$ y el desplazado $Y_\Delta = (y_1-\Delta, y_2-\Delta, \ldots, y_{n_2}-\Delta)$--se combinan en un único conjunto de datos $X\cup Y_\Delta = Z_\Delta=(z_i,\,i=1,\ldots,n=n_1+n_2)$ y ordenados de manera que $z_i \le z_{i+1}$ todos los $1\le i\lt n$. La posición en el orden de clasificación es el rango del valor, aquí escrito como una función de $R$:

$$R(z_j)=j.$$

(Como $\Delta$ varía, de vez en cuando se de dos vías lazos entre algunos elementos de la $X$$Y_\Delta$. La función rank $R$ puede-y suele-extended asignando a cualquier atado grupo el promedio de los rangos de cada elemento del grupo recibiría si el empate se arbitrariamente resuelto.)

De esta manera cada uno de los elementos de $X$ $Y_\Delta$ recibe un rango entre el$1$$n$. El medio rango de $(n+1)/2$ divide las filas en dos mitades: la mitad superior $H^{+}$ se compone de todos los rangos estrictamente mayor que $(n+1)/2$ y la mitad inferior $H^{-}$ se compone de todos los rangos estrictamente menor que $(n+1)/2$. La aparición de los signum función, escrito $\text{sgn}$, en la ecuación simplemente asigna el valor de $1$ a los elementos en la mitad superior y $-1$ a los elementos en la mitad inferior. Otra forma de escribir la suma en la Ecuación 10.5.6 es recoger todos los términos que se asignan $+1$ en un grupo, estos son los elementos de $Y$ en la mitad superior--y todos los términos que se asignan $-1$ en el otro grupo. Evidentemente, la suma se reduce a una diferencia de cuenta:

$$0 = \sum_{i=1}^{n_2} \text{sgn}\left(R(y_i-\Delta) - \frac{n+1}{2}\right) = |Y_\Delta \cap H^{+}| - |Y_\Delta \cap H^{-}|$$

(donde $|\cdot|$ denota el número de elementos de un conjunto).

En otras palabras, la ecuación pide que $Y_\Delta$ ser equilibrada (como un subconjunto de a $Z_\Delta$) en el sentido de que el número de elementos contenidos en las mitades superior e inferior de $Z_\Delta$ ser igual:

$$|Y_\Delta \cap H^{+}| = |Y_\Delta \cap H^{-}|.$$

(En general, digamos que cualquier conjunto finito de números de $W$ es equilibrada acerca de algún valor $m$ cuando hay igualmente muchos de los valores en $W$ que exceden $m$, ya que hay menos de $m$. Cualquier $m$ se llama mediana de $W$.)

La tarea que tenemos ante nosotros, entonces, es

Cuánto ($\Delta$) los datos de $Y$ ser desplazado en el fin de equilibrar $Y_\Delta$ dentro $Z_\Delta = X \cup Y_\Delta$?

La resolución de la Ecuación

El reclamo es que el $Y$ debe ser desplazado hasta una mediana de $Y_\Delta$ (equivalente a un promedio de $Y$, $m_Y$, menos $\Delta$) es un medio para $X$. Este es, en realidad, dos reclamaciones, que voy a abordar en orden de dificultad.

  1. Cuando $\Delta = m_Y - m_X,$ $Y_\Delta$ es equilibrado.

    El número de elementos de a $Z_{m_Y-m_X}$ superior a $m_X$ es el número de elementos de a $X$ superior a $m_X$ más el número de elementos de a $Y$ superior a $m_Y$. Estas igual que el número de elementos menos de $m_X$$m_Y,$, respectivamente, de dónde $m_X$ es una media de $Z_\Delta$ $Y_\Delta$ debe ser equilibrado en $Z_\Delta$.

  2. Al $Y_\Delta$ es equilibrada, $\Delta$ puede ser expresado como la diferencia entre la mediana de $X$ y una mediana de $Y$.

    La suposición es que el número de elementos de a $Y_\Delta$ en la mitad superior de $Z_\Delta$ es igual al número en la mitad inferior de $Z_\Delta$. (Lo que es equivalente, la mediana de $Z_\Delta$ es una media de $Y_\Delta$.) En consecuencia, el número de elementos en la mitad superior de $Z_\Delta$ que no en $Y_\Delta$ es igual al número en la mitad inferior de $Z_\Delta$ que no en $Y_\Delta$. Ya que todos estos elementos están en $X$, $X$ es también el equilibrio como un subconjunto de a $Z_\Delta$. Que no significa otra cosa que la mediana de $Z$ es una media de $X$.

    Llegamos a la conclusión de que, en promedio, de $Z$ coincide tanto con una mediana de $X$, $m_X$, y una mediana de $Y_\Delta$, $m_Y - \Delta$. La conclusión deseada se sigue inmediatamente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X