12 votos

Recuentos de trazado de caja frente al intervalo de Tukey-Kramer

La "muesca" documento de ayuda (o en el texto original) de boxplot en 'R' da lo siguiente:

Si las muescas de dos parcelas no se superponen que "hay una fuerte evidencia' que los dos medianas diferentes (Chambers et al, 1983, pág. 62). Ver boxplot.estadísticas para los cálculos utilizados.

y el"boxplot.estadísticas' da lo siguiente:

Las muescas (si se solicita) se extienden a +/-1.58 IQR/sqrt(n). Esto parece se basa en los cálculos de la fórmula con 1.57 en Chambers et al (1983, pág. 62), dado en la McGill et al (1978, pág. 16). Se basa en la normalidad asintótica de la mediana y aproximadamente igual los tamaños de muestra para los dos medianas que se comparan, y se dice que se más bien insensible a la base de las distribuciones de las muestras. El la idea parece ser la de dar aproximadamente un 95% intervalo de confianza para la diferencia en dos medianas.

Ahora estoy más familiarizado con el uso de la JMP versión de las pruebas de Tukey-Kramer prueba para la comparación de medias de las columnas. Documentación para JMP da esto:

Muestra una prueba de que es del tamaño de todas las diferencias entre los medios. Este es el Tukey o de Tukey-Kramer HSD (honestamente significativa de diferencia) prueba. (Tukey 1953, Kramer 1956). Esta prueba es exacta alfa-nivel prueba si los tamaños de muestra son iguales, y conservador, si la muestra los tamaños son diferentes (Hayter 1984).

Pregunta: ¿Cuál es la naturaleza de la conexión entre los dos enfoques? Es allí una manera de transformar una en la otra?

Parece que uno está buscando un aproximado de 95% IC para la media, y determinar si existe una superposición; y el otro es un "exacto de la prueba de alpha" (mis muestras son del mismo tamaño) para determinar si las medias de dos grupos de muestras están dentro de un rango razonable de cada uno de los otros.

Yo de referencia de los paquetes, pero estoy interesado en las matemáticas detrás de la lógica.

12voto

AdamSane Puntos 1825

En cuanto al muescas boxplot va, la McGill et al [1] se menciona en su pregunta contiene datos completos (no todo lo que digo aquí es explícitamente mencionado, pero sin embargo es lo suficientemente detallado como para entenderlo).

El intervalo es un robustified pero Gaussianas basado en una

El documento cita el siguiente intervalo de muescas (donde $M$ es la muestra de la mediana y de la $R$ es la muestra rango intercuartil):

$$M\pm 1.7 \times 1.25R/(1.35\sqrt{N})$$

donde:

  • $1.35$ es un asintótica factor de conversión para convertir IQRs en las estimaciones de $\sigma$ -- específicamente, es aproximadamente la diferencia entre el 0,75 cuantil y el 0.25 cuantil de una normal estándar; la población cuartiles son de aproximadamente 1.35 $\sigma$ aparte, de modo que un valor de alrededor de $R/1.35$ debe ser una constante (asintóticamente insesgados) estimación de $\sigma$ (más exactamente, sobre 1.349).

  • $1.25$ viene porque estamos lidiando con el error asintótico estándar de la mediana en lugar de la media. Específicamente, la varianza asintótica de la muestra, la mediana es $\frac{1}{4nf_0^2}$ donde $f_0$ es la densidad de la altura a la mediana. Para una distribución normal, $f_0$$\frac{1}{\sqrt{2\pi}\sigma}\approx \frac{0.3989}{\sigma}$, por lo que el error asintótico estándar de la mediana de la muestra es $\frac{1}{2\sqrt{N}f_0}= \sqrt{\pi/2}\sigma/\sqrt{N}\approx 1.253\sigma/\sqrt{N}$.

    Como StasK menciona aquí, los más pequeños de $N$, la más dudosa esto sería (en sustitución de su tercera razón con uno acerca de la razonabilidad de la utilización de la distribución normal en el primer lugar.

    La combinación de los dos anteriores, se obtiene una estimación asintótica del error estándar de la mediana de alrededor de $1.25R/(1.35\sqrt{N})$. McGill et al crédito esta a Kendall y Stuart (no recuerdo si la fórmula en particular, se produce o no, pero los componentes).

  • Así que todo lo que queda por discutir es el factor de 1.7.

    Tenga en cuenta que si estábamos comparando una muestra para un valor fijo (digamos, una hipótesis de la mediana) tendríamos que usar 1.96 para un 5% de la prueba; por tanto, si hemos tenido dos muy diferentes de los errores estándar (uno relativamente grande, uno muy pequeño), que sería sobre el factor de uso (ya que si la nula fuera verdadera, la diferencia sería casi en su totalidad debido a la variación en el uno con el mayor estándar de error, y el pequeño podría - aproximadamente - de ser tratado como efectivamente fijo).

    Por otro lado, si los dos errores estándar son los mismos, 1.96 sería demasiado grande un factor, ya que ambos conjuntos de muescas en -- para los dos conjuntos de muescas para que no se superponen estamos añadiendo uno de cada uno. Esto haría que el derecho del factor de $1.96/\sqrt{2}\approx 1.386$ asintóticamente.

    En algún lugar en el medio , hemos 1.7 como un duro compromiso. McGill et al describirlo como "empíricamente seleccionado". Viene muy cerca suponiendo una particular relación de varianzas, por lo que supongo (y no es nada más que eso) es que la selección empírica (presumiblemente basado en algunas de simulación) fue de entre un conjunto de ronda como proporción del valor de las desviaciones (como 1:1, 2:1,3:1,... ), de que la "mejor solución de compromiso" $r$ de la $r:1$ relación se enchufa en $1.96/\sqrt{1+1/r}$ redondeado a dos cifras. Al menos es una forma plausible para terminar muy cerca de 1.7.

Poniendo a todos (1.35,1.25 y 1.7) en conjunto da acerca de 1.57. Algunas fuentes se 1.58 mediante el cálculo de los 1,35 o la 1,25 (o ambos) con más precisión, sino como un compromiso entre 1.386 y 1.96, que 1.7 no es ni siquiera precisa a dos cifras significativas (es solo un estadio compromiso de valor), por lo que el adicional de precisión es inútil (que bien podría haber sólo la vuelta a la cosa entera a 1.6 y hacer con ella).

Tenga en cuenta que no hay ningún ajuste para comparaciones múltiples en cualquier lugar aquí.


Hay algunas distintas analogías en los límites de confianza para la diferencia en las pruebas de Tukey-Kramer HSD:

$$\bar{y}_{i\bullet}-\bar{y}_{j\bullet} \pm \frac{q_{\alpha;k;N-k}}{\sqrt{2}}\widehat{\sigma}_\varepsilon \sqrt{\frac{1}{n_i} + \frac{1}{n_j}}$$

Pero tenga en cuenta que

  • esta es una combinación de un intervalo, no dos separadas contribuciones a una diferencia (por lo que tienen un término en $c.\sqrt{\frac{1}{n_i} + \frac{1}{n_j}}$ más que los dos contribuyen por separado $k.\sqrt{\frac{1}{n_{i}}}$ $k.\sqrt{\frac{1}{n_j}}$ y suponemos constante de la varianza (así que no estamos tratando con el compromiso con la $1.96$ - cuando podríamos tener diferentes variaciones - en lugar de la asintótica $1.96/\sqrt{2}$ de los casos)

  • se basa en los medios, no en los camellones (por lo que no 1.35)

  • se basa en la $q$, el cual se basa a su vez en la mayor diferencia en los valores medios (por lo que no hay aún ninguna 1.96 parte en este, incluso uno dividido por $\sqrt{2}$). Por el contrario, en la comparación de varios diagramas de caja, no hay ninguna consideración de basar las muescas en el mayor diferencia en las medianas, todo es puramente pares.

Así, mientras que algunas de las ideas detrás de la forma de los componentes son relativamente similares, en realidad son bastante diferentes en lo que están haciendo.

[1] McGill, R., Tukey, J. W. y Larsen, W. A. (1978) las Variaciones de los diagramas de caja. El Estadístico Americano 32, 12-16.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X