18 votos

¿Tiene sentido realizar una cola de Kolmogorov-Smirnov?

Es significativo y posible llevar a cabo una one-cola KS prueba? ¿Qué sería de la hipótesis nula de esta prueba? O es la prueba de KS inherentemente una prueba de dos colas?

Yo me beneficiaría de una respuesta que me ayudó a entender la distribución de D (estoy trabajando a través de Massey 1951 papel, y encontrar la descripción de un reto, por ejemplo, se $D^{+}$ $D^{-}$ el supremum y infimum de las diferencias de la no-valor absoluto de las diferencias en los empírica Cdf?).

Seguimiento de la pregunta: ¿cómo se $p$-valores de $D^{+}$ $D^{-}$ obtenido? Muchas de las publicaciones que me estoy encontrando están presentando presentó valores, en lugar de CDF de $D_{n}$, $D^{+}$ y $D^{-}$.

Actualización: acabo de descubrir la pregunta relacionada con Lo que la hipótesis nula en un solo lado de Kolmogorov-Smirnov?, lo que me perdí en mi análisis inicial, antes de escribir esto.

26voto

AdamSane Puntos 1825

Es significativo y posible llevar a cabo una one-cola KS prueba?

Definitivamente.

es la prueba de KS inherentemente una prueba de dos colas?

No en todos.

¿Qué sería de la hipótesis nula de esta prueba?

No dejar claro si estamos hablando de un ejemplo o dos de prueba de la muestra. Mi respuesta a esta pregunta cubre tanto - si consideramos que el $F_X$ como representación de la cdf de la población de la que un $X$ muestra fue tomada, es de dos muestras, mientras que usted consigue el caso del ejemplo con respecto a $F_X$ como cierta la hipótesis de distribución ($F_0$, si prefiere).

Estrictamente, la nula tienes que probar en contra de la igualdad, pero si eres uno de los (grandes) grupo de personas que escriben direccional de valores nulos para una cola alternativa, usted podría escribir algo como esto:

$H_0: F_Y(t)\geq F_X(t)$

$H_1: F_Y(t)< F_X(t)\,$, por lo menos un $t$

(o su opuesto, por la otra cola, naturalmente)

Si le añadimos una suposición cuando utilizamos la prueba de que son iguales o que $F_Y$ será menor, entonces el rechazo de la nula implica (de primer orden) estocástico de pedido / primer orden de dominancia estocástica. En grandes muestras suficientes, es posible que el F de la cruz - incluso varias veces, y aún rechazar la cara prueba, por lo que la suposición es estrictamente necesario para la dominancia estocástica de mantener.

Vagamente si $F_Y(t)\leq F_X(t)$ con desigualdad estricta para al menos algunos de $t$ $Y$ 'tiende a ser más grande" que el de $X$.

La adición de los supuestos de este tipo no es raro, es estándar. No es particularmente diferente de asumir (a decir en un ANOVA) de que una diferencia en los medios es debido a un cambio de la distribución total (en lugar de un cambio en la asimetría, donde algunos de la distribución se desplaza hacia abajo y algunos cambios, pero de tal manera que la media ha cambiado).


Así que vamos a considerar, por ejemplo, un cambio en la media de lo normal:

enter image description here

El hecho de que la distribución de $Y$ es desplazado a la derecha por una cierta cantidad de la de $X$ implica que el $F_Y$ es inferior a $F_X$. La cara de Kolmogorov-Smirnov se tiende a rechazar en esta situación.

Del mismo modo, considere la posibilidad de un cambio de escala en una gamma:

enter image description here

De nuevo, el cambio a una escala más grande produce un menor F. de Nuevo, la cara de Kolmogorov-Smirnov se tiende a rechazar en esta situación.

Hay muchas situaciones donde tal prueba puede ser útil.


Entonces, ¿qué se $D^+$$D^-$?

En la prueba de la muestra, $D^+$ es el máximo positivo de la desviación de la muestra cdf de la hipótesis de la curva (que es la distancia más grande de la ECDF está por encima de $F_0$, mientras que $D^-$ es el máximo de la negativa a la desviación de la distancia más grande de la ECDF está por debajo de $F_0$). Tanto en $D^+$ $D^-$ son positivas cantidades:

enter image description here

Una cola de Kolmogorov-Smirnov gustaría ver a cualquiera de las $D^+$ o $D^-$ dependiendo de la dirección de la alternativa. Tenga en cuenta la cola de una muestra de prueba:

$H_0: F_Y(t)\geq F_0(t)$

$H_1: F_Y(t)< F_0(t)\,$, por lo menos un $t$

Para probar este uno - queremos que la sensibilidad a $Y$ estocásticamente más grande que la hipótesis (su verdadero $F$ es inferior a $F_0$). Tan inusualmente grandes valores de $D^-$ tienden a ocurrir cuando la alternativa es verdadera. Como resultado, a prueba frente a la alternativa $F_Y(t)< F_0(t)$, utilizamos $D^-$ en nuestra prueba una cola.


Pregunta de seguimiento: ¿cómo son los p-valores de $D^+$ $D^−$ obtenido?

No es una cosa simple. Hay una variedad de enfoques que se han utilizado.

Si recuerdo correctamente una de las formas en que la distribución se obtuvo a través de la utilización de Browniano puente de procesos (este documento parece apoyar que recuerdo).

Creo que este papel, y el papel por Marsaglia et al aquí tanto a cubrir algunos de los antecedentes y dar los algoritmos de cálculo con un montón de referencias.

Entre aquellos, usted obtendrá una gran cantidad de la historia y los diversos enfoques que se han utilizado. Si no cubren lo que usted necesita, usted probablemente tendrá que pedir esto como una nueva pregunta.

Muchas de las publicaciones que me estoy encontrando están presentando presentó valores, en lugar de CDF de $D_n$, $D^+$ y $D^−$

Que no es particularmente una sorpresa. Si no recuerdo mal, incluso la distribución asintótica es obtenida a partir de una serie (este recuerdo bien podría estar equivocado), y en muestras finitas es discreto y no en un simple formulario. En cualquiera de los casos y no hay manera conveniente de presentar la información, excepto como un gráfico o una tabla.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X