¿Cuáles son algunas de Bondad de Ajuste de las pruebas o indicies continuo de caso?
La mayoría de la bondad de ajuste de las pruebas son para el caso continuo. Hay, literalmente, cientos de ellos. Además de la prueba de Kolmogorov-Smirnov (para una especifica completamente la distribución, basándose en la máxima diferencia en ECDF) algunos de los más comúnmente usados incluyen la de Anderson-Darling de prueba (también especifica completamente y ECDF; una varianza ponderada versión de la Cramer-von Mises de la prueba) y la de Shapiro-Wilk (parámetros no especificados, para la prueba de normalidad).
Por ejemplo, estoy viendo lo de la prueba de Kolmogorov-Smirnov.
Bien, pero ¿por qué? Es decir, ¿por qué están las pruebas de bondad de ajuste?
Lo que no entiendo es cómo uno consigue la emprical CDF en el primer lugar?
Es simplemente la versión de muestra de la cdf. El cdf es $P(X\leq x)$, el ECDF es la misma cosa, con la 'probabilidad' (para la variable aleatoria) sustituido con "proporción" (de los datos). Es decir, calcular la proporción de los datos es menor o igual a cada valor de $x$ en el intervalo (ECDFs único cambio en los valores de los datos, pero todavía están definidas entre ellos - usted realmente sólo necesita identificar su valor en cada punto de datos y a la izquierda de la totalidad de la muestra, ya que son constantes a partir de los datos de cada punto hasta el siguiente punto de datos)
Tome un pequeño conjunto de números y probarlo.
Aquí vamos, una muestra de tres valores de datos:
13.2 15.8 17.5
ahora, para los siguientes $x$ de los valores, ¿cuál es la proporción de los datos de $\leq x$?
x = 10, 13.2-$\varepsilon$, 13.2, 13.2+$\varepsilon$, 15, 15.8, 17.5-$\varepsilon$, 19
(donde $\varepsilon$ es muy pequeño número)
Se puede ver cómo funciona?
(Sugerencia: las cinco primeras respuestas son 0, 0, 1/3, 1/3, 1/3 y el último es el 1; el ECDF se traza al final de mi respuesta)
Lo que quiero decir es que, digamos que hago un análisis de regresión con errores de gauss.
Lo que le permite utilizar este ejemplo? Hizo algo (un libro, por ejemplo, o un sitio web) llevan a pensar que debería usar una bondad de ajuste de la prueba en esta situación?
Tengo la estimación de máxima verosimilitud de los parámetros. Ahora que también tengo que hacer una estimación de densidad para la emprical CDF?
Cdf empírica de qué?
Tenga en cuenta que el SARCOMA de kaposi es una prueba, no una estimación. Qué hipótesis están realizando pruebas y por qué?
No son la misma cosa?
No, son bastante diferentes, como se discute a continuación.
No es mi probabilidad ya me da una bondad de ajuste?
La probabilidad de la regresión indica sobre el ajuste de la línea;
en el caso siguiente, que tan cerca de la línea roja es la de datos.
Usted puede reemplazar los datos con otro conjunto de valores con el mismo resumen de estadísticas, pero una distribución diferente, y la probabilidad sería idéntico.
Ver el cuarteto de Anscombe para un buen ejemplo de cómo los datos muy diferentes, podrían tener la misma probabilidad de la superficie.
Por el contrario, Con una bondad de ajuste de la prueba, está el control de la forma de algunos de distribución, como una distribución normal con media y varianza, se ajusta a los datos (el KS mide la discrepancia de la hipótesis de distribución mirando el ECDF, dando una prueba de que no cambia cuando se transforman las dos mitades de la comparación - lo que es no paramétrica):
Entonces, ¿cómo se relaciona esto con la regresión lineal?
Algunas personas tratan de probar si la suposición de normalidad alrededor de la línea (tales como la distribución en la franja verde en la primera parcela), como comprobación de la hipótesis sobre la distribución de error:
- pero esta comprobación se realiza a través de todos los x, no sólo a algunos en particular x (yo no mostraron valores cercanos a un determinado $x$ a destacar es la distribución condicional de $y$ - o, equivalentemente, la distribución de los errores - que es relevante).
-- no está claro a partir de su descripción, si eso es lo que te quería preguntar acerca de.
Sin embargo:
1) formalmente las pruebas de bondad de ajuste como comprobación de hipótesis no es necesariamente adecuado;
(i) responde a la pregunta equivocada (la pregunta pertinente es " ¿cuál es el impacto en mi inferencia de que el grado de no-normalidad tenemos?'), y
(ii) sólo le dice nada cuando es de casi ninguna utilidad para usted a saber de ella (de la bondad de ajuste de las pruebas tienden a mostrar la importancia en medio de grandes muestras, donde normalmente no importa mucho, y no tienden a ser significativos en muestras pequeñas donde es más importante), y
(iii) cambio de lo que usted hace sobre la base del resultado generalmente es menos apropiado que el de la simple suposición de que había de rechazar el valor nulo en el primer lugar (el de regresión de inferencia no tiene las propiedades deseadas).
2) aún sin todo eso, el SARCOMA de kaposi es una prueba para una distribución específico. Usted tiene que especificar la media y la desviación estándar para cada punto de datos antes de ver los datos. Si usted es la estimación de la media (es decir mediante la instalación de una línea) y una desviación estándar (digo por el error estándar de los residuos, s), entonces usted simplemente no debería estar usando la prueba de KS.
Hay pruebas de la situación en la que la estimación de la media y la varianza (el equivalente a la prueba de KS se llama la prueba de Lilliefors), pero para la normalidad de la norma es la prueba de Shapiro Wilk (aunque el más sencillo de Shapiro-Francia de la prueba es casi tan potente, la mayoría de las estadísticas de software implementa el pleno del test de Shapiro-Wilk).
¿Por qué necesito KS?
Bueno, básicamente no.
Casi nunca hay una circunstancia en que una buena opción para la situación que usted describe.
Mi sugerencia es que, para utilizar algún procedimiento que no asume normalidad (por ejemplo, en algunas enfoque sólido, o tal vez menos cuadrada, pero con la inferencia basados en remuestreo), o si usted está en una posición razonablemente asumir la normalidad, vuelva a verificar la razonabilidad de la asunción con una pantalla de diagnóstico (como el Q-Q plot; por cierto el de Shapiro-Francia prueba es basado en el $R^2$ en la trama).
En muestras grandes, la normalidad es menos importante para su inferencia (para todo, pero los intervalos de predicción), así que usted puede tolerar grandes desviaciones de la normalidad (igual varianza y la independencia de los supuestos de la materia mucho más).
En muestras pequeñas, es más dependiente de la asunción de las pruebas y los intervalos de confianza, pero usted simplemente no puede estar seguro de lo mal que está el grado de no-normalidad que tiene usted es. Usted está mejor con muestras pequeñas simplemente para que funcione como si sus datos no eran normales. (Hay un buen número de robusta opciones, pero generalmente, usted debe también considerar el impacto potencial de influencia de los puntos, no sólo de potencial y los valores atípicos.)
ECDF para el pequeño conjunto de datos de ejemplo anteriormente en la respuesta: