¿Equivalente de la prueba de Kolmogorov-Smirnov para datos enteros?

Question

¿Equivalente de la prueba de Kolmogorov-Smirnov para datos enteros?

Preguntado el 7 de Septiembre, 2012: Cuando se hizo la pregunta
649 visitas: Cuantas visitas ha tenido la pregunta
2 Respuestas: Cuantas respuestas ha tenido la pregunta
Resuelta: Estado actual de la pregunta

¿Existe un equivalente de la prueba de Kolmogorov-Smirnov de dos muestras para datos enteros (no para datos de recuento, ya que puede incluir enteros negativos)?

La prueba de Kolmogorov-Smirnov no funciona bien en presencia de muchos empates, que obviamente son comunes con los números enteros.

Preguntado el 7 de Septiembre, 2012 por Matt Hamilton

Answer 1

2 Respuestas

Answer 2

9voto

Usuario no registrado Puntos 0

En Prueba de permutación también podría aplicarse en este caso. La idea es la siguiente.

Sea $X_1,...,X_m\sim F$ y $Y_1,...,Y_n\sim G$ sean dos muestras independientes y consideremos la comprobación de la hipótesis $H_0:F=G$ vs. $H_1:F\neq G$ . Para ello, etiquete sus datos del siguiente modo

$\begin{array}{c c} 1 & X_1\\ 1 & X_2\\ \vdots & \vdots\\ 1 & X_m\\ 2 & Y_1\\ 2 & Y_2\\ \vdots & \vdots\\ 2 & Y_n\\ \end{array}$

Ahora, dejemos que $T$ sea un estadístico de la muestra $S=\{X_1,...,X_m,Y_1,...,Y_n\}$ y las etiquetas $L=\{1,1,...,2,2,...,2\}$ .

Si $H_0$ es verdadera, entonces el etiquetado es superfluo.

Ahora, permute las etiquetas de los grupos y vuelva a calcular la estadística de la prueba un gran número de veces, por ejemplo $B$ .

El valor p unilateral de esta prueba se calcula como la proporción de permutaciones muestreadas en las que la diferencia de medias fue mayor o igual que $T(S,L)$ . El valor p bilateral de la prueba se calcula como la proporción de permutaciones muestreadas en las que la diferencia absoluta fue mayor o igual que $\mbox{abs}(T(S,L))$ . Véase

Un ejemplo de juguete

Sea $X_i \sim \text{Poisson}(10)$ , $i=1,...,m=100$ y $Y_j \sim \text{Poisson}(11)$ , $j=1,...,n=100$ . Considere la estadística $T=\text{mean of Group 1} - \text{mean of Group 2}$ . A continuación se aplica el método de permutación que utiliza este estadístico.

rm(list=ls)
set.seed(1)
# Sample size
ns=100
#Simulated data
x = rpois(ns,11)
y = rpois(ns,10)

# Observed statistic    
T.obs = mean(x) - mean(y)

# Pooled data
SL = rbind(cbind(rep(1,ns),x),cbind(rep(2,ns),y))

# Resampling
B=10000
T = rep(0,B)

for(i in 1:B){
samp = sample(SL[,1])
ind1 = which(samp==1)
ind2 = which(samp==2)
T[i] = mean( SL[ind1,2] )- mean( SL[ind2,2] )
}

# p-value
p.value = length(which(abs(T)>abs(T.obs)))/B

No sé hasta qué punto es robusto este método, pero después de algunos experimentos parece funcionar moderadamente bien. Obsérvese que la elección del $T$ es abierta y, por lo tanto, hay que tener cuidado al hacer una elección significativa en el contexto de su problema, ya que el rendimiento depende tanto de la estadística como del tamaño de la muestra.

Espero que esto ayude.

Respondido el 7 de Septiembre, 2012 por Usuario no registrado (0 Puntos )

Answer 3

5voto

mat_geek Puntos 1367

Yo sugeriría la prueba de ji cuadrado de dos muestras, en la que se dividen los datos en cubos y se compara el total dividido en cubos con un "número esperado" que caería dentro del cubo sobre la base de la muestra agrupada. Esto tiene una generalización a k mayor que 2. Estoy asumiendo que usted no está requiriendo otra prueba de la forma cdf emprical. Creo que toda esa clase de prueba podría tener algunos problemas cuando hay muchos empates.

Aquí es una referencia que muestra con precisión cómo se calcula el estadístico de la prueba chi cuadrado de dos muestras junto con los grados de libertad para la distribución asintótica chi cuadrado.

Respondido el 7 de Septiembre, 2012 por mat_geek (1367 Puntos )

¿Equivalente de la prueba de Kolmogorov-Smirnov para datos enteros?

Respuestas

Preguntas Destacadas

Etiquetas mas usadas

i-Ciencias.com

Powered by:

¿Equivalente de la prueba de Kolmogorov-Smirnov para datos enteros?

Respuestas

Preguntas relacionadas

Preguntas Destacadas

Etiquetas mas usadas

En nuestra red

i-Ciencias.com

Powered by: