4 votos

Prueba de suma de rangos de Wilcoxon para el caso multivariante cuando se conoce el pdf

Tengo una muestra de unas 100 observaciones. Cada uno de ellos es el vector de números reales de tamaño 30.

También tengo pdf que creo que puede describir la distribución de origen de mi muestra. El pdf tiene forma funcional bien definida por lo que puedo utilizar el muestreo de Gibbs para generar unos pocos miles de observaciones simuladas.

Puedo utilizar el mismo pdf para generar dos conjuntos de probabilidades para mis muestras original y generada.

Luego hago la prueba de suma de rangos de Wilcoxon en esos dos conjuntos de probabilidades. Mi hipótesis nula es que mi muestra original y la nueva muestra generada se toman de la misma distribución.

¿Este planteamiento puede plantear problemas? ¿Hay alguna forma mejor de probar la hipótesis de muestra multivariante procedente de una determinada distribución de origen?

2voto

Chris Morley Puntos 108

Es posible "engañar" a tu método dos distribuciones tienen tendencias centrales similares pero dispersiones diferentes. Por ejemplo, el código R siguiente genera observaciones de la distribución uniforme y de la normal que "pasan" la prueba de Wilcoxon (en cuyo caso creeríamos erróneamente que los dos conjuntos de observaciones se generaron a partir de la misma pdf).

# Create 100 observations from the normal and uniform distribution
obs1 <- rnorm(100,5,1)
obs2 <- runif(100,0,5)

# Calculate the probability of each observation based on uniform dist
punif_obs1 <- punif(n, min(n), max(n))
punif_obs2 <- punif(u, min(u), max(u))

# Calculate the probability of each observation based on normal dist
pnorm_obs1 <- pnorm(n, mean(n), sd(n))
pnorm_obs2 <- pnorm(u, mean(u), sd(u))

# Wilcox tests. Null hypothesis not rejected, despite that the 
# two sets of observations were sampled from different distributions.
wilcox.test(punif_obs1, punif_obs2)
wilcox.test(pnorm_obs1, pnorm_obs2) 

La forma más directa de comprobar si las observaciones proceden del pdf es generar un conjunto de datos a partir del pdf y seguir el procedimiento que se indica aquí: ¿Cómo comprobar si dos distribuciones multivariantes proceden de la misma población subyacente?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X