9 votos

Reglas para aplicar la simulación Monte Carlo de los valores p para la prueba de chi-cuadrado

Me gustaría entender el uso de la simulación Monte Carlo en la chisq.test() en R.

Tengo una variable cualitativa que tiene 128 niveles / clases. El tamaño de mi muestra es de 26 (no he podido muestrear más "individuos"). Así que, obviamente, tendré algunos niveles con 0 "individuos". Pero el hecho es que sólo tengo un número muy pequeño de clases representadas de las 127 posibles. Como he oído que para aplicar la prueba de chi-cuadrado debemos tener al menos 5 individuos en cada nivel (no entiendo del todo la razón de ello), pensé que tenía que utilizar el simulate.p.value para utilizar la simulación Monte Carlo para estimar la distribución y calcular un valor p. Sin la simulación de Monte Carlo, R me da un valor p < 1e-16 . Con la simulación de Monte Carlo, me da un valor p en 4e-5 .

He intentado calcular el valor p con un vector de 26 unos y 101 ceros, y con la simulación de Monte-Carlo, obtengo un valor p a 1.

¿Es correcto afirmar que, aunque el tamaño de mi muestra sea pequeño en comparación con el número de clases posibles, la distribución observada es tal que es muy poco probable que todas las clases posibles existan con la misma probabilidad (1/127) en la población real?

5voto

Marian L Puntos 11

Buscando, parece que el objetivo de la simulación de Monte-Carlo es producir una distribución de referencia, basada en muestras generadas aleatoriamente que tendrán el mismo tamaño que la muestra probada, para calcular los valores p cuando no se cumplen las condiciones de la prueba.

Esto se explica en Hope A. J Royal Stat Society Series B (1968) que se puede encontrar en JSTOR .

He aquí una cita relevante del documento de Hope:

Los procedimientos de prueba de significación de Monte-Carlo consisten en la comparación de los datos observados con muestras aleatorias generadas de acuerdo con la hipótesis que se está probando. ... Es preferible utilizar una prueba conocida de buena eficacia en lugar de un procedimiento de prueba de Monte-Carlo suponiendo que la hipótesis estadística alternativa puede ser completamente especificada. Sin embargo, no siempre es posible utilizar una prueba de este tipo porque las condiciones necesarias para aplicar la prueba pueden no cumplirse, o la distribución subyacente puede ser desconocida o puede ser difícil decidir un criterio de prueba adecuado.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X