5 votos

¿Cómo evaluar si las muestras ponderadas proceden de la misma distribución?

Supongamos que tengo dos muestras y me gustaría compararlas para ver si proceden de la misma distribución subyacente. Normalmente, probablemente lo haría utilizando una prueba KS. Sin embargo, supongamos también que tengo algún "peso" para cada observación en cada una de las dos muestras que indica lo "seguro" que estoy de que el valor muestreado es "exacto". En otras palabras, algunas observaciones de las muestras son más representativas de la distribución muestreada que otras (tenga en cuenta que estas ponderaciones diferirán entre las muestras).

Teniendo esto en cuenta, mi pregunta es: ¿Existe alguna prueba (como una prueba KS) que pueda utilizar para comprobar si estas dos muestras proceden de la misma distribución subyacente, teniendo en cuenta los pesos asociados a cada muestra?

Espero no estar siendo demasiado vago aquí... pero cualquier ayuda y/o comentarios son muy apreciados.

5voto

Ted Puntos 854

Al igual que Michelle, tengo curiosidad por saber cómo se produce esta situación. Pero dejando eso a un lado, ¿qué hay de poner un bootstrap alrededor de una prueba KS, con el remuestreo bootstrap basado en sus pesos? Así, los puntos en los que tienes más confianza tienen más probabilidades de ser remuestreados.

2voto

mat_geek Puntos 1367

Se me acaba de ocurrir una idea sencilla que podría funcionar. Asumo que los pesos son conocidos y fijos. Modificar las muestras para que las distribuciones se parezcan a la distribución ponderada. Las observaciones con el menor peso entran una vez. Luego una observación con el doble de ese peso entra dos veces, etc. Después de crear la muestra modificada, aplique una prueba estándar de bondad de ajuste de dos muestras. Dado que las distribuciones son continuas, podría modificar esto para hacer que los duplicados difieran del original añadiendo un pequeño componente aleatorio a cada uno. Ahora el único problema que veo es que cada peso tiene que ser un múltiplo entero del punto o puntos con los pesos más bajos. Para remediar esto se podría hacer que las observaciones de menor peso se repitieran, por ejemplo, 5 veces. Entonces los otros podrían ser múltiplos fraccionarios de la observación de menor peso.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X