4 votos

Comparación de puntos en un espacio bivariante

Tengo datos bivariados a partir de los cuales he generado miles de estimaciones bootstrap dentro de cada una de las dos condiciones (rosa y azul):

bivariate data

Me gustaría determinar si las distribuciones bivariadas de estas condiciones tienen tendencias centrales diferentes.

Si estuviera tratando con datos univariantes, calcularía, dentro de cada punto, los cuantiles 0,025 y 0,975 de las estimaciones bootstrap de ese punto para construir un intervalo de confianza del 95% y, a continuación, compararía los intervalos de las condiciones. De hecho, eso es lo que representan las líneas en el gráfico anterior. Sin embargo, creo que comparar las condiciones de cada dimensión por separado ignora la naturaleza bivariante fundamental de los datos, aunque no sé cuál es el procedimiento adecuado para los datos bivariantes.

Tenga en cuenta que cualquier solución sugerida debería basarse únicamente en las estimaciones bootstrapped y no en los datos brutos. Esto se debe a que las estimaciones en este caso concreto proceden en realidad de modelos bastante complicados que intentan tener en cuenta y eliminar las diferencias entre las condiciones presentes en los datos brutos.

3voto

Patrick Puntos 183

En el supuesto de que ambas muestras sean MV gaussianas con varianza fija (es decir, que sólo le interesen las diferencias de tendencia central), debería utilizar Estadística T-cuadrado de Hotelling para dos muestras .

Es fácil de aplicar en $\verb+R+$ difícil de encontrar en el paquete $\verb+rrcov+$ siempre que configure el $\verb+method+$ opción de $\verb+c+$


2voto

pkaeding Puntos 12935

Si aceptas la normalidad bivariante de las estimaciones bootstrap, creo que podrías hacer lo siguiente:

En primer lugar, se ajusta un modelo normal bivariante a todos los datos (un modelo que no admite diferencias entre las dos clases). A continuación, ajuste un modelo que consista en dos modelos normales bivariantes condicionados por la clase (usted decide si lo hace de forma homocedástica o no). Este sería un modelo que apoya una diferencia entre las dos clases.

Ahora bien, el modelo bivariante doble es un supermodelo del modelo normal bivariante simple, teniendo, en el caso homocedastico, 2 parámetros más (medias bivariantes en una de las clases) y en el caso heteroscedástico, 5 parámetros más (aquí se añade la estructura de covarianza bivariante en una de las clases).

Como tal, puede utilizar una prueba de cociente de probabilidades para determinar la necesidad de utilizar el modelo más complejo, es decir, si hay pruebas de una diferencia entre los grupos.

Si la normalidad bivariada no es una opción, pero usted tiene otra distribución que cree que es creíble, creo que este método debería funcionar igual, aunque el ajuste puede ser un poco más difícil entonces.

0voto

Si tuvieras un modelo para la relación entre las escalas de los ejes x e y podrías hacer algo. Por ejemplo, si las transformaras en z para que cada medida tuviera el mismo impacto con respecto a su varianza y, si fueran datos pareados, entonces se podría calcular una distancia euclidiana y luego un tamaño del efecto de esa distancia y también un IC.

Pero eso es un montón de ifs....

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X