5 votos

¿Las "divisiones" en los gráficos de dispersión indican algo?

Antecedentes

Estoy explorando cómo se relacionan 7 parámetros del sistema que abarcan propiedades mecánicas, eléctricas y físicas (tamaño). He reunido las 7 especificaciones de 36 sistemas diferentes y he trazado cada combinación de parámetros para ver qué correlaciones existían, si es que las había.

  • Cada tiene el mismo parámetro del eje x como se identifica en la fila inferior
  • Cada tiene el mismo parámetro del eje Y como se identifica en la primera columna

Factor effects chart

Debate

Algunas de las tramas verifican relaciones conocidas: Sabía de antemano que los parámetros 3 y 4 están positivamente correlacionados y los parámetros 2 y 7 están inversamente correlacionados.

También sé que tengo una imagen incompleta. Por ejemplo, el parámetro 1 es un producto del parámetro 3 y de otros dos parámetros de los que no tengo datos. Uno (¡o potencialmente ambos!) de estos parámetros desconocidos afecta significativamente al parámetro 2. No sé cómo, pero sé que la correlación existe.

Preguntas

Tengo curiosidad por saber si las "divisiones"/divergencias de la tendencia media en algunos gráficos -por ejemplo, p5 frente a p4, p5 frente a p6, p7 frente a p6- son efectos de esos parámetros desconocidos.

  1. ¿Qué indican, si es que indican algo, estas divisiones?
  2. ¿Qué otras pruebas puedo realizar para obtener información más concreta?

P.D.: ¡Por favor, indíqueme cómo puedo mejorar mi gráfico!

Actualizaciones

Como sugirieron Nuclear Wang y DWin, investigo mis datos en busca de subgrupos. También he añadido datos de otra variable discreta, por lo que mi número total de parámetros es de 8.

Los parámetros 5 y 6 (diámetro y longitud) son ambos especificaciones volumétricas, así que dividí todos los puntos en función de su relación D/L. Esto resolvió la mayoría de las "divergencias".

  • Los sistemas planos y anchos (D/L > 1) son azules
  • Los sistemas largos y delgados (D/L <= 1) son de color naranja

Subgrouped factor effects

5voto

Matt Puntos 588

Cuando veo un gráfico como ese, mi pensamiento se dirige inmediatamente hacia los subgrupos de la muestra. Parece que tienes dos grupos de muestras diferentes, cada uno con una línea de tendencia visualmente aparente. ¿Son todas sus muestras similares, o hay algunas diferencias categóricas entre ellas? Supongamos que uno de sus gráficos divergentes representa el precio frente a la capacidad de los discos duros. Los dos grupos de muestras podrían representar a diferentes fabricantes, uno con productos baratos y una pendiente baja de dólar/GB, y otro con productos más caros y una pendiente alta de dólar/GB.

Para caracterizar esto aún más, puede etiquetar las muestras en una de las líneas divergentes y trazar esas etiquetas de muestras en los otros gráficos también. Si ves que las mismas muestras caen sistemáticamente en las líneas de tendencia separadas en varias variables, eso sugiere que hay algún tipo de diferencia categórica que está impulsando el comportamiento en varias de tus variables observadas.

1voto

aron Puntos 174

Hay al menos una variable discreta, parm3 y es posible que haya otras agrupaciones sin etiquetar. Yo empezaría por rehacer ese gráfico etiquetando los valores de parm3 con un código de colores. Diez puedes ver rápidamente si uno o dos colores caen en las "divisiones" que son aparentes.

Eso parece ser un gráfico de "pares". En R podrías hacer algo como:

pairs(  data , bg= rainbow(10)[parm3], other parameters)

Esa llamada a la función arco iris le daría 10 colores a través del espectro visible.y los valores de parm3 se "pintarían" individualmente.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X