Tengo un conjunto de datos que contiene múltiples proporciones que suman 1. Estoy interesado en el cambio de estas proporciones a lo largo de un gradiente (ver abajo los datos de ejemplo).
gradient <- 1:99
A1 <- gradient * 0.005
A2 <- gradient * 0.004
A3 <- 1 - (A1 + A2)
df <- data.frame(gradient = gradient,
A1 = A1,
A2 = A2,
A3 = A3)
require(ggplot2)
require(reshape2)
dfm <- melt(df, id = "gradient")
ggplot(dfm, aes(x = gradient, y = value, fill = variable)) +
geom_area()
Información adicional: No tiene que ser necesariamente lineal, lo he hecho sólo para facilitar el ejemplo. Los recuentos originales a partir de los cuales se calculan estas proporciones también están disponibles. El conjunto de datos real contiene más variables que suman 1 (por ejemplo, B1, B2 y B3, C1 a C4, etc.), por lo que una pista para una solución multivariante también sería útil... Pero por ahora me quedaré con el lado univariado de la estadística.
Pregunta: ¿Cómo se puede analizar este tipo de datos? He leído un poco por ahí, y ¿quizás sea adecuado un modelo multinomial o un glm? - Si ejecuto 3 (o 2) glms, ¿cómo puedo incorporar la restricción de que los valores predichos sumen 1? No quiero sólo graficar este tipo de datos, también quiero hacer un análisis más profundo tipo regresión. Preferiblemente quiero usar R - ¿cómo puedo hacer esto en R?
0 votos
El comando
proprcspline
en Stata podría ser lo que estás buscando (sé que quieres usarR
pero tal vez esto podría ser un punto de partida): proprcspline calcula un spline cúbico restringido que suaviza las proporciones de las observaciones en cada categoría de yvar dada xvar, y las grafica como un gráfico de área apilado. Opcionalmente, estas proporciones suavizadas pueden ajustarse para un conjunto de variables de control (cvars).0 votos
¿Podría explicar con más detalle lo que significa "interesado en"? ¿Simplemente quiere trazar las proporciones contra el gradiente? ¿O tiene en mente un análisis más profundo? Si es así, ¿cuál es su naturaleza? ¿Qué espera aprender exactamente de estos datos? Además, ¿tiene los recuentos originales disponibles (lo que sería bueno) o sólo ¿las proporciones? ¿Podría explicar un poco más en qué consisten estos datos y cómo se recogen?
1 votos
@whuber: Quiero hacer un análisis más profundo con estos datos. Mi hipótesis es que las proporciones cambiarán con el gradiente. Los recuentos también están disponibles.
1 votos
Parece que tienes datos de composición. No sé mucho al respecto, pero el trabajo de Aitchison es el lugar para empezar. Hay un paquete, composiciones, en CRAN.