@ocram del enfoque sin duda el trabajo. En términos de la dependencia de las propiedades es algo restrictiva, aunque.
Otro método es el uso de una cópula para obtener una distribución conjunta. Puede especificar distribuciones marginales para el éxito y la edad (si tiene los datos existentes esto es especialmente simple) y una cópula de la familia. Variando los parámetros de la cópula producirá diferentes grados de dependencia, y de diferentes cópula familias te dará varias relaciones de dependencia (por ejemplo, fuerte en la cola superior de la dependencia).
Una reseña reciente de hacerlo en R a través de la cópula paquete está disponible aquí. Véase también la discusión en la que el papel de paquetes adicionales.
Usted no necesita necesariamente un paquete completo; ya que, he aquí un ejemplo simple del uso de una cópula Gaussiana, marginales de la probabilidad de éxito 0.6, gamma y distribuye las edades. Varían de r para el control de la dependencia.
r = 0.8 # correlation coefficient
sigma = matrix(c(1,r,r,1), ncol=2)
s = chol(sigma)
n = 10000
z = s%*%matrix(rnorm(n*2), nrow=2)
u = pnorm(z)
age = qgamma(u[1,], 15, 0.5)
age_bracket = cut(age, breaks = seq(0,max(age), by=5))
success = u[2,]>0.4
round(prop.table(table(age_bracket, success)),2)
plot(density(age[!success]), main="Age by Success", xlab="age")
lines(density(age[success]), lty=2)
legend('topright', c("Failure", "Success"), lty=c(1,2))
Salida:
Tabla:
success
age_bracket FALSE TRUE
(0,5] 0.00 0.00
(5,10] 0.00 0.00
(10,15] 0.03 0.00
(15,20] 0.07 0.03
(20,25] 0.10 0.09
(25,30] 0.07 0.13
(30,35] 0.04 0.14
(35,40] 0.02 0.11
(40,45] 0.01 0.07
(45,50] 0.00 0.04
(50,55] 0.00 0.02
(55,60] 0.00 0.01
(60,65] 0.00 0.00
(65,70] 0.00 0.00
(70,75] 0.00 0.00
(75,80] 0.00 0.00