Tengo un vector A, que comprende valores de ingresos predefinidos de 1000 empresas. Ahora quiero generar otro vector B, que comprende los ingresos de las empresas del año anterior. La intención es modelar B tomando A como el valor esperado y una desviación estándar que aumenta con el tamaño de A: Es decir, las empresas más grandes tienen diferencias absolutas más grandes entre A y B que las empresas más pequeñas. El propósito es lograr una relación para que una regresión lineal del predictor B sobre la variable dependiente A produzca una línea con una pendiente cercana a 1. Por lo tanto, la relación debería lucir como sigue:
lm(A~B)$coefficients # debería producir
#(Intercepto) B
# 0 1
plot(B,A)
abline(lm(A~B)$coefficients, col = "red")`
Lo intenté de la siguiente manera:
set.seed(123)
A <- 1:1000
B <- rnorm(n=1000, mean = A, sd=0.4*A)
Sin embargo, para lm(A~B)
:
Coeficientes:
(Intercepto) A
197.5979 0.6013
¿Tienes alguna idea de cómo puedo corregir la generación del vector B a partir de A, para que una regresión lineal de B sobre A produzca una pendiente de 1?
0 votos
¿Debe ser exactamente uno o es suficientemente cerca (como 1.0076)?
0 votos
Aproximadamente como 1.0076 es definitivamente suficiente. Sin embargo, es importante que B sea el predictor y A la variable dependiente y que B tenga que ser generado a partir de A antes.
0 votos
¿Quieres incluir la posibilidad de ingresos negativos en tu simulación? Ten en cuenta que ahora los tienes. Aunque no trabajo en economía o negocios, no consideraría que los ingresos se distribuyan normalmente, sino probablemente algo sesgado y con colas gordas.