Sé que me falta algo en mi comprensión de la regresión logística, y agradecería mucho cualquier ayuda.
Por lo que tengo entendido, la regresión logística supone que la probabilidad de un resultado "1" dados los datos de entrada, es una combinación lineal de los datos de entrada, pasada por una función logística inversa. Esto se ejemplifica en el siguiente código R:
#create data:
x1 = rnorm(1000) # some continuous variables
x2 = rnorm(1000)
z = 1 + 2*x1 + 3*x2 # linear combination with a bias
pr = 1/(1+exp(-z)) # pass through an inv-logit function
y = pr > 0.5 # take as '1' if probability > 0.5
#now feed it to glm:
df = data.frame(y=y,x1=x1,x2=x2)
glm =glm( y~x1+x2,data=df,family="binomial")
y recibo el siguiente mensaje de error:
Mensajes de advertencia: 1: glm.fit: el algoritmo no converge 2: glm.fit: las probabilidades ajustadas son numéricamente 0 o 1
He trabajado con R durante algún tiempo; lo suficiente como para saber que probablemente yo sea el culpable.. ¿qué está pasando aquí?