He ~14.000 observaciones con una variable independiente, interactions
, y una variable dependiente, accuracy
. La precisión puede ser 0 (errónea) o 1 (verdadero clasificación). Hay una débil, pero en relación estadísticamente significativa entre los dos como se ve en la figura de abajo (bigotes especificar intervalo de confianza 95%).
Me gustaría tener un liso de la trama a través de los valores posibles de las interacciones en lugar de binning ellos como se ha hecho en la figura anterior. He intentado usar GAM en R para hacer eso, pero termino con la siguiente figura, la cual es claramente incorrecto. También he tratado de regresión logística, que sólo terminó siendo una línea recta, por lo tanto no captura la convergencia en torno a interactions = 100
.
¿Cómo puedo obtener una superficie lisa de la trama de la relación entre los dos valores que captura el aumento inicial de la precisión y, a continuación, la convergencia en torno a interactions=100
? Sería preferible si un intervalo de confianza puede ser inferida así. Los datos se pueden encontrar en vuelos de código compartido.io. Interacciones por encima de 400 no son interesantes, así que puede ser a la izquierda, si es necesario.