Para ajustar una función de tipo sigmoide de forma no paramétrica, podríamos utilizar un spline monótona . Esto se implementa en el paquete R (todos los paquetes R aquí referenciados están en CRAN) splines2
. Tomaré prestado algún código R de la respuesta de @Chaconne, y lo modificaré para mis necesidades.
splines2
ofrece las funciones mSpline
implementando M-splines, que es una base de splines no negativa en todas partes (en el intervalo donde se define), y iSpline
la integral de la base M-spline. Las últimas son entonces monótonas crecientes, por lo que podemos ajustar una función creciente utilizándolas como base spline de regresión, y ajustar un modelo lineal con restricciones en los coeficientes para que sean no negativos. Esto último se implementa de forma sencilla mediante el paquete R colf
"optimización restringida en funciones lineales". Los ajustes parecen:
El código R utilizado:
library(splines2) # includes monotone splines, M-splines, I-splines.
library(colf) # constrained optimization on linear functions
txt <- "| 0 | 0 |
| 1.6366666667 | -12.2012787905 |
| 3.2733333333 | -13.7833876716 |
| 4.91 | -10.5943208589 |
| 6.5466666667 | -1.3584575518 |
| 8.1833333333 | 8.1590423167 |
| 9.82 | 13.8827937482 |
| 10.4746666667 | 18.4965880076 |
| 11.4566666667 | 42.1205206106 |
| 11.784 | 45.0528073182 |
| 12.4386666667 | 76.8150755186 |
| 13.0933333333 | 80.0883540997 |
| 14.73 | 89.7784173678 |
| 16.3666666667 | 98.8113459392 |
| 19.64 | 104.104366506 |
| 22.9133333333 | 105.9929585305 |
| 26.1866666667 | 94.0070414695 |"
dat <- read.table(text=txt, sep="|")[,2:3]
names(dat) <- c("x", "y")
plot(dat$y ~ dat$x, pch = 19, xlab = "x", ylab = "y", main = "Monotone Splines with Varying df")
Imod_df_4 <- colf_nls(y ~ 1 + iSpline(x, df=4), data=dat, lower=c(-Inf, rep(0, 4)), control=nls.control(maxiter=1000, tol=1e-09, minFactor=1/2048) )
lines(dat$x, fitted(Imod_df_4), col="blue")
Imod_df_6 <- colf_nls(y ~ 1 + iSpline(x, df=6), data=dat, lower=c(-Inf, rep(0, 6)), control=nls.control(maxiter=1000, tol=1e-09, minFactor=1/2048) )
lines(dat$x, fitted(Imod_df_6), col="orange")
Imod_df_8 <- colf_nls(y ~ 1 + iSpline(x, df=8), data=dat, lower=c(-Inf, rep(0, 8)), control=nls.control(maxiter=1000, tol=1e-09, minFactor=1/2048) )
lines(dat$x, fitted(Imod_df_8), col="red")
EDIT
Las restricciones monótonas en una spline son un caso especial de splines de forma restringida y ahora hay uno (de hecho varios) paquetes de R que los implementan simplificando su uso. Haré el ejemplo anterior de nuevo, con uno de esos paquetes. El código R está abajo, usando los datos como se leyó arriba:
library(cgam)
mod_cgam0 <- cgam(y ~ 1+s.incr(x), data=dat, family=gaussian)
summary(mod_cgam0)
Call:
cgam(formula = y ~ 1 + s.incr(x), family = gaussian, data = dat)
Coefficients:
Estimate StdErr t.value p.value
(Intercept) 43.4925 2.7748 15.674 < 2.2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for gaussian family taken to be 102.2557)
Null deviance: 33749.25 on 16 degrees of freedom
Residual deviance: 1636.091 on 12.5 observed degrees of freedom
Approximate significance of smooth terms:
edf mixture.of.Beta p.value
s.incr(x) 3 0.9515 < 2.2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
CIC: 7.6873
De este modo, los nudos (y los grados de libertad) se han seleccionado automáticamente. Para fijar el número de grados de libertad utilice:
mod_cgam1 <- cgam(y ~ 1+s.incr(x, numknots=5), data=dat, family=gaussian)
Un documento de presentación de cgam es aquí (arxiv) .
6 votos
Si no te importa la función, ¿para qué crees que la necesitas? Pregunta seria.
1 votos
¿Se supone que tu ajuste debe bajar inicialmente (como parecen sugerir los datos)?
0 votos
Si desea que la curva ajustada sea paramétrica y una curva logística de 4 parámetros, eche un vistazo al paquete drc: cran.r-project.org/web/packages/drc/index.html