\def\lf{\lfloor}\def\rf{\rfloor}\def\pnorm{\mathrm{pnorm}}Es claro que Greg sugerencia es la primera cosa que hay que intentar: regresión de Poisson es el modelo natural en muchas de las situaciones concretas.
Sin embargo, el modelo que usted está sugiriendo puede ocurrir, por ejemplo, cuando se observa redondeado datos:
Y_i = \lf ax_i + b + \epsilon_i \rf,
con iid normal errores de \epsilon_i.
Creo que es interesante echar un vistazo a lo que se puede hacer con ella. Me indican por F la cdf de la normal estándar variable. Si \epsilon \sim \mathcal N(0,\sigma^2), luego
\begin{align*} \mathbb P\left(\lf ax + b + \epsilon \rf = k\right) &= F\left({k-b+1-ax\over \sigma}\right) - F\left({k-b-ax\over \sigma}\right)\\
&= \pnorm(k+1-ax-b,sd=\sigma) - \pnorm(k-ax-b,sd=\sigma),\end{align*}
utilizando familiar equipo de notaciones.
Observa los datos de los puntos de (x_i,y_i). El registro de probabilidad está dada por
\ell(a,b,\sigma) = \sum_i \log\left(
F\left({y_i-b+1-ax_i\\sigma}\right) - F\left({y_i-b-ax_i\\sigma}\right)
\right).
Este no es idéntica a la de los mínimos cuadrados. Usted puede tratar de maximizar esta con un método numérico. Aquí está una ilustración en R:
log_lik <- function(a,b,s,x,y)
sum(log(pnorm(y+1-a*x-b, sd=s) - pnorm(y-a*x-b, sd=s)));
x <- 0:20
y <- floor(x+3+rnorm(length(x), sd=3))
plot(x,y, pch=19)
optim(c(1,1,1), function(p) -log_lik(p[1], p[2], p[3], x, y)) -> r
abline(r$par[2], r$par[1], lty=2, col="red")
t <- seq(0,20,by=0.01)
lines(t, floor( r$par[1]*t+r$par[2]), col="green")
lm(y~x) -> r1
abline(r1, lty=2, col="blue");
![rounded linear model]()
En rojo y azul, las líneas de ax+b encontrado por numéricos de la maximización de esta posibilidad, y menos plazas, respectivamente. El verde de la escalera es \lf ax +b\rf a,b desde el máximo de probabilidad... esto sugiere que en
el uso de mínimos cuadrados, a una traducción de b 0,5, y tienen más o menos el mismo resultado; o, que de mínimos cuadrados del modelo
Y_i = [ a x_i + b +\epsilon_i],
donde [x] = \lf x + 0.5 \rf es el entero más cercano. Redondeado de datos son a menudo tan conocido que estoy seguro de que este es conocido y ha sido estudiado extensivamente...