Yo creo que se puede considerar "los días del año" como una variable de respuesta a una regresión multivariante. Con el fin de manejar de años, cuando el lago nunca se congeló yo simplemente considerar que el día de congelación es más grande que un observable límite inferior que corresponde, por ejemplo, el día cuando el contenido de hielo comienza a derretirse (o se derrita completamente, si quieres ser muy conservador). Teóricamente se debe congelar después de que, o se pueden congelar después de eso, pero no sabemos. De esta manera usted podría utilizar los datos recopilados en los diferentes parámetros para entender cómo la congelación día depende de ellos, si era permitido ser posterior a la última observable fecha. Usted puede utilizar un modelo Tobit para manejar simultáneamente días con heladas (correspondiente a la "normalidad" tipos de datos) y los límites inferiores (correspondiente a los límites y por lo tanto una de regresión censurada).
Para la correcta incluir la medición de los límites inferiores en el análisis, se puede utilizar un modelo de regresión censurada en los que la variable dependiente tiene un corte en el valor del límite inferior. El mencionado modelo Tobit es adecuada para este caso; se asume la existencia de un inobservable (latente) de la variable dependiente $y_i^*$, que en nuestro caso corresponde a la fecha de congelamiento si el invierno se prolonga indefinidamente. De la observación de la variable dependiente $y_i$ (es decir, la medida del límite inferior en la congelación de la fecha) es llevado a ser igual a la variable latente en la ausencia de un límite inferior $L_i$, e igual al límite inferior de lo contrario
\begin{eqnarray}
y_i = \left\{
\begin{array}{ll}
y_i^* & \quad \mathrm{if} \quad \bar{\exists}\,L_i \:\: (\textrm{i.e.} \, y_i^* < L_i) \\
L_i & \quad \mathrm{if} \quad y_i^*\geq L_i
\end{array}
\right.
\end{eqnarray}
La aplicación del modelo Tobit para manejar la observación-por-observación de la censura, los resultados en función de verosimilitud logarítmica de la forma
\begin{eqnarray}
\mathcal{L} = \sum_{i \,\in\, y_i^* < L_i} ln \left[ \phi\left(\frac{y_i-X_{ij}\beta_j}{\sigma}\right)/\sigma \right] \,+\,
\sum_{i \,\in\, y_i^*\geq L_i}ln \left[ \Phi\left(\frac{L_i-X_{ij}\beta_j}{\sigma}\right) \right] \, \,
\end{eqnarray}
donde $\phi(.)$ $\Phi(.)$ denotar la probabilidad y la acumulada de las funciones de densidad, respectivamente, de la distribución normal estándar. El índice de $i$ se ejecuta en las observaciones y $j$ en las variables independientes. La solución a la regresión lineal es el conjunto de parámetros de $\beta_j$(incluyendo el intercepto) que maximiza la función de verosimilitud logarítmica.