Estoy tratando de predecir una variable de respuesta en regresión lineal que siempre debe ser positiva (costo por clic). Es una cantidad monetaria. En Adwords, pagas a Google por clics en tus anuncios, y un número negativo significaría que Google te paga cuando la gente hace clic :P
Los predictores son todos valores continuos. El Rsquared y el RMSE son aceptables cuando se comparan con otros modelos, incluso fuera de muestra:
RMSE Rsquared
1.4141477 0.8207303
No puedo reescalar las predicciones, porque se trata de dinero, por lo que incluso un pequeño factor de reescalamiento podría cambiar significativamente los costos.
Según entiendo, para el modelo de regresión no hay nada especial acerca de cero y números negativos, por lo que encuentra el mejor hiperplano de regresión sin importar si la salida es parcialmente negativa.
Este es un primer intento, usando todas las variables que tengo. Así que hay espacio para mejorar.
¿Hay alguna manera de indicarle al modelo que la salida no puede ser negativa?