Estoy tratando de predecir una respuesta variable en la regresión lineal que debe ser siempre positiva (coste por clic). Es una cantidad monetaria. En adwords, usted paga google por los clics en sus anuncios, y un número negativo significaría que google paga a usted cuando la gente hace clic :P
Los predictores son todos los valores continuos. El Rsquared y RMSE son buenos, cuando en comparación con otros modelos, incluso fuera de la muestra:
RMSE Rsquared
1.4141477 0.8207303
No puedo cambiar la escala de las predicciones, porque es el dinero, por lo que incluso una pequeña reescalado factor que podría cambiar significativamente los costos.
Como tengo entendido, el modelo de regresión no hay nada especial acerca de los cero y los números negativos, con el fin de encontrar la mejor regresión hyperplane no importa si el resultado es en parte negativo.
Este es un primer intento, utilizando todas las variables que tengo. Así que hay espacio para el refinamiento.
¿Hay alguna forma de saber el modelo que la salida no puede ser negativo?