5 votos

¿Qué puedo hacer si mi modelo de regresión logística no predice nada?

Tengo un modelo de regresión logística que predice las ganancias/pérdidas en función de la cantidad de dinero pagada. Ejecuto mi modelo cada dos horas con los nuevos datos que adquiero y lo utilizo para predecir las dos horas siguientes. Sin embargo, sigo encontrando que mi modelo no predice las ganancias/pérdidas para cada cantidad de dinero pagada. Así que estoy en esta situación en la que tengo un modelo estadístico, pero no parece predecir los nuevos datos a medida que llegan.

Me queda la duda, ¿qué hago ahora? Mi modelo no predice para los nuevos datos, pero necesito que lo haga.

¿Cuáles son las estrategias generales para cuando un modelo no tiene capacidad de predicción?

Como nota al margen, debería haber mencionado que en realidad tenía dos modelos. Uno que predecía la victoria/pérdida de 0 a 5 \$ and another for 5.01 \$ y más. Es posible que esto haya sido un culpable, y puede que quiera utilizar un modelo de regresión robusto en su lugar. No es del todo relevante, pero pensé en mencionarlo.

6voto

Funkatron Puntos 757

¿Qué quiere decir que no predice? ¿Insinúas que el modelo hace lo mismo que adivinar al azar?

¿Tal vez su punto de corte (para predecir un resultado "positivo") no es adecuado? Puede que quiera intentar producir algunas curvas ROC basadas en los datos que tiene actualmente para elegir un punto de corte adecuado. Al elegir este punto de corte, debería tener en cuenta el "coste" de dar un falso positivo en comparación con un falso negativo.

Si todavía no le va bien, es probable que sus predictores no estén asociados a la respuesta.

4voto

Zizzencs Puntos 1358

Una estrategia general cuando un modelo no tiene capacidad de predicción es volver a empezar.

Pero, ¿tiene realmente no ¿poder predictivo? Es decir, ¿no es mejor que lanzar una moneda al aire?

En general, y salvo raras excepciones, los modelos funcionarán mejor con los datos con los que fueron entrenados que con los nuevos.

Más allá de eso, algo más de contexto podría ayudar.

3voto

¿Qué has trazado para los valores predichos y los valores reales? El modelo predice las probabilidades logarítmicas, o algún otro valor dependiendo de lo que le pida a la predicción. Podría ser la probabilidad. Los valores reales son sólo 0,1. Una forma de evitarlo es dividir los valores reales en subrangos del predictor y obtener las medias (probabilidad de 1) o hacer valores log-odds.

Tienes que especificar en tu pregunta qué le pides a predict que devuelva y cuáles son los valores "reales" con los que lo estás comparando.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X