Me gustaría evaluar varios modelos diferentes que proporcionan predicciones de comportamiento a nivel mensual. Los datos están equilibrados y $n=$ 100.000 y $T=$ 12. El resultado es la asistencia a un concierto en un mes, por lo que es cero para el ~80% de las personas en cualquier mes, pero hay una larga cola derecha de grandes usuarios. Las predicciones que tengo no parecen respetar la naturaleza de recuento del resultado: los conciertos fraccionados son prevalentes.
No sé nada de los modelos. Sólo observo 6 diferentes predicciones de caja negra $\hat y_1,...,\hat y_6$ por cada persona al mes. Yo sí un año más de datos que los creadores del modelo no tenían para estimación (aunque los asistentes a los conciertos siguen siendo los mismos), y me gustaría me gustaría calibrar en qué punto se comporta bien cada uno (en términos de exactitud y precisión). Por ejemplo, ¿algún modelo predice bien los conciertos frecuentes de conciertos, pero fracasa en el caso de los adictos al sofá? ¿Es la predicción para enero es mejor que la predicción para diciembre? Por otra parte, sería sería bueno saber que las predicciones me permiten clasificar a las personas correctamente en función de los datos reales, aunque no se pueda confiar en la magnitud exacta de la magnitud exacta.
Lo primero que pensé fue en realizar una regresión de efectos fijos de lo real sobre lo predichos y dummies de tiempo y mirar los RMSEs o $R^2$ para cada modelo. Pero que no responde a la pregunta sobre dónde lo hace bien cada modelo o si las diferencias son significativas (a menos que haga un bootstrap del RMSE). La distribución del resultado también me preocupa con este enfoque.
Mi segunda idea era dividir el resultado en 0, 1-3 y 3+ y calcular la matriz de confusión. calcular la matriz de confusión, pero esto ignora la dimensión temporal, a menos que haga 12 de estos. También es bastante grueso.
Conozco los comandos de Stata concord
de T.J. Steichen y N.J. Cox--que tiene la by()
pero eso requeriría colapsar los datos a totales anuales. Así se calcula el Índice de correlación de la concordancia con intervalos de confianza, entre otras estadísticas útiles. El CCC va de -1 a 1, con una concordancia perfecta en 1.
También está Harrell's $c$ (calculado a través de somersd
de R. Newson), que tiene la cluster
opción, pero no estoy seguro de que me permita tratar los datos del panel. Esto le da intervalos de confianza. La c de Harrell es la generalización del área bajo una curva ROC (AUC) para un resultado continuo. Es la proporción de todos los pares que pueden ordenarse de forma que el sujeto con la predicción más alta tenga realmente el resultado más alto. Así que $c=0.5$ para predicciones aleatorias $c=1$ para un modelo perfectamente discriminante. Véase El libro de Harrell , p.493
¿Cómo abordaría usted este problema? ¿Sugiere calcular estadísticas como el MAPE, que son habituales en las previsiones?
Cosas útiles encontradas hasta ahora:
- Diapositivas en una versión de medidas repetidas del Coeficiente de Correlación de Concordancia de Lin
0 votos
Necesitaremos saber más sobre el comportamiento, ¿es de valor ordinal/binario/continuo? Dado que este experimento es longitudinal, ¿le interesa pronosticar o predecir los resultados en un individuo? Los modelos de efectos mixtos se utilizan para la inferencia, no para la predicción. No funcionan porque, para predecir se necesita una estimación del efecto aleatorio.
0 votos
El comportamiento real es de conteo o continuo. Las predicciones son todas continuas. Me gustaría ver la calidad de las predicciones mensuales a nivel individual.
0 votos
¿"Predicciones mensuales a nivel individual" en personas de las que ha observado datos anteriores o personas en la evaluación inicial? Es decir, ¿obtiene usted $\widehat{Y_{i=12}} = f(X_{i=12, 11, \cdots, 1}, Y_{i=11, 10, \cdots, 1}$ o $\widehat{Y_{i=I}} = f(X_{i=I, I-1, \cdots, 1}, Y_{i=I-1, I-2, \cdots, 1}$ o $\widehat{Y_{i}} = f(X_{i})$ o ... por favor, aclárese, ya que la predicción de la longitudinal no es una cuestión de mano.
0 votos
Se trata de una muestra de personas que se utilizó para la estimación, pero la predicción es para el año posterior a la ventana de estimación. La predicción para el primer mes es una función del comportamiento rezagado y observado y de las covariables observadas para la persona $i$ : $\hat Y_{i,1}=f(Y_{i,t-1},X_{i,t}).$ Espero que el primer mes esté bastante cerca. Para el segundo mes (y los siguientes), es una función de la predicción del mes anterior y las covariables observadas de ese mes: $\hat Y_{i,2}=f(\hat Y_{i,1},X_{i,2})$ . Espero que esta predicción se aleje cada vez más de los datos reales. Quiero comparar $Y_{i,t}$ y $\hat Y_{i,t}$ .
0 votos
La estimación implica la estimación de los parámetros, que puede formar parte del "entrenamiento" de un modelo predictivo, pero creo que quieres decir que tu muestra se utiliza para entrenar un modelo predictivo. Lo que planteas aquí es un proceso de semi-markov condicional y tiene aplicaciones únicas en la predicción.