Chris Chatfield, cuyos muchos libros y artículos de calidad he disfrutado leyendo, en (1) da el siguiente consejo:
Por ejemplo, la elección entre modelos de series temporales ARIMA con valores bajos y aproximadamente iguales del AIC probablemente debería hacerse, no en función de cuál da el AIC mínimo, sino en función de cuál da las mejores previsiones de los datos del año más reciente.
¿Cuál es la razón de este consejo? Si es sólido, ¿por qué forecast::auto.arima y otras rutinas de previsión no lo siguen? ¿Aún no se ha implementado? Es ya se ha discutido aquí que buscar modelos que simplemente den el mínimo AIC no es probablemente una buena idea. ¿Por qué la opción de tener $n\ge1$ Los modelos ARIMA con valores bajos pero aproximadamente iguales (por ejemplo, dentro de 1 o 2 valores del AIC mínimo) no es un valor por defecto en gran parte del software de previsión de series temporales?
(1) Chatfield, C. (1991). Evitar las trampas estadísticas. Ciencia Estadística, 6 (3), 240-252. Disponible en línea, URL: https://projecteuclid.org/euclid.ss/1177011686 .
0 votos
@Gleb_b "Un AIC sólo es alto o bajo en comparación con otro". - Cómo podemos pensar de forma diferente cuando hablamos de selección de modelos? Siempre nos fijamos en los valores bajos y no en los más altos. ¿Qué hay de malo en mi cuarta frase? Creo que establece con bastante claridad que estamos hablando de diferencias (por ejemplo, dentro de uno o dos del AIC mínimo). En la pregunta no se mencionan los valores absolutos del AIC.
0 votos
He eliminado "baja" del título y de la primera frase del recuadro, por las razones que apuntaba @hibernating.
0 votos
@Harvey Motulsky Por favor, vuelva a poner "bajo" en ambos lugares. Gracias.
0 votos
Su pregunta se refiere a cómo comparar modelos cuyos AIC tienen valores bastante cercanos. Que sean altos o bajos es irrelevante (y puede cambiar simplemente cambiando las unidades en las que se expresan los datos). Entonces, ¿por qué volver a poner esas palabras? Son engañosas.
0 votos
@Harvey Motulsky En primer lugar, la caja es la cita y como tal no debe ser modificada. Segundo, sé lo que hay que hacer en situaciones como AICc=c(234,2, 677,2,677,1) - mi pregunta iba dirigida a AICc=c(234,2, 234,1, 677,1). En tercer lugar, no señalé ninguna razón que provocara tus ediciones o sugiriera que Chatfield pudiera ser engañoso. Así que, por favor, vuelve a ponerlo.
0 votos
Pero "bajo" no importa. Se interpretaría de la misma manera AICc=(c1000234,2, 1000234,1, 1000677,1). Lo que importa es la diferencia, no la proporción, de los valores de AICc. (He revertido la cita).
0 votos
@Harvey Motulsky No importa lo que pongas en la lista de valores de AIC, siempre habrá valores de AIC que sean bajos y otros que sean altos. Yo no he hablado de ratios en absoluto. Si has revertido la cita en la que se basa esta pregunta, también deberías revertir el título de la misma. Me haces perder el tiempo: es la tercera vez que te digo que tus ediciones no son útiles ni necesarias, y que es mi voluntad que el título de mi pregunta sea coherente con la cita en la que se basa.
0 votos
¿Alguien más quiere intervenir aquí sobre la redacción de la pregunta?
0 votos
Se trataba de una simple pregunta, no de un chat. Tal vez debería intentarlo de nuevo: imagine 3 modelos ARIMA que muestran los siguientes valores del AIC: 234,2,677,2,677,1. Es simplemente una tontería preguntar qué hacer con valores aproximadamente iguales de AIC en este caso: todo el mundo los ignoraría y a los modelos correspondientes. Mi pregunta no se refiere a "cómo comparar modelos con los AIC que tienen valores bastante cercanos", como usted cree (errores tipográficos en el original).
0 votos
Mi pregunta se refiere a los valores de AIC que son a la vez bajos (en comparación con otros valores de la lista) y aproximadamente iguales, es decir, que excluye deliberadamente las situaciones en las que es una tontería preguntar qué hacer. La respuesta de Chatfield difiere de lo que aprendí de Akaike, así que pensé en preguntar aquí si hay otras opciones interesantes. Esto es sobre lo que quería que la gente se involucrara, no sobre la cuestión sin importancia de qué redacción puede convenir más a cada uno.
0 votos
@HarveyMotulsky Creo que la cita debe mantenerse tal y como está en el original, tenga o no sentido, es una cita. En última instancia, el OP debe ser el árbitro de lo que dice su pregunta, incluso si va en contra de los mejores consejos disponibles; si el OP está decidido a tener la pregunta de una manera particular, no importa qué, sugiero que les permite hacerlo - si usted piensa que la pregunta no tiene sentido de esa manera, recomendar el cierre (por ejemplo, en "no está claro lo que está pidiendo"). Si estás por aquí, estaré en el chat unos minutos.
0 votos
@Hibernando. Gracias por la aclaración. Ahora lo entiendo. ¿Esta redacción de la pregunta expresa tu intención? "Elegir entre un conjunto de modelos cuando los dos valores AIC más bajos son casi iguales"
1 votos
@Harvey Motulsky Por favor, déjame ser yo mismo. Me gusta el título actual y mi título original "¿Qué hago cuando los valores del AIC son bajos y aproximadamente iguales?" Tiendo a preferir "seleccionar" sobre "elegir" en mis escritos estadísticos. Tengo una serie de otras preferencias que me caracterizan como individuo y se reflejan en la forma en que formulo mis preguntas y respuestas. Me alegro de que finalmente hayas entendido por qué te pedí que revirtieras los cambios. No hay problemas.