9 votos

¿Una previsión de densidad agregar valor más allá de un punto de pronóstico cuando se da la función de pérdida?

Densidad de pronósticos son más universal que el punto de las previsiones, que proporcionan información sobre la totalidad del predictivos de distribución de una variable aleatoria en lugar de en una concreta función de la misma (tal como se predijo, la media, la mediana, los cuantiles, etc.). La disponibilidad de una densidad de previsión permite a diferentes usuarios elegir elementos relevantes -- punto de pronósticos, que son de su interés. Algunos usuarios se centran en la predicción de la media, otros en la predicción de la mediana, etc., en función de la pérdida de la función por la cual el pronóstico es evaluado (y que pueden variar de usuario a usuario). Dada una densidad de previsión, las necesidades de cada usuario estará satisfecho, independientemente de la función de pérdida, debido a que la densidad de previsión contiene todos los probabilístico de la información acerca de la variable aleatoria.

Sin embargo, si tenemos un usuario concreto en mente y conocer su función de pérdida, entonces

  • ¿La densidad de previsión de proporcionar un valor añadido por encima de un punto previsión de adaptarse a la pérdida de la función?
  • Si la respuesta es No , en general, ¿cuáles son las condiciones para hacer de él un ?

P. S. @hejseb dibuja un interesante paralelo entre un punto de la previsión adaptados a la función de pérdida y una estadística suficiente; tal vez esto puede inspirar una respuesta.

6voto

icelava Puntos 548

No puedo pensar en uno-y-uno-mitad más o menos realista de las situaciones donde la densidad es mejor que un punto de pronóstico, incluso si la función de pérdida es conocida.

  • El nitpicky es la situación donde el usuario de la función de pérdida no sólo depende del punto de pronóstico, pero en un dos caras , o incluso la totalidad de la densidad, es decir, la función de pérdida es una .

    Sí, una función de pérdida se define normalmente a depender de un único punto de pronóstico, por lo que estoy suelta con la nomenclatura aquí. Sin embargo, situaciones como estas ocurren, por ejemplo, en la volatilidad financiera de previsión. O donde yo trabajo, en el comercio minorista de reposición de previsión: se quiere lograr un 95% de nivel de servicio, por lo que en la cara de ella, sólo podemos estar interesados en que el (punto) cuantil de previsión. Sin embargo, un 95% de los cuantiles de previsión pueden ser de 4, mientras que podemos ser limitada a reponer en tamaños de envase de 8. En tal situación, puede ser muy valioso para saber qué porcentaje 8 unidades corresponden.

  • Los más relevantes de la situación es que estamos interesados en las funciones de predicción de las densidades. De nuevo, considere previsiones minoristas: debido a la programación de entrega, nuestro pedido de reabastecimiento pueden necesitar para cubrir tres días, de martes a jueves. Sin embargo, nos pronóstico diario de la granularidad. Así que podemos estar interesados en el 95% de los cuantiles de la previsión de la suma de las demandas, y para la convolución, tenemos la plena densidades. (También podríamos tratar de previsión en tres días cubo de granularidad, pero que se convierte en un problema si, por ejemplo, una promoción comienza en el centro de la cubeta.)

4voto

Richard Hardy Puntos 6099

De fondo (puede ser omitido)

Voy a estar pensando en la decisión de la teoría de los siguientes términos. Un usuario debe elegir una acción $a$ entre un conjunto de posibilidades de $A$. La acción traerá con él/ella en alguna "utilidad" (un concepto comúnmente utilizado en economía) $u(a;s)$ dependiendo del estado de la naturaleza $s$ que se hará realidad en el futuro, donde el $s \in S$, un conjunto de todos los estados posibles. (Utilidad es básicamente el negativo de la pérdida, y lo que sigue podría ser reformulada, equivalentemente, ya sea en términos de utilidad o pérdida.) El usuario tiene como objetivo la maximización de la utilidad esperada (o, equivalentemente, la minimización de la pérdida esperada) w.r.t. la acción, $$ \max_{a \in A} \mathbb{E}_{S} u(a;s). $$

La elección de la acción se basa en la previsión de que el estado de la naturaleza que se dio cuenta. Dada una densidad de previsión de $\hat f_S(\cdot)$, un usuario puede calcular la utilidad esperada de una acción en particular mediante la integración de la utilidad de que la acción sobre la predicción de la distribución de los estados de la naturaleza, $$ \mathbb{E}_{\hat S} u(a;s) = \int u(a;s) \hat f_S(s) ds. $$ Entonces él/ella elige la acción (de entre todos los posibles) que maximiza esta utilidad esperada, $\hat a^* := \arg\max_{a \in A} \mathbb{E}_{\hat S} u(a;s)$. El valor esperado de la utilidad en esta acción, para esta densidad pronóstico es $\hat u^*:=u(\hat a^*)$.

Si la función de utilidad tiene un único máximo (pérdida de función tiene un único mínimo), la acción óptima es única. Si el estado de naturaleza es una variable aleatoria continua, existe un punto en la distribución (estado de naturaleza) que produce exactamente $\hat u^*$. Ese punto se define el objetivo de la "relevante" en el punto previsto. Por lo tanto, el usuario obtendrá exactamente la misma maximizada (sobre todas las acciones posibles) utilidad esperada, independientemente de si el pronóstico se obtiene es una densidad de previsión o la "relevante" en el punto de pronóstico (una unidad de masa de probabilidad en un determinado estado de la naturaleza), siempre que la calidad de los dos pronósticos es "igual de bien" (el más fácil de comprender intuitivamente el último es el que considera el caso donde tanto el punto y la densidad de previsión son perfectos).

Parte principal (ver antecedentes para más detalles)

Creo que es razonable suponer que la utilidad de un pronóstico es totalmente reflejada por la pérdida en que incurra para un usuario determinado. A continuación, el objetivo de un usuario es elegir un pronóstico que minimiza la pérdida esperada. Por tanto, dada una predicción de la distribución, el usuario tendrá una concreta función de la misma (por ejemplo, predijo que significa) que minimiza la pérdida esperada. El resto de la predicción de la densidad no tendrá ningún valor añadido para el usuario.

Si la pérdida de la función tiene un único mínimo, la función será de un solo valor, y ese valor será el punto de pronóstico relevante para el usuario. Por ejemplo, si el usuario de la pérdida de la función es cuadrática (que tiene un único mínimo en la media de la verdadera distribución), él/ella será sólo la atención sobre la previsión de la media. Si otro usuario se enfrenta a pérdida absoluta (que tiene un único mínimo en la mediana de la verdadera distribución), él/ella será sólo la atención sobre la previsión de la mediana. Proporcionar una densidad de previsión para cualquiera de estos usuarios, además de las previsiones de la media y la mediana, respectivamente, será de cero valor añadido para ellos.

Elliott y Timmermann (2016a) escribir en la página. 423-424 (en cuanto a la evaluación de la densidad de previsiones):

Una forma de [evalute una densidad de previsión] sería convertir la densidad de previsión en un punto de la previsión y el uso de los métodos de punto previsión de la evaluación. Este enfoque simple para la evaluación de la densidad de las previsiones podría ser apropiada para un número de razones. <...> [D]ensity pronósticos puede ser justificada sobre la base de que hay varios usuarios con distintos pérdida de las funciones. Uno de estos usuarios puede examinar el desempeño de una densidad de pronosticar, con referencia específica a la función de pérdida se considera apropiado para su problema. La medida del rendimiento de las predicciones es la pérdida promedio calculado a partir de específicas de cada usuario función de pérdida.

Por otra parte, dado un conocido de la pérdida de función de una densidad de previsión puede incluso ser inferior a un punto relevante de la previsión, por las dos razones siguientes. En primer lugar, la densidad de las previsiones normalmente son más difíciles de producir que el punto de las previsiones. En segundo lugar, se podría comercio de precisión/exactitud en un punto determinado (por ejemplo, la media o la mediana) de precisión/exactitud a través de toda la distribución que se predice. Es decir, si uno es la predicción de la totalidad de la densidad, uno podría tener que sacrificar algo de precisión y exactitud para el pronóstico de la media, así como para obtener una mayor precisión/exactitud en otros lugares. Como Elliott y Timmermann (2016b) escribir,

[T]él las relaciones entre las reglas de puntuación popular en la literatura y el subyacente de la pérdida de las funciones para los usuarios individuales, no está clara. Por lo tanto, bien podría ser que la regla de puntuación utilizado proporciona una estimación deficiente de la función de la distribución condicional de que algunos usuarios desean construir.

Una similar de la cita se puede encontrar en Elliott y Timmermann (2016a), p. 277-278:

Parecería que la provisión de una predicción de la densidad es superior a la presentación de un punto de pronóstico, ya que ambos (a) puede ser combinado con una función de pérdida para producir cualquier punto de la previsión; y (b) es independiente de la función de pérdida. En el clásico de estimación de la capacidad de predicción de la densidad, ninguno de estos puntos tiene en realidad en la práctica. <...> [E]n la clásica configuración de la estimación de la predicción de distribuciones dependen de la función de pérdida. Todos los parámetros de la predicción de la densidad necesidad de ser estimado y estas estimaciones requieren una cierta pérdida de la función, por lo que la pérdida de funciones son arrojados a la mezcla. El problema aquí es que la pérdida de las funciones que a menudo son empleadas en la estimación de densidad no se alinean con los que trabajan para el punto de pronóstico que puede conducir a punto inferior a las previsiones. <...> Por otra parte, las distribuciones condicionales son difíciles de estimar, y entonces el punto de pronósticos basados en estimaciones de la densidad condicional puede ser muy subóptima a partir de una estimación de la perspectiva.

Por lo tanto, cuando una función de pérdida se da, podría tener sentido para centrarse en la predicción del punto en particular adaptado a la función de pérdida, en lugar de intentar pronosticar el conjunto de la distribución. Esto podría ser más fácil de hacer y/o de forma más precisa.

Una cuestión fundamental a mí mismo: puede ser que el "relevante" en el punto de pronóstico no puede ser expresado como una función de la desconocida densidad, sino más bien ser diferente (como una función, no sólo de su valor) para diferentes densidades? A continuación, una densidad previsión de que sería necesario para averiguar qué punto la previsión uno está interesado en hacer una densidad de pronóstico de un paso inevitable en el punto en el proceso de proyección.

Referencias:

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X