De fondo (puede ser omitido)
Voy a estar pensando en la decisión de la teoría de los siguientes términos. Un usuario debe elegir una acción $a$ entre un conjunto de posibilidades de $A$. La acción traerá con él/ella en alguna "utilidad" (un concepto comúnmente utilizado en economía) $u(a;s)$ dependiendo del estado de la naturaleza $s$ que se hará realidad en el futuro, donde el $s \in S$, un conjunto de todos los estados posibles. (Utilidad es básicamente el negativo de la pérdida, y lo que sigue podría ser reformulada, equivalentemente, ya sea en términos de utilidad o pérdida.) El usuario tiene como objetivo la maximización de la utilidad esperada (o, equivalentemente, la minimización de la pérdida esperada) w.r.t. la acción,
$$
\max_{a \in A} \mathbb{E}_{S} u(a;s).
$$
La elección de la acción se basa en la previsión de que el estado de la naturaleza que se dio cuenta. Dada una densidad de previsión de $\hat f_S(\cdot)$, un usuario puede calcular la utilidad esperada de una acción en particular mediante la integración de la utilidad de que la acción sobre la predicción de la distribución de los estados de la naturaleza,
$$
\mathbb{E}_{\hat S} u(a;s) = \int u(a;s) \hat f_S(s) ds.
$$
Entonces él/ella elige la acción (de entre todos los posibles) que maximiza esta utilidad esperada, $\hat a^* := \arg\max_{a \in A} \mathbb{E}_{\hat S} u(a;s)$. El valor esperado de la utilidad en esta acción, para esta densidad pronóstico es $\hat u^*:=u(\hat a^*)$.
Si la función de utilidad tiene un único máximo (pérdida de función tiene un único mínimo), la acción óptima es única. Si el estado de naturaleza es una variable aleatoria continua, existe un punto en la distribución (estado de naturaleza) que produce exactamente $\hat u^*$. Ese punto se define el objetivo de la "relevante" en el punto previsto. Por lo tanto, el usuario obtendrá exactamente la misma maximizada (sobre todas las acciones posibles) utilidad esperada, independientemente de si el pronóstico se obtiene es una densidad de previsión o la "relevante" en el punto de pronóstico (una unidad de masa de probabilidad en un determinado estado de la naturaleza), siempre que la calidad de los dos pronósticos es "igual de bien" (el más fácil de comprender intuitivamente el último es el que considera el caso donde tanto el punto y la densidad de previsión son perfectos).
Parte principal (ver antecedentes para más detalles)
Creo que es razonable suponer que la utilidad de un pronóstico es totalmente reflejada por la pérdida en que incurra para un usuario determinado. A continuación, el objetivo de un usuario es elegir un pronóstico que minimiza la pérdida esperada. Por tanto, dada una predicción de la distribución, el usuario tendrá una concreta función de la misma (por ejemplo, predijo que significa) que minimiza la pérdida esperada. El resto de la predicción de la densidad no tendrá ningún valor añadido para el usuario.
Si la pérdida de la función tiene un único mínimo, la función será de un solo valor, y ese valor será el punto de pronóstico relevante para el usuario. Por ejemplo, si el usuario de la pérdida de la función es cuadrática (que tiene un único mínimo en la media de la verdadera distribución), él/ella será sólo la atención sobre la previsión de la media. Si otro usuario se enfrenta a pérdida absoluta (que tiene un único mínimo en la mediana de la verdadera distribución), él/ella será sólo la atención sobre la previsión de la mediana. Proporcionar una densidad de previsión para cualquiera de estos usuarios, además de las previsiones de la media y la mediana, respectivamente, será de cero valor añadido para ellos.
Elliott y Timmermann (2016a) escribir en la página. 423-424 (en cuanto a la evaluación de la densidad de previsiones):
Una forma de [evalute una densidad de previsión] sería convertir la densidad de previsión en un punto de la previsión y el uso de los métodos de punto previsión de la evaluación. Este enfoque simple para la evaluación de la densidad de las previsiones podría ser apropiada para un número de razones. <...> [D]ensity pronósticos puede ser justificada sobre la base de que hay varios usuarios con distintos pérdida de las funciones. Uno de estos usuarios puede examinar el desempeño de una densidad de pronosticar, con referencia específica a la función de pérdida se considera apropiado para su problema. La medida del rendimiento de las predicciones es la pérdida promedio calculado a partir de específicas de cada usuario función de pérdida.
Por otra parte, dado un conocido de la pérdida de función de una densidad de previsión puede incluso ser inferior a un punto relevante de la previsión, por las dos razones siguientes. En primer lugar, la densidad de las previsiones normalmente son más difíciles de producir que el punto de las previsiones. En segundo lugar, se podría comercio de precisión/exactitud en un punto determinado (por ejemplo, la media o la mediana) de precisión/exactitud a través de toda la distribución que se predice. Es decir, si uno es la predicción de la totalidad de la densidad, uno podría tener que sacrificar algo de precisión y exactitud para el pronóstico de la media, así como para obtener una mayor precisión/exactitud en otros lugares. Como Elliott y Timmermann (2016b) escribir,
[T]él las relaciones entre las reglas de puntuación popular en la literatura y el subyacente de la pérdida de las funciones para los usuarios individuales, no está clara. Por lo tanto, bien podría ser que la regla de puntuación utilizado proporciona una estimación deficiente de la función de la distribución condicional de que algunos usuarios desean construir.
Una similar de la cita se puede encontrar en Elliott y Timmermann (2016a), p. 277-278:
Parecería que la provisión de una predicción de la densidad es superior a la presentación de un punto de pronóstico, ya que ambos (a) puede ser combinado con una función de pérdida para producir cualquier punto de la previsión; y (b) es independiente de la función de pérdida. En el clásico de estimación de la capacidad de predicción de la densidad, ninguno de estos puntos tiene en realidad en la práctica. <...> [E]n la clásica configuración de la estimación de la predicción de distribuciones dependen de la función de pérdida. Todos los parámetros de la predicción de la densidad necesidad de ser estimado y estas estimaciones requieren una cierta pérdida de la función, por lo que la pérdida de funciones son arrojados a la mezcla. El problema aquí es que la pérdida de las funciones que a menudo son empleadas en la estimación de densidad no se alinean con los que trabajan para el punto de pronóstico que puede conducir a punto inferior a las previsiones. <...> Por otra parte, las distribuciones condicionales son difíciles de estimar, y entonces el punto de pronósticos basados en estimaciones de la densidad condicional puede ser muy subóptima a partir de una estimación de la perspectiva.
Por lo tanto, cuando una función de pérdida se da, podría tener sentido para centrarse en la predicción del punto en particular adaptado a la función de pérdida, en lugar de intentar pronosticar el conjunto de la distribución. Esto podría ser más fácil de hacer y/o de forma más precisa.
Una cuestión fundamental a mí mismo: puede ser que el "relevante" en el punto de pronóstico no puede ser expresado como una función de la desconocida densidad, sino más bien ser diferente (como una función, no sólo de su valor) para diferentes densidades? A continuación, una densidad previsión de que sería necesario para averiguar qué punto la previsión uno está interesado en hacer una densidad de pronóstico de un paso inevitable en el punto en el proceso de proyección.
Referencias: