1 votos

Predicción conforme para el caso de eventos de una sola cola

Empezaré con un ejemplo motivador y sólo después pasaré a la pregunta.

Considere una lista del total de envases de leche que se compraron en 9 días consecutivos en una tienda determinada,

$z_1,\ldots,z_9 = 1,0,0,2,0,1,0,1,3$

Supongamos que tengo un algoritmo que predice $\hat{z}_{10}=2$ . Estoy interesado en evaluar la confianza asociada a esta predicción, sin embargo, a efectos de gestión de las poblaciones, quiero medir la confianza en que el valor predicho es un límite superior del valor real $z\leq\hat{z}$ , en lugar de $z=\hat{z}$ . Esto es así porque lo que busco en última instancia es tener la seguridad de no quedarme sin existencias.

Supongo que una estimación de esta confianza, basada sólo en los ejemplos dados, es $1-p_{\hat{z}_{10}}$ donde $p_{\hat{z}_{10}}$ es la probabilidad de encontrar un valor más extremo que la predicción $\hat{z}_{10}$ en la distribución empírica de las 10 observaciones:

X
X X
X X X
X X X X
-------
0 1 2 3

que sería $1-p_{\hat{z}_{10}}=0.9$ .

Asumiendo que el razonamiento anterior es correcto (suficiente :), ahora a la pregunta:

Recientemente he leído "A Tutorial on Conformal Prediction" de Shafer y Vovk, y tengo curiosidad por saber cómo enmarcar este problema en el marco de la predicción conforme. Me parece que el documento se centra exclusivamente en el caso de la estimación de la confianza para $z=\hat{z}$ La cuestión es cómo adaptarlo al caso asimétrico.

Si estuviéramos interesados en el $z=\hat{z}$ caso, una medida de disconformidad natural sería $A(B,\hat{z})=|\bar{z}_B-\hat{z}|$ , donde $\bar{z}_B$ es la media de $B$ (sección 4.1 del documento). Esto definiría las siguientes regiones de predicción (del algoritmo de la sección 4.2):

$\Gamma^{0\leq\varepsilon<0.5}=\{0,1,2,3\}$

$\Gamma^{0.5\leq\varepsilon<1}=\{1,2\}$

$\Gamma^{1}=\{\}$

dado que,

$\alpha_0=A(\{1,2,3\},0)=\alpha_3=A(\{0,1,2\},3)=2$

$\alpha_1=A(\{0,2,3\},1)=\alpha_2=A(\{0,1,3\},2)=2/3$

$p_0=p_3=0.5$

$p_1=p_2=1$

Parece erróneo transportar este razonamiento para el caso asimétrico, ya que considera ambas direcciones (por ejemplo, 0) como "más extremas". En particular, significaría que tenemos un 0,5 de confianza en el $z\leq\bar{z}_{10}$ predicción, muy inferior al 0,9 que se dio anteriormente a partir de la distribución empírica.

Me parece que para resolver este problema hay que elegir una medida de disconformidad $A(B,\bar{z})$ que es monótona con respecto a $\bar{z}$ por ejemplo, $A(B,\bar{z})=\bar{z}$ . Eso haría que "más extremo" fuera asimétrico, lo que daría lugar a las siguientes regiones de predicción para el ejemplo anterior:

$\Gamma^{0\leq\varepsilon<0.1}=\{0,1,2,3\}$

$\Gamma^{0.1\leq\varepsilon<0.3}=\{0,1,2\}$

$\Gamma^{0.3\leq\varepsilon<0.6}=\{0,1\}$

$\Gamma^{0.6\leq\varepsilon<1}=\{0\}$

$\Gamma^{1}=\{\}$

dado que,

$\alpha_i=A(B,i)=i$

$p_0=1$

$p_1=0.6$

$p_2=0.3$

$p_3=0.1$

Esto significa que podemos tener una confianza de al menos 0,7 en el $z\leq\bar{z}_{10}$ predicción. En particular, sigue sin coincidir con el 0,9 de confianza obtenido a partir de la distribución empírica. Me pregunto si estoy en el camino correcto...

Gracias.

Marco

2voto

hegemon Puntos 1979

Marco, gracias por contactar conmigo por correo electrónico.

Es posible modificar su medida de disconformidad $A(B,z)=|\bar z_B - z|$ para resolver tu problema: hay que hacerla "unilateral", para que sólo se consideren extraños los valores grandes. En concreto, puede utilizar $A(B,z)=z-\bar z_B$ . Usted sugiere usar $A(B,z)=z$ en su lugar; se trata de una decisión inteligente, ya que, aunque proporciona los mismos intervalos de predicción, simplifica enormemente los cálculos. Permítanme repasar los cálculos para $A(B,z)=z$ (cálculos similares pero más complicados para $A(B,z)=z-\bar z_B$ son un ejercicio útil). Se utilizan conjuntos en los cálculos, pero es importante utilizar conjuntos múltiples. En "A Tutorial on Conformal Prediction" utilizamos una notación especial para los multisets, pero aquí simplemente escribiré $\{\ldots\}$ Sólo hay que recordar que puede haber varias entradas del mismo elemento. Si el objeto de prueba es $z$ Los puntajes de disconformidad son: $$ \alpha_{10}=z, \alpha_1=\alpha_6=\alpha_8=1, \alpha_2=\alpha_3=\alpha_5=\alpha_7=0, \alpha_4=2, \alpha_9=3. $$ Permítanme suponer que $z$ es un número real no negativo (para que tengamos cantidades de leche en lugar de paquetes); esto también cubrirá su caso discreto. Si aumentamos $z$ de 0 a $\infty$ el valor p cambiará cuando $z$ cruces 1, 2 y 3. Es decir, los valores p son: $0.1$ cuando $z\in(3,\infty)$ , $0.2$ cuando $z\in(2,3]$ , $0.3$ cuando $z\in(1,2]$ , $0.6$ cuando $z\in(0,1]$ , $1$ cuando $z=0$ . Así se obtienen estos intervalos de predicción: $\Gamma^{0\le\epsilon<0.1}=[0,\infty)$ (vacuo), $\Gamma^{0.1\le\epsilon<0.2}=[0,3]$ , $\Gamma^{0.2\le\epsilon<0.3}=[0,2]$ , $\Gamma^{0.3\le\epsilon<0.6}=[0,1]$ , $\Gamma^{0.6\le\epsilon<1}=\{0\}$ , $\Gamma^{1}=\emptyset$ . Esto es similar a lo que se obtiene, pero no idéntico; por ejemplo $\Gamma^0$ debe ser $\{0,1,2,3,4,\ldots\}$ en su caso discreto, no sólo $\{0,1,2,3\}$ (las ventas pueden superar lo visto hasta ahora).

¿Tiene sentido para ti?

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X