11 votos

umbral de cálculo del clasificador de riesgo mínimo?

Supongamos dos clases $C_1$ y $C_2$ tiene un atributo $x$ y tiene una distribución $ \cal{N} (0, 0.5)$ y $ \cal{N} (1, 0.5)$ . si tenemos la igualdad de los anteriores $P(C_1)=P(C_2)=0.5$ para la siguiente matriz de costes:

$L= \begin{bmatrix} 0 & 0.5 \\ 1 & 0 \end{bmatrix}$

por qué, $x_0 < 0.5$ ¿es el umbral del clasificador de riesgo mínimo (coste)?

Este es mi ejemplo de nota que no entiendo, (es decir, ¿cómo se alcanza este umbral? )

Edición 1: Creo que para los umbrales de la razón de verosimilitud podemos utilizar P(C1) / P(C2).

Editar 2: Agrego desde el Libro de Duda sobre el Patrón algún texto sobre el umbral. enter image description here

4voto

Andy Puntos 10250

Para una matriz de costes $$L= \begin{bmatrix} 0 & 0.5 \\ 1 & 0 \end{bmatrix} \begin{matrix} c_1 \\ c_2 \end{matrix} \;\text{prediction} \\ \hspace{-1.9cm} \begin{matrix} c_1 & c_2 \end{matrix} \\ \hspace{-1.9cm}\text{truth}$$

la pérdida de la clase de predicción $c_1$ cuando la verdad es la clase $c_2$ es $L_{12} = 0.5$ y el coste de la predicción de la clase $c_2$ cuando la verdad es la clase $c_1$ es $L_{21} = 1$ . Las predicciones correctas no tienen coste alguno, $L_{11} = L_{22} = 0$ . El riesgo condicional $R$ para predecir cualquier clase $k$ es entonces

$$ \begin{align} R(c_1|x) &= L_{11} \Pr (c_1|x) + L_{12} \Pr (c_2|x) = L_{12} \Pr (c_2|x) \\ R(c_2|x) &= L_{22} \Pr (c_2|x) + L_{21} \Pr (c_1|x) = L_{21} \Pr (c_1|x) \end{align} $$ Para obtener una referencia, consulte lo siguiente notas en la página 15.

Para minimizar el riesgo/pérdida que usted predice $c_1$ si el coste del error de hacerlo (es decir, la pérdida de la predicción errónea multiplicada por la probabilidad posterior de que la predicción sea errónea $L_{12} \Pr (c_2|x)$ ) es menor que el coste de predecir erróneamente la alternativa,

$$ \begin{align} L_{12} \Pr (c_2|x) &< L_{21} \Pr (c_1|x) \\ L_{12} \Pr (x|c_2) \Pr (c_2) &< L_{21} \Pr (x|c_1) \Pr (c_1) \\ \frac{L_{12} \Pr (c_2)}{L_{21} \Pr (c_1)} &< \frac{\Pr (x|c_1)}{ \Pr (x|c_2)} \end{align} $$ donde la segunda línea utiliza la regla de Bayes $\Pr (c_2|x) \propto \Pr (x|c_2) \Pr (c_2)$ . Dada la igualdad de probabilidades a priori $\Pr (c_1) = \Pr (c_2) = 0.5$ se obtiene $$\frac{1}{2} < \frac{\Pr (x|c_1)}{ \Pr (x|c_2)}$$

por lo que se opta por clasificar una observación como $c_1$ es que el ratio de probabilidad supera este umbral. Ahora bien, no me queda claro si querías saber cuál es el "mejor umbral" en términos de cocientes de probabilidad o en términos del atributo $x$ . La respuesta cambia según la función de costes. Utilizando la gaussiana en la desigualdad con $\sigma_1 = \sigma_2 = \sigma$ y $\mu_1 = 0$ , $\mu_2 = 1$ , $$ \begin{align} \frac{1}{2} &< \frac{\frac{1}{\sqrt{2\pi}\sigma}\exp \left[ -\frac{1}{2\sigma^2}(x-\mu_1)^2 \right]}{\frac{1}{\sqrt{2\pi}\sigma}\exp \left[ -\frac{1}{2\sigma^2}(x-\mu_2)^2 \right]} \\ \log \left(\frac{1}{2}\right) &< \log \left(\frac{1}{\sqrt{2\pi}\sigma}\right) -\frac{1}{2\sigma^2}(x-0)^2 - \left[ \log \left(\frac{1}{\sqrt{2\pi}\sigma}\right) -\frac{1}{2\sigma^2}(x-1)^2 \right] \\ \log \left(\frac{1}{2}\right) &< -\frac{x^2}{2\sigma^2} + \frac{x^2}{2\sigma^2} - \frac{2x}{2\sigma^2} + \frac{1}{2\sigma^2} \\ \frac{x}{\sigma^2} &< \frac{1}{2\sigma^2} - \log \left(\frac{1}{2}\right) \\ x &< \frac{1}{2} - \log \left(\frac{1}{2}\right) \sigma^2 \end{align} $$ por lo que un umbral de predicción en términos de $x$ como se busca sólo se puede conseguir si las pérdidas por falsas predicciones son las mismas, es decir $L_{12} = L_{21}$ porque sólo así se puede tener $\log \left( \frac{L_{12}}{L_{21}} \right) = \log (1) = 0$ y se obtiene el $x_0 < \frac{1}{2}$ .

0 votos

Buena respuesta, pero me confunde! si quieres elegir $x_0=0.5$ o $x_0<0.5$ ¿Cuál es la correcta?

0 votos

Así que justo en el límite de la decisión $x_0=0.5$ no se puede saber exactamente si una observación debe estar en la clase uno o dos (porque está exactamente en el límite). Así que la elección de si la observación $i$ debe estar en la clase 1 si $x_0 \leq 0.5$ o $x_0 < 0.5$ depende de ti. Con muestras suficientemente grandes, esto debería ocurrir en muy pocas observaciones, por lo que en el margen importará poco para su resultado.

0 votos

Todo mi problema que le puso recompensa que mi prof. calculó $x_0<0.5$ y no aceptar $x_0=0.5$ por favor, vea mi edición en cuestión, creo que el umbral debe ser $x_0<0.5$ .

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X