8 votos

La construcción de un problema específico de la pérdida de la función

Descripción Del Problema

Estoy empezando la construcción de la red para un problema que siento que podría tener mucho más profundas de la pérdida de función de un simple MSE de regresión.

Mi problema trata con multi-categoría de clasificación (ver mi pregunta ASÍ que para qué me refiero con esto), donde hay definida una distancia o relación entre las categorías que deben ser tomados en cuenta.

Otro punto es que el error no debe ser afectado por el número de cocción de las categorías presentes. I. e. el error de 5 de cocción de cada una de las categorías fuera de 0,1, debe ser igual a 1 disparo categoría 0.1. (por disparo me refiero a que no son cero, o por encima de un cierto umbral)


Puntos clave

  • multi-categoría de clasificación (varios de cocción a la vez)
  • relaciones entre las categorías
  • recuento de disparo categorías no deberían efecto de la pérdida:
    • enter image description here

Mi Intento

El Error cuadrático parece un buen lugar para empezar:

enter image description here

Esto es simplemente teniendo en cuenta la categoría por categoría, lo cual es muy valioso en mi problema, pero se pierde una gran parte de la imagen.

enter image description here

Aquí está mi intento de rectificar la idea de la distancia entre las categorías. Me gustaría tomar en cuenta el número de categorías de la cocción (la llamada es: v)

enter image description here


Mi Pregunta

Tengo una muy débil en las estadísticas; como resultado, no tengo muchas herramientas en el cinturón de abordar un problema como este. El paraguas tema de lo que te estoy preguntando parece ser que "Cuando la formación de una función de coste, ¿cómo se hace la combinación de múltiples medida de costo? O ¿qué técnicas se puede aplicar a hacerlo?". Yo también agradecería tener algún defecto en mi proceso de pensamiento expuesta y mejorado.

I valor de ser enseñados por qué mis errores son errores, en lugar de tener a alguien únicamente corregirlos sin explicación.

Si cualquier pieza de esta pregunta carece de claridad o podría ser mejorado, por favor hágamelo saber.

2voto

Thomas Puntos 1

Puede utilizar la bisagra de la pérdida , que es un límite superior en la clasificación de la pérdida; es decir, se penaliza el modelo si la etiqueta de la puntuación más alta categoría es diferente de la etiqueta de la tierra-la verdad de la clase.

Para más detalles sobre la relación entre la clasificación de la pérdida y de la bisagra de la pérdida puede leer la Sección 2 de este impresionante papel de la C. N. J. Yu y T. Joachims.

En resumen, no es una tarea pérdida, generalmente denotado por $\Delta \left( y_i, \hat{y}(x_i) \right)$, que las medidas de la pena para la predicción de la salida $\hat{y}(x_i)$ entrada $x_i$ cuando la espera (tierra-la verdad de la salida de es $y_i$. La tarea de la pérdida de multi-clase de la clasificación general es definido como:$\Delta \left( y_i, \hat{y}(x_i) \right) = \mathbf{1}\{ y_i \neq \hat{y}(x_i) \}$. Sin embargo, mientras $\Delta$ sólo depende de las dos etiquetas de $y$$\hat{y}$, se puede definir como quieras. En particular, uno puede ver a $\Delta$ como arbitraria $K \times K$ matriz de donde $K$ es el número de categorías y de las $\Delta(a, b)$ indica que la pena de clasificación de una entrada de categoría $a$ como pertenecientes a la categoría de $b$.

Por ejemplo: $\\\text{datos}: \\ \{(x_1, y_1), (x_2, y_2), (x_3, y_3)\}, \quad x_i \in \mathbb{R}^d, \quad y_i \in \mathcal{Y}=\{c_1, c_2, c_3, c_4\} \\ \text{red predicciones}:\\ \hat{y}(x_1)=c_2, \quad \hat{y}(x_2)=c_1, \quad \hat{y}(x_3)=c_3 \\ \text{tarea de la pérdida de la matriz}:\\ \begin{bmatrix} \Delta(y_{1}, y_{1}) & \Delta(y_{1}, y_{2}) & \Delta(y_{1}, y_{3}) & \Delta(y_{1}, y_{4}) \\ \Delta(y_{2}, y_{1}) & \Delta(y_{2}, y_{2}) & \Delta(y_{2}, y_{3}) & \Delta(y_{2}, y_{4}) \\ \Delta(y_{3}, y_{1}) & \Delta(y_{3}, y_{2}) & \Delta(y_{3}, y_{3}) & \Delta(y_{3}, y_{4}) \\ \Delta(y_{4}, y_{1}) & \Delta(y_{4}, y_{2}) & \Delta(y_{4}, y_{3}) & \Delta(y_{4}, y_{4}) \end{bmatrix} = \begin{bmatrix} 0 & 1 & 2 & 3 \\ 1 & 0 & 1 & 2 \\ 2 & 1 & 0 & 1 \\ 3 & 2 & 1 & 0 \end{bmatrix} \\ \text{clasificación de la pérdida asumiendo $\quad y_1=c_4, \quad y_2=c_1, \quad y_3=c_4$:} \\ \Delta(y_1, \hat{y}(x_1)) = \Delta(c_4, c_2) = 2 \\ \Delta(y_2, \hat{y}(x_2)) = \Delta(c_1, c_1) = 0 \\ \Delta(y_3, \hat{y}(x_3)) = \Delta(c_4, c_3) = 1 \\ $

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X