2 votos

¿Qué es exactamente una clase de fondo en un problema de clasificación?

He oído que la gente utiliza el término clase de fondo en los siguientes escenarios:

  1. Para una clase que tiene un número muy alto de instancias en comparación con otras clases en un problema de clasificación

  2. A veces basta con crear una clase como "otros" y añadir todos los casos para los que no se dispone de suficientes características para decidir discriminatoriamente la clase a la que pertenecen. Por ejemplo, en la sección 2 de este documento, https://www.robots.ox.ac.uk/~vgg/publicaciones/2015/Cimpoi15/cimpoi15.pdf (este documento trata de la construcción de características para realizar el reconocimiento de texturas/materiales en imágenes). A continuación he citado el texto concreto que habla de una clase de fondo:

En particular, nos basamos en el conjunto de datos de Open Surfaces (OS) que se recientemente introducido por Bell et al. [4] en la infografía. OS comprende 25.357 imágenes, cada una de las cuales contiene un número de segmentos de segmentos de textura/material de alta calidad. Muchos de estos segmentos están anotados con atributos adicionales como el nombre del material, el punto de vista, la BRDF y la clase de objeto. No todos los segmentos tienen un conjunto completo de anotaciones; los experimentos de este artículo se centran en los 58.928 que contienen nombres de materiales. Dado que las clases de materiales están muy desequilibradas sólo se consideran los materiales que contienen al menos 400 ejemplos. El resultado son 53.915 segmentos de material anotados en 10.422 imágenes que abarcan 23 clases diferentes. Las imágenes se dividen por igual en de entrenamiento, validación y prueba con 3.474 imágenes cada una. El tamaño de los segmentos Los tamaños de los segmentos son muy variables, y la mitad de ellos son relativamente pequeños, con un área inferior a 64 × 64 píxeles. Aunque la falta de anotaciones exhaustivas anotaciones hace imposible definir una clase de fondo completa, varios materiales menos comunes (incluyendo, por ejemplo, segmentos que los anotadores no pudieron asignar a un material) se fusionan en una clase "otros que actúa como pseudo-fondo.

¿Existen otros escenarios en los que se utilice este término? Además, ¿por qué se llama exactamente clase de fondo?

2 votos

¿Puede aportar algo más de contexto? Sinceramente, no recuerdo haber visto ese nombre en ningún sitio...

0 votos

@Tim, Por favor, encuentra una referencia y un texto citado en la referencia donde se añade el término de clase de fondo en la pregunta. Gracias.

0 votos

@Silverfish, Por favor, encuentre mi edición sobre edición en la pregunta con un ejemplo de un contexto en el que se utiliza el término "clase de fondo". Gracias.

6voto

Thinkcat Puntos 19

Parece que están clasificando tipos de material en los que el material en cuestión no necesariamente llena toda la imagen. La frase anterior del mismo documento

Los conjuntos de datos más recientes, como FMD y DTD eliminan esta limitación al basarse en imágenes descargadas de Internet, denominadas imágenes "in the wild". Sin embargo en estos conjuntos de datos la textura siempre llena el campo de visión de la cámara. En este artículo eliminamos esta limitación experimentando experimentando por primera vez con un gran conjunto de datos de texturas recogidas en la naturaleza y en condiciones de desorden.

Por lo tanto, mi opinión es que están hablando literalmente de una clase de materiales que están en el fondo de lo que quieren clasificar, que es un término común en el aprendizaje automático basado en imágenes, donde, por ejemplo, una imagen de un perro en una carretera requiere el aprendizaje de la clase objetivo, 'perro', pero también incluye una clase de fondo 'carretera'. Hay que tener en cuenta que una imagen puede incluir más de una clase de fondo, como "carretera", "coche" y "cielo" [1].

Continúan mencionando que

Textura se describe tradicionalmente mediante la agrupación sin orden de las respuestas del banco de filtros ya que, a diferencia de los objetos, la información general de la forma suele ser poco importante. Sin embargo, las texturas pequeñas y poco muestreadas pueden beneficiarse si se reconocen en el contexto de un objeto.

Por lo tanto, para ellos es importante reconocer el fondo o la clase de contexto, ya que algunos materiales aparecen con algunos objetos y posiblemente incluso en algunos fondos con más frecuencia que otros.

La clase de fondo también parece utilizarse como término para la clase mayoritaria, lo que contrasta con lo que se intenta clasificar. La terminología tiene sentido sobre todo para la clasificación binaria de conjuntos de datos variados, por ejemplo, encontrar imágenes de pájaros en imágenes mixtas de animales. En ese caso, se clasifica "pájaro" frente a "no pájaro" y tiene sentido considerar las imágenes de pájaros como la señal y todo lo demás como el ruido de fondo.

tl;dr: En el ejemplo citado parece que en realidad se está hablando del fondo literal y por lo demás la clase de fondo puede usarse como sinónimo de clase mayoritaria.

[1] Petra Perner: Machine Learning and Data Mining in Pattern Recognition, pg. 237

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X