11 votos

"minería dura", "ejemplos duros", ... - ¿Significa "difícil" algo específico en estadística cuando no se aplica a la dificultad de un problema?

El documento de la conferencia Jean Ogier Du Terrail, Frédéric Jurie. ON THE USE OF DEEP NEURAL NETWORKS FOR THE DETECTION OF SMALL VEHICLES IN ORTHO-IMAGES. Conferencia internacional del IEEE sobre procesamiento de imágenes, Sep 2017, Beijing, China. ( PDF ) utiliza los términos "minería dura" (6×), "minería dura" (2×), "ejemplos duros" (3×), "duro ejemplo minero" (1×), "duro negativo" (2×), "muestras duro-negativas" (1×) y "estrategias de minería duro-negativa" (1×).

No tengo ni idea de lo que significa el especificador "duro" en este contexto. Como se menciona junto con bootstrapping, sospecho que podría tratarse de un término estadístico y no de SIG o IA/IR/aprendizaje automático/detección visual de objetos o redes neuronales artificiales (convolucionales profundas). (Por supuesto, podría ser un término específico de la teledetección).

[...]

2.3. Estrategias de Hard-Mining

El Bootstrapping ofrece un lo en la elección de los ejemplos difíciles. Por ejemplo, se podría elegir un número limitado de falsos positivos por imagen o fijar un umbral un umbral y elegir un falso positivo sólo si su puntuación es superior a un umbral fijo (0,5, por ejemplo). [...]

¿Significa "duro" (en general, o dentro de los términos enumerados anteriormente) algo específico en estadística y, en caso afirmativo, qué? Por el contexto, supongo que no se refiere a la dificultad del problema.

Me imaginé que podría estar relacionado "pruebas contundentes", pero eso no me ayudó a determinar lo que podría significar aquí.

11voto

Rafael Puntos 9065

@Sycorax tiene razón. "Ejemplos difíciles" se refiere a los ejemplos del conjunto de entrenamiento que están siendo mal etiquetados por la versión actual del clasificador. A menudo sólo se utiliza para la clase de fondo, que es un conjunto demasiado grande para que cualquiera pueda extraerlo sin algún tipo de estrategia (la clasificación binaria en conjuntos desequilibrados es difícil).

Este término fue acuñado probablemente por Girshick (¿creo?) en el artículo seminal DPM y ahora se utiliza ampliamente en la comunidad de detección de objetos, por ejemplo en OHEM donde las ventanas negativas utilizadas en cada paso del entrenamiento se eligen en función de su puntuación actual.

Este último artículo es un ejemplo de En línea minería de ejemplos duros (de ahí el título) mientras que el artículo del ICIP explora diferentes Fuera de línea ejemplos duros estrategias mineras.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X