A menudo, en el aprendizaje automático nos encontramos en una situación en la que el objetivo es numérico (real o entero). Cada objetivo tiene asociado un vector de entrada. El objetivo es aprender la correspondencia entre los vectores de entrada y el objetivo. Por ejemplo:
(1.2, 'A', 3) -> 4.0
(3.2, 'C', 2) -> 1.0
...
(0.8, 'A', 2) -> 5.0
(5.7, 'B', 7) -> 1.0
Sin embargo, en algunos casos no conocemos el objetivo. Sólo sabemos que es mayor o menor que un determinado valor. Por ejemplo:
(1.2, 'A', 3) -> >3.0
(3.2, 'C', 2) -> =1.0
...
(0.8, 'A', 2) -> >3.0
(5.7, 'B', 7) -> =1.0
En el ejemplo anterior, sabemos que para el primer vector el objetivo es mayor que 3,0, pero no sabemos cuál es exactamente.
¿Cómo debe considerarse la situación descrita? ¿Existen métodos estándar para hacerlo?
0 votos
¿Has pensado en codificar cierto valor con una salida, y signo(mayor, menor, igual) con otra salida? Por ejemplo, ">3" -> (3, 0), "=3" -> (3, 1), "<3" -> (3, 2)
0 votos
@frankov, al final me gustaría tener un estimador que me diera un número (media) o densidad de probabilidad pero no los rangos (como en input para el entrenamiento).
0 votos
¿Tiene algunos 3 "fuertes" y otros "débiles", o son todos débiles? ¿Varían los rangos?
0 votos
@ssdecontrol, yo tengo 3 tanto "fuerte" como "débil". También tengo otros números que pueden ser fuertes o débiles. Por ejemplo tengo los siguientes:
[=1, >3, =7, >2, >1, =7, =8, >4]
. Esto significa que en algunos casos conocemos el objetivo exacto, mientras que en otros sólo conocemos el "límite inferior".0 votos
¿Y la predicción? ¿La salida de la predicción es de nuevo un rango objetivo o un valor objetivo específico (clásico)?
0 votos
@xeon, la predicción debe ser un valor objetivo concreto (o una distribución de probabilidades sobre valores posibles).
0 votos
Esta pregunta parece referirse a censura .
0 votos
Deberías hacer una búsqueda aquí de "regresión por intervalos".