2 votos

¿Qué enfoque de minería de datos/aprendizaje automático utilizar para un modelo de puntuación?

Supongamos que tengo un gran conjunto de datos con muchas características (atributos). Y tengo la tarea de construir algún tipo de modelo de puntuación para clasificar ciertos objetos con todas estas características. ¿Cómo puedo hacerlo?

Por lo que he entendido hasta ahora, me gusta pensar en esto como un problema de aprendizaje supervisado. Pero el problema es que NO hay clases etiquetadas (o al menos no es aparente). ¿Cómo puedo ordenar estos objetos? Lo más parecido que se me ocurre son las puntuaciones de crédito, pero en los modelos de puntuación de crédito, uno supuestamente tiene clases etiquetadas en cuanto a quién históricamente fue bueno y malo.

¿Debo inventar/crear alguna métrica basada en la lista de atributos y utilizarlos como casos etiquetados? Por ejemplo, si el atributo $_1 > x$ y el atributo $_2< y$ etc., entonces se considera "bueno"

Creo que quieren una clasificación numérica (es decir, que todos los objetos tengan puntuaciones numéricas asignadas a los objetos como las puntuaciones de crédito). Si ese es el caso, ¿necesito siquiera el aprendizaje automático/la minería de datos? ¿No puedo simplemente clasificar por estos atributos una vez que estén de acuerdo con el significado de la ordenación?

2voto

RSXAdmin Puntos 92

Si no tienes ni etiquetas ni ejemplos de clasificación, no sé qué podrías hacer con tus datos aparte de agruparlos en función de la similitud. La función de clasificación que se supone que debes aprender puede ser las preferencias de un usuario (por ejemplo, cuando escribo "aprendizaje" en un motor de búsqueda prefiero los resultados de "aprendizaje automático" en lugar de "aprendizaje electrónico"), una puntuación de riesgo para un banco (es decir, no estarías modelando las preferencias de los clientes, sino las del banco), etc. Es decir, el conjunto de clasificaciones posibles es $N!$ y no existe un sistema universal de buena uno.

En la clasificación, suele haber algunos ejemplos de objetos ordenados. La tarea consiste en aprender una función de clasificación que pueda ser:

  • por puntos: se aprende a puntuar cada elemento en función de sus atributos. La puntuación se utiliza para la clasificación final.

  • por parejas: se aprende a clasificar por parejas. Tienes ejemplos como $A \succ B$ y entonces su función aprende a tomar decisiones por parejas. Dado que si se juntan todos los pares, es probable que se produzcan incoherencias (p. ej. $A \succ B, B \succ C, C \succ A$ ), su tarea consiste en crear una clasificación final máxima coherente a partir de estos pares.

  • por lista: se trata de aprender una función de clasificación cuya salida será una lista final.

Las más comunes son la clasificación por puntos y por pares, ya que es más fácil clasificar localmente que todos los elementos a la vez (en forma de lista).

El indicador de todo esto es "Aprender a clasificar" (Information Retrieval) o "Aprendizaje de preferencias".

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X