2 votos

Tratando con la certeza variable en datos categóricos

Tengo una pregunta sobre análisis estadísticos para variables categóricas. Sin complicarlo, me gustaría saber cómo se puede manejar datos categóricos inciertos. Es decir, datos categóricos que tienen niveles de confianza asociados que van del 1 al 99%. Aquí tienes una captura de pantalla de la hoja de cálculo en la que se han introducido los datos.

introduce aquí la descripción de la imagen

¿Existen análisis estadísticos que puedan manejar esto?

Gracias de antemano,

0voto

Erin Drummond Puntos 154

Supongo que estás considerando las características en el marco del aprendizaje supervisado.

Puedes crear para cada característica algunas características derivadas basadas en el nivel de confianza. Después, usa selección de características para elegir las que más te sirvan.

La forma más directa de derivar características basadas en la confianza es establecer algunos niveles de confianza (por ejemplo, por encima del 90%, por encima del 80%, ...). Si el nivel de confianza en un registro es lo suficientemente alto, úsalo. De lo contrario, usa nulo.

Formas más avanzadas son agrupar de acuerdo con la distribución de confianza de cada característica (donde puedes usar igualdad de grupos, igualdad de profundidad de grupos) o discretización con respecto al concepto (por ejemplo, pérdida mínima de información mutua).

Si eliges diez umbrales, entonces el número inicial de características será diez veces mayor. Bastante alto pero aún aceptable.

Después de tener el conjunto de características, necesitarás una función de evaluación para la selección de características. Supongo que cuanto mayor sea la confianza que tengas, menor será el ruido que tendrás. En un punto dado, podrías perder demasiado la señal. En este punto, evalúalas contra el concepto y ve cómo avanzar más.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X