4 votos

Juego de datos categóricos

Me disculpo si mi fraseo es no-educados, no tengo mucho de las estadísticas de fondo. Yo estoy luchando para encontrar información de responder a mi pregunta, porque me falta la terminología para describir con precisión.

Digamos que yo estaba revisando los datos sobre las ventas de reproductores mp3, y quería ver si ciertas combinaciones de datos categóricos resultó en rendimientos.

Cosas como el color, el tamaño de la memoria, de la marca. Yo simplemente no quieren ver la relación entre los resultados y el color rojo, sino que las combinaciones indican un probable retorno.

Por ejemplo, imagine que un determinado fabricante utiliza un tipo diferente de fábrica para producir cada color reproductor de mp3 y la fábrica que produce el color azul tiene un defecto que muestra hasta 3 meses más tarde, y es la causa de las devoluciones. Me gustaría ser capaz de ver una relación entre el color y la marca de los retornos en el ejemplo. ¿Que sentido?

Prueba de lo que podría aprovechar para esto? Mi punto de partida es un chi-cuadrado, excepto que yo no puedo ver la interacción entre las diferentes variables con que. No he sido capaz de averiguar a dónde ir desde allí.

8voto

anand Puntos 199

Yo recomiendo que primero obtener una buena visualización de los resultados, por lo que puede ser orientado. Con ese fin, creo que un mosaico de la trama es bastante eficaz. Usted toma un rectángulo y se divide en paneles en proporción a una variable. Luego subdividir cada panel en proporción a las frecuencias de una segunda variable dentro de la primera; y así sucesivamente. Aquí está un ejemplo con datos sobre la supervivencia en el Titanic por sexo, clase y edad. (En este diagrama, el verde es "sobrevivido" y azul, está "muerto".)

enter image description here

1voto

Nathan O'Sullivan Puntos 119

Los árboles de decisión son una buena clasificación y selección de la función de modelo de datos categóricos. Son muy fáciles de entender y proporcionar una buena vista de la relación de atributos como se puede ver en la imagen. Cada nodo proporciona una prueba en un atributo seleccionado, y los atributos pueden ser agregados. Creo que este es un buen punto de partida para usted.

Decision tree illustration from Data Mining Concepts and Techniques from Jiawei Han, Micheline Kamber and Jian Pei

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X