Loading [MathJax]/jax/element/mml/optable/Latin1Supplement.js

6 votos

Visualización de datos - Resumen 190 medios y las tasas de respuesta

Tengo un conjunto de datos muy grande que me gustaría resumir en el menor espacio posible, a un lado de A4.

Los datos son de una encuesta de satisfacción del cliente y son de tipo Likert de escalas, 5 escalas para cada área de trabajo, con 190 áreas de trabajo en total. También me gustaría representar la tasa de respuesta en la visualización de alguna manera, debido a que las tasas de respuesta son muy variables y quiero gestión de mirar estas así como de las puntuaciones.

Si es necesario no me importa de alguna manera la reducción de las 5 escalas de hasta una (utilizando el análisis de factores o algo parecido). Uno o dos lados de A4 para ir a el equipo de gestión que son, por supuesto, muy ocupado con un montón de otras cosas, y definitivamente no técnicos. El uso del color no es ningún problema, de hecho, probablemente sería visto como una bendición.

Se me acaba de ocurrir que representa el orden de las áreas de trabajo, en lugar de su valor absoluto, estaría bien, pero de nuevo no quiero perder la tasa de respuesta de la información.

Espero que esta pregunta no es demasiado vaga, todas las ideas recibidas con gratitud. Estoy usando R y anticipar que este trabajo tendrá que ver con mi aprendizaje ggplot2, que tengo aún no tiene a su alrededor.

6voto

Jon Galloway Puntos 28243

Encontrar un mapa de calor que una de las formas más efectivas de resumir grandes cantidades de datos multidimensionales en un espacio confinado. El blog de LearnR tiene un buen ejemplo de crear uno en ggplot2.

3voto

Eggs McLaren Puntos 945

Para darle un par de cosas más a tener en cuenta:

  • Componentes principales - mira algunas respuestas anteriores sobre PC. En particular, esta respuesta puede ser útil.
  • El análisis de Cluster. Esta página da bastante bueno en general en R.

Yo recomendaría tratando de tantas cosas como sea posible y a ver qué sale. Una vez que tiene los datos en R en un formato, no se debe tomar demasiado tiempo para probar estas cosas.

2voto

Judioo Puntos 625

Yo sugeriría que usted echa un vistazo a cualquiera de caja-parcelas (si usted tiene un texto de introducción a R, diagramas de caja siempre parecen ser una de las primeras parcelas que uso), o puede trazar los medios de cada grupo en el eje Y y el X-eje para representar a cada uno de sus 190 áreas de trabajo (y tal vez poner las barras de error representan un intervalo de confianza para la estimación de la media).

Usted puede trazar cada una de las escalas likert de uno junto a otro, y utilizar un color diferente para representar a los medios, y mientras usted elige colores distintos y el mismo orden para las escalas likert a través de las áreas de trabajo de la gente será capaz de distinguirlos.

Pero yo, personalmente, sería única parcela en la balanza junto a la otra si se espera que tengan algún tipo de relación con el otro (si la escala es alta que se podría esperar de la escala B para darse de baja). Si no, usted podría panel de las gráficas en la parte superior de uno al otro (retirar la rejilla paquete en R, y aquí es lo que yo creo que es un buen ejemplo, con ejemplos de código R), y lo que sólo se necesita una etiqueta del eje X (esto también permite el uso de diferentes eje escalas si las escalas no son fáciles de trazar en todos el mismo Y niveles, aunque por la descripción que este no parece ser el caso). Usted también podría incluir la tasa de respuesta como uno de los paneles (tal vez representa como una barra).

Lo que es difícil con 190 diferentes grupos es que usted va a tener problemas para distinguir los diferentes grupos de trabajo a menos que se resalta grupos específicos, pero en cualquier cuadro con todos los grupos será excelente para examinar las tendencias generales (y tal vez irregular outliers). También si tus grupos de trabajo no tienen ningún orden lógico o de orden superior agrupaciones de la orientación en el eje será arbitrario. Usted puede ordenar de acuerdo a los valores en una de las escalas (o de acuerdo a la tasa de respuesta).

También personalmente, estoy aprendiendo R en el momento, y yo le sugiero que compruebe el Uso de la R! la serie por Springer. El libro Una Guía para Principiantes a R es uno de los mejores intro de los textos que he encontrado, y tienen libros en ggplot2 y el enrejado de los paquetes que podrían ayudarle.

Como un fin en si publicar algunos ejemplos de las parcelas y el código para hacer de ellos un poco más de la R savy multitud en el foro probable que sea capaz de darle sugerencias. Cuando usted termine de volver y de publicar sus resultados! HTH y buena suerte.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X