2 votos

Problemas con la tricotomización y dicotomización de variables

Veo que el tema de dividir una variable en dos categorías ha sido discutido en este foro y entiendo los pros, contras, así como algunas formas de hacerlo. El tema que me interesa y no puedo encontrar información es sobre cómo dividir una variable en tres puntos.

Para que tenga sentido, déjenme explicar brevemente mis datos. He utilizado una escala psicográfica (Likert de 5 puntos) que consta de ocho elementos donde puntajes bajos indican un rasgo y puntajes altos indican otro. Teóricamente, la mayoría de las personas deberían caer en el grupo medio, con grupos extremos mucho más pequeños que muestran tendencias claras de cierto comportamiento. Por lo tanto, utilicé esta escala con la intención de agrupar a mis encuestados en grupos bajos, medios y altos. Esta clasificación en tres grupos está respaldada conceptualmente por investigaciones previas, pero ningún estudio revela cómo se dividen los grupos.

Intenté usar un puntaje compuesto para la escala y correlacionarlo, por ejemplo, con una variable dependiente. Sin embargo, debido a que los grupos extremos son relativamente pequeños, el resultado para toda la muestra indica una asociación en la dirección esperada, aunque muy baja. He considerado la dicotomización pero los individuos con puntajes altos o bajos en los ocho elementos se mezclan con los puntajes medios que conceptualmente no indican ningún grupo distintivo.

Después de analizar la representación gráfica de la escala, puedo concluir que la distribución es normal y, de hecho, la mayoría de las personas obtienen puntajes en el medio. Por lo tanto, visualmente puedo identificar los puntos de corte que parecen tener sentido, produce tamaños de grupo respaldados teóricamente y cualquier prueba adicional muestra diferencias significativas entre grupos en variables dependientes de interés. Sin embargo, entiendo que cortar los datos de esta manera es muy arbitrario. ¿Hay alguna forma en la que pueda justificar realmente hacer esto basándome en el apoyo conceptual a los grupos? ¿Alguna otra sugerencia que alguien pueda hacer ya que se me han acabado las ideas? Cualquier ayuda será muy apreciada.

Muchas gracias de antemano.

1voto

gauss Puntos 110

Por tu descripción, parece que tienes 8 respuestas observadas, cada una con 5 posibles valores. Hasta ahora, tu enfoque parece ser sumar el número total de puntos (0-40) y luego tratar esto como una variable continua. Entonces, tu pregunta es cómo categorizar mejor esta variable.

Otra opción es tomar un enfoque de clases latentes (sinónimos o modelos relacionados que podrías encontrar son "model based clustering", "finite mixture modelling", "Gaussian mixture modelling", y "latent profile modelling" - las diferencias generalmente se deben a la naturaleza de las variables utilizadas, pero el concepto subyacente es el mismo para todas estas).

La idea básica es suponer que tu muestra incluye un conjunto de grupos no observados (latentes), y que condicionalmente en pertenecer a un grupo específico, tus elementos de respuesta observados son independientes (no correlacionados). Este enfoque es impulsado por los datos, ya que solo especificas el número de grupos, y luego el modelo te dará una idea de quién va en qué grupo, según sus respuestas observadas. En la práctica, es probable que pruebes varios modelos diferentes, cada uno especificando un número diferente de grupos (por ejemplo, 1, 2, 3, 4, 5) y seleccionar el "mejor modelo", generalmente basado en alguna combinación de teoría/interpretación y ajuste del modelo. La pertenencia al grupo luego puede estar relacionada con tu variable dependiente, asumiendo que tu modelo hace un buen trabajo colocando a las personas en grupos.

Existe una introducción realmente amigable a esto en un libro pequeño y económico de Allan McCutcheon (http://books.google.co.uk/books/about/Latent\_Class\_Analysis.html?id=dCbJ6NcH4mAC). De lo contrario, busca los términos que mencioné anteriormente. Rápidamente encontrarás ejemplos utilizando datos de respuesta Likert.

0voto

Zizzencs Puntos 1358

Si tus datos están realmente distribuidos normalmente (o lo más cerca posible, dado un recuento de 0-40) entonces en realidad no se dividen en 3 grupos basados en los datos en sí mismos. Sin embargo, dado que dices que puedes reconocer visualmente tres grupos, es poco probable que sea realmente normal.

De todas formas, considerando eso, creo que puedes decir que dividiste los datos en tres grupos basados en la teoría y en la inspección visual de los datos; luego puedes mostrar los datos (un gráfico de densidad con un suavizante de núcleo podría ser bueno; o un gráfico de dispersión) y explicar cómo lo hicieron.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X