10 votos

Escala variable como el conde de datos correcta o no?

En este documento (disponible gratuitamente a través de PubMed central), los autores utilizan la regresión binomial negativa para el modelo de la puntuación en un 10-elemento de detección del instrumento anotó 0-40. Este procedimiento asume que los datos de recuento, que claramente no es el caso aquí. Me gustaría conocer su opinión acerca de si este enfoque es aceptable, porque yo a veces uso el mismo instrumento o de otras similares en mi trabajo. Si no, me gustaría saber si hay alternativas aceptables. Más detalles a continuación:

La escala utilizada es el Uso de Alcohol Trastornos de la Prueba de Identificación (AUDITORÍA), 10-ítem cuestionario diseñado como un instrumento de detección de trastorno de uso de alcohol y peligrosos/consumo nocivo de alcohol. El instrumento se puntúa de 0 a 40, y los resultados son normalmente más fuertemente a la izquierda sesgada.

A mi entender, el uso de los datos de recuento, se supone que todos los valores "contado" son independientes los unos de los otros pacientes que vienen a una sala de emergencias cada día, el número de muertes en un grupo determinado, etc, son todos independientes entre sí, aunque depende de variables subyacentes. Además, creo que no puede haber un máximo permitido de la cuenta cuando el uso de datos de conteo, aunque creo que esta suposición puede ser relajado cuando el máximo teórico es muy alta en comparación con el máximo observado en los datos?

Cuando se utiliza la AUDITORÍA de la escala, no tenemos una cuenta verdadera. Tenemos 10 elementos con un máximo puntaje total de 40, a pesar de que los puntajes altos se ven raramente en la práctica. Las puntuaciones en los ítems son naturalmente correlacionados unos con otros.

Los supuestos necesarios para el uso de los datos de recuento son violadas. Pero es un enfoque aceptable? Cómo es la gravedad de las violaciones de los supuestos? Hay ciertas circunstancias bajo las cuales este enfoque puede ser considerado aceptable? ¿Hay alguna alternativa a este enfoque, que no implica la reducción de la escala de la variable de categorías?

4voto

EdM Puntos 5716

La AUDITORÍA instrumento es esencialmente una escala de Likert. Un conjunto de preguntas (tipo Likert de elementos), con las respuestas a menudo en una escala de cinco puntos, está diseñado para llegar a algún fenómeno subyacente. La suma de las respuestas a las preguntas, la escala de Likert, se utiliza como medida de la base del fenómeno. Aunque Likert elementos son a menudo en una escala de "muy en desacuerdo" a "totalmente de acuerdo", la aplicación para medir una tendencia hacia "Unlcohol Utiliza Disorders" en este "yoidentificación Test" es sencillo.

Como se señaló en la escala de Likert página de la Wikipedia, "Si los Likert de elementos puede ser considerada como el intervalo de nivel de datos, o si deben ser tratados como ordenó-datos categóricos es el objeto de un considerable desacuerdo en la literatura, con fuertes convicciones sobre lo que son la mayoría de los métodos aplicables." Esta diferencia probablemente se remonta a través de más de 80 años desde Likert propuso por primera vez la escala: es cada paso a lo largo de la escala equivalente, dentro y entre los elementos que componen la escala? El tema ha sido abordado en la Cruz Validado, como en las respuestas a esta pregunta, una de las primeras preguntas en este sitio.

Si se acepta la idea de que la escala tiene los pasos que son uniformes (o lo suficientemente cerca como para uniformes para la aplicación a la mano, tal vez promediadas por la adición de 10 elementos diferentes, como en la AUDITORÍA), luego de varios enfoques para el análisis son posibles. Uno de ellos es considerar la respuesta en la escala de medida de una serie de pasos elegidos o no elegidos para ascender en la escala, con la misma probabilidad de movimiento de cada uno de los pasos.

Esto le permite a uno a pensar "n-punto de escala de Likert de datos como los n ensayos de un binomio proceso," como en 2010, a la pregunta de @MikeLawrence. Aunque las respuestas a esa pregunta no fueron terriblemente apoyo a esa idea, no fue difícil encontrar rápidamente el día de hoy un 2014 estudio que utiliza y ampliado este enfoque con éxito para distinguir sub-poblaciones con diferentes binomio probablilities. Aunque un binomio proceso a menudo se utiliza para modelar los datos de recuento, por lo tanto puede ser utilizado para modelar el número, el recuento de pasos que una persona que tuvo a lo largo de la escala de los "Trastornos por consumo de Alcohol."

Como @Scortchi señaló en una respuesta a la cuestión vinculada en el segundo párrafo, a una limitación del modelo binomial es que se impone una particular relación entre la media y la varianza de la respuesta. La binomial negativa se elimina esa restricción, con la pérdida de la facilidad en la interpretación proporcionada por el simple modelo binomial. En el análisis, el parámetro extra que necesita para estar en forma, se utiliza sólo un grado adicional de libertad. En contraste, tratando de especificar diferentes probabilidades para cada uno de los 40 Likert elemento pasos y su suma en la escala de Likert, sería de enormes proporciones.

Como @MatthewGraves señaló en su respuesta a esta pregunta, si el modelo binomial negativo es adecuado es la mejor contestada mediante el examen de los residuos. En el estudio original que se desarrolló la AUDITORÍA, un valor de 8 o más en los 40 puntos de la escala tenido bastante razonable especificidad y sensibilidad para distinguir aquellos diagnosticados de "peligrosos o nocivos por el uso de alcohol," a través de 6 diferentes países. Así que quizás una de dos-población binomial modelo basado en de alto riesgo y de bajo riesgo en la población, similar a la de 2014 estudio enlazado más arriba, sería mejor.

Aquellos interesados en la AUDITORÍA específicamente debe examinar que el estudio original. Por ejemplo, aunque la necesidad de una mañana beba podría parecer a medir algo completamente diferente de la frecuencia de consumo, como @SeanEaster supuso, mañana potable tiene una media ponderada de correlación de 0,73 con una escala de medidas de consumo de alcohol. (Que el resultado no es sorprendente para alguien que ha tenido amigos con trastornos de uso de alcohol.) AUDITORÍA parece ser un buen ejemplo de los cambios que se necesitan para desarrollar un instrumento que puede ser utilizado de forma fiable a través de múltiples culturas.

2voto

David Ramirez Puntos 99

La distribución binomial negativa es el preferido para "contagiosa" eventos discretos. Una distribución de Poisson se utiliza cuando el discreto eventos son independientes. Estas distribuciones son también bastante fácil para truncar, mediante la sustitución de la $x=40$ punto con un $x\ge 40$ punto, básicamente.

Como comentario general, los diferentes sabores de regresión tienen diferentes prioridades para los parámetros (es decir, de regularización) y diferentes modelos de ruido. Estándar de mínimos cuadrados de la regresión tiene un ruido Gaussiano modelo de regresión binomial negativa tiene una binomial negativa modelo de ruido, y así sucesivamente. La verdadera prueba de si o no un modelo de regresión es la adecuada es la de si o no el ruido residual tiene la distribución esperada.

Así que usted puede aplicar binomial negativa de regresión a los datos, calcular los residuos, y luego representar en un diagrama de probabilidad binomial negativa, y obtener un sentido de si es o no el modelo es adecuado. Si el ruido está estructurado en alguna otra manera, entonces tenemos que buscar un modelo de ruido que se ajusta a esa estructura de más de cerca.

El razonamiento del modelo generativo para el ruido estructura es útil-si sabemos que los datos son multiplicativas, en lugar de aditivo, por ejemplo, para lograr que la lognormal en lugar de la normal, pero en caso de que el modelo generativo y el ruido de la estructura de acuerdo, vamos con los datos, no a la expectativa.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X