11 votos

¿Cómo tratar los datos de recuento (datos categóricos) cuando se han convertido en un índice?

Estoy trabajando con datos de infección de enfermedades y no sé si tratar los datos como "categóricos" o "continuos".

  • "Recuento de infecciones"
    • el número de casos de infección detectados en un periodo de tiempo determinado, el recuento se genera a partir de datos categóricos (es decir, nº de pacientes etiquetados como "infectados")
  • "Días cama paciente"

    • suma del número total de días de estancia en la sala de todos los pacientes de esa sala, de nuevo, el recuento se genera a partir de datos categóricos (es decir, nº de pacientes etiquetados como "estancia en esa sala en particular").
  • "infección por paciente y días cama"

    • "recuento de infecciones" / "días cama paciente" ambos eran originalmente datos de recuento, pero ahora se convierten en una tasa

Pregunta:

  • ¿Puedo utilizar Chi-cuadrado aquí para evaluar si la diferencia en "infecciones por días cama paciente" es estadísticamente significativa o no?

Actualizaciones

He descubierto que puedo comparar la tasa de incidencia (o llamarla tasa de infección), pero haciendo algo como "diferencia de tasa de incidencia" (IRD) o "ratio de tasa de incidencia" (IRR). (Lo he encontrado en aquí )

  • ¿Cuál es la diferencia entre el IRD y la prueba t?
  • ¿Existe alguna prueba estadística complementaria para la TIR?

7voto

Noam Gal Puntos 155

No estoy muy seguro de cómo son tus datos ni de cuál es tu problema concreto, pero supongo que tienes una tabla con los siguientes encabezamientos y tipo:

pabellón (categórico), infecciones (entero), días-cama-paciente (entero o continuo).

¿y quiere saber si la tasa de infección es estadísticamente diferente en los distintos pabellones?

Una forma de hacerlo es utilizar un modelo de Poisson:

Infecciones ~ Poisson (días cama paciente * tasa de infección sala)

Esto puede lograrse utilizando un glm de Poisson, con función de enlace log y el log de días-cama-paciente en el offset. En R, el código sería algo así:

glm(infections ~ ward + offset(log(patient-bed-days)), family=poisson())

7voto

Zizzencs Puntos 1358

Las pruebas chi-cuadrado no parecen apropiadas. Como han dicho otros, siempre que haya un número razonable de índices diferentes, se podrían tratar los datos como continuos y hacer una regresión o un ANOVA. A continuación, habría que examinar la distribución de los residuos.

6voto

Anthony Cramp Puntos 126

A mí no me parece en absoluto apropiado utilizar aquí una prueba chi-cuadrado.

Supongo que lo que quieres hacer es lo siguiente: Tienes diferentes pabellones o tratamientos o cualquier otro tipo de variable nominal (es decir, grupos) que divide tus datos. Para cada uno de estos grupos recoges los Recuento de infecciones y el Días cama paciente para calcular el infecciones por paciente y día cama . Sabes que quieres comprobar las diferencias entre los grupos, ¿verdad?

Si es así, un análisis de varianza (ANOVA, en caso de más de dos grupos) o una prueba t (en caso de dos grupos) es probablemente apropiado dadas las razones del post de Srikant Vadali (y si también se cumplen los supuestos homogeneidad de varianzas y tamaños de grupos comparables) y el beginner debe añadirse.

4voto

Yochai Timmer Puntos 116

Si está considerando realizar regresiones de Poisson o similares sobre estos datos (con su variable de resultado como tasa), recuerde incluir un término de compensación para los días cama del paciente, ya que técnicamente se convierte en la "exposición" a sus recuentos.

Sin embargo, en ese caso, también puede considerar utilizar sólo el recuento de infecciones (no la tasa) como variable dependiente e incluir los días cama del paciente como covariable. Estoy trabajando en un conjunto de datos con una decisión similar de recuento frente a tasa y parece que convertir la variable dependiente en una tasa conduce a una disminución de la variabilidad, un aumento de la asimetría y una desviación estándar proporcionalmente mayor. Esto hace que sea más difícil detectar efectos significativos.

Observe también si sus datos están truncados por cero o inflados por cero, y realice los ajustes oportunos.

1voto

Desde un punto de vista técnico purista, no puede, ya que su ratio "infección por días cama paciente" no es una variable continua. Por ejemplo, un valor irracional nunca aparecerá en su conjunto de datos. Sin embargo, puede ignorar esta cuestión técnica y realizar las pruebas que sean apropiadas para su contexto. A modo de analogía, los niveles de ingresos son discretos, pero casi todo el mundo los trata como continuos.

Por cierto, no está del todo claro por qué quieres hacer un chi-cuadrado, pero supongo que hay algún contexto de fondo por el que tiene sentido para ti.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X