3 votos

Interpretando un intervalo de confianza con un límite negativo

Estoy realizando una prueba t de muestras independientes en días hospitalizados para pacientes eventualmente fallecidos y pacientes eventualmente recuperados. El problema al que me enfrento es si debo descartar el límite negativo en el intervalo de confianza.

Resultado de la prueba t en código R:

> t.test(recovered$días.hospitalizados, fallecidos$días.hospitalizados, var.equal = T)

    Prueba t de dos muestras

datos:  recovered$días.hospitalizados y fallecidos$días.hospitalizados
t = 0.60695, df = 1998, valor p = 0.544
hipótesis alternativa: la diferencia real entre medias no es igual a 0
Intervalo de confianza del 95%:
 -0.7675133  1.4555133
estimaciones de la muestra:
media de x media de y 
   30.518    30.174

El intervalo de confianza que obtuve fue -0.76 y 1.46 como se ve arriba en la salida, lo que significa que los días hospitalizados para un paciente recuperado son -0.76 a 1.45 días más altos que para un paciente fallecido.

Sin embargo, parece imposible que un paciente recuperado se quede con días negativos. Soy nuevo en estadísticas, así que ten paciencia conmigo. ¿Es correcto afirmar que el paciente recuperado estuvo 0 a 1.46 días más que un paciente fallecido?

Por favor, aconseje y gracias por leer.

4voto

blembo Puntos 3

Puede que tengas que aclarar el problema, y tal vez no entienda las variables. Realizaste una prueba t comparando la media de pacientes recuperados con pacientes fallecidos, y fallaste al rechazar la hipótesis nula de que son diferentes. Básicamente encontraste que la diferencia media entre la estadía de pacientes que se recuperan y pacientes que fallecen está en cualquier lugar entre -0.76 días y 1.45 días. Lo que esto significa es que los pacientes recuperados parecen quedarse en el hospital aproximadamente la misma cantidad de tiempo que los pacientes fallecidos. Este resultado no está diciendo que la estadía media de los recuperados sea negativa, sino que la diferencia entre la estadía media de los recuperados y la estadía media de los fallecidos podría ser tanto negativa como positiva. En otras palabras, tus datos no pueden excluir cuál de las medias es realmente mayor: como puedes ver en la salida de R, las medias para ambos son básicamente $30$ días. Sería absolutamente incorrecto ignorar esa parte negativa y reportar de 0 a 1.45.

Tal vez ayude pensar en otro ejemplo. Supongamos que tomo una muestra de 100 adultos mayores de dos estados diferentes y les pregunto sus edades. Debido a que la educación es aproximadamente la misma en ambos estados, los adultos mayores en ambos estados tienen edades similares. Debido al ruido de muestreo aleatorio, digamos que encuentro que el adulto mayor promedio tiene 17.5 años en el estado 1 y 17.7 años en el estado 2. Una prueba t comparando las diferencias seguramente me daría una región de confianza que incluye valores negativos, porque es la región de confianza sobre la diferencia de medias.

0 votos

Está bien, entendiste mi pregunta. Edité mi problema, gracias por la advertencia. ¿Se podría decir que el paciente recuperado permaneció 0.76 días menos pero 1.46 días más que los pacientes fallecidos entonces? Considerar también el límite negativo.

0 votos

@cswannabe, sí, algo así como "el intervalo de confianza del .95 revela que los pacientes recuperados, en promedio, permanecen entre .76 días menos y 1.46 días más que los pacientes fallecidos. Por otro lado, si estás familiarizado con los valores p, hay una relación clásica entre los dos que puedes buscar en Google. El hecho de que 0 esté dentro del intervalo de confianza del 95 es análogo a rechazar la hipótesis nula de que las dos medias son diferentes al nivel del .05".

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X