1 votos

¿El AUC por tiempo no es más que la media?

El uso de AUC está de moda y ha encontrado su lugar también en la investigación clínica ( ejemplo ). Lo que no entiendo es AUC por tiempo . Por ejemplo, si se mide un parámetro clínico o psicológico a lo largo del tiempo. Mi suposición es:
El AUC por tiempo utilizando la regla del trapecio no es otra cosa que la media de las mediciones.

Si este es el caso, ¿por qué no usar la media?

0 votos

¿Están todas las mediciones igualmente separadas en el tiempo?

0 votos

No. Este no es el caso. Pero el uso de la regla del trapecio no debería afectar a mi hipótesis (conexión lineal entre 2 puntos).

3voto

Matt Puntos 918

Supongamos que las mediciones son $y_1, \dots, y_{n+1}$ tomada a veces $a = t_1 < t_2 < \cdots < t_n < t_{n+1}= b$ .

Entonces el área bajo la curva (AUC) utilizando la regla trapezoidal viene dada por $$ \text{AUC} = \frac12 \sum_{i=1}^{n} (t_{i+1}-t_i) (y_{i+1} + y_i). $$

En primer lugar, supongamos que los intervalos son iguales. Entonces, para cada $i$ tendríamos $$ t_{i+1} - t_i = \frac {b-a} {n}. $$ Esto se debe a que, aunque tengamos $n+1$ puntos, sólo hay $n$ intervalos.

Entonces, cuando normalizamos el AUC por $b-a$ Tendríamos $$ \frac{\text{AUC}}{b-a} = \frac12 \sum_{i=1}^{n} \frac{1}{n} (y_{i+1} + y_i) =\frac{1}{2n}y_1 + \frac{1}{n}\sum_{i=2}^{n}y_i + \frac{1}{2n}y_{n+1}. $$ Así que, intuitivamente, aunque parezca que si los intervalos estuvieran igualmente espaciados, entonces veríamos algo parecido a la media, en realidad estamos un poco equivocados. Podría ser igual a la media --- por ejemplo, considere el caso en el que todos los $y_i$ son iguales a 0.

Si miramos más de cerca, vemos que $$ \begin{align} \text{AUC} & = \frac12\sum_{i=1}^n (t_{i+1}-t_i) y_{i+1} + \frac12 \sum_{i=1}^n (t_{i+1}-t_i)y_i \\ &=\frac12 (t_2-t_1)y_1 + \frac12 (t_{n+1}-t_n)y_{n+1} + \frac12\sum_{i=2}^{n} (t_{i+1}-t_{i-1}) y_{i}. \end{align} $$

Normalización por $b-a$ de nuevo, obtenemos $$ \begin{align} \frac{\text{AUC}}{b-a} & = &=\frac{(t_2-t_1)}{2(b-a)}y_1 + \frac{(t_{n+1}-t_n)}{2(b-a)}y_{n+1} + \frac12\sum_{i=2}^{n} \frac{(t_{i+1}-t_{i-1})}{(b-a)} y_{i}. \end{align} $$

El AUC por tiempo utilizando la regla del trapecio no es otra cosa que la media de las mediciones.

No necesariamente, creo. De nuevo, es posible que sea igual a la media, pero no tiene por qué ser así.

Intuitivamente, se puede ver que los puntos de datos que se toman en medio de grandes intervalos de tiempo se ponderan más que otros puntos. Los puntos que están más próximos en el tiempo reciben menos peso.

0 votos

Una puntualización: supongo que en el segundo signo sumario de la tercera fórmula debería estar n y no n-1 ( $\sum_{i=2}^ny_i$ ).

1 votos

¡Estupendo! Muchas gracias por esta explicación tan detallada. Ahora, también intuitivamente puedo entenderlo gracias a la última fórmula. Por ejemplo, si hay 4 valores $y_1$ , .. $y_4$ donde $y_1$ y $y_2$ están muy cerca de $a$ y $y_3$ y $y_4$ están muy cerca de $b$ y $b$ muy alejado de $a$ el resultado es aproximadamente $\frac{1}{3}(y_2+y_3)$ . Suponiendo $y_1\gt\gt y_2$ y $y_4\gt\gt y_3$ los valores grandes no afectan a la AUC por tiempo mientras que la media sería bei impulsado los valores de frontera. Le agradezco mucho su ayuda.

0 votos

@giordano Bien visto lo del límite de suma ¡ya lo he arreglado! Otro ejemplo es al observar curvas de concentración medidas en puntos de tiempo logarítmicamente espaciados, donde los valores de cola más bajos y ruidosos empiezan a tener más peso.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X