18 votos

La velocidad en m/s está distribuida normalmente, pero el mismo dato expresado como "Tiempo para 10 metros" no lo está

Intento comprender por qué los mismos datos pueden tener una distribución normal si se expresan de una forma, pero no tenerla si se expresan de otra.

Tengo una variable que es "tiempo que se tarda en caminar 10 metros" (en segundos). Estos datos no se distribuyen normalmente (Shapiro-Wilk: W = 0,632, df = 108, Sig. <0,001, +ver "histograma 1" más abajo).

Expresé esta misma variable como "velocidad" (en metros por segundo). La calculé dividiendo 10 metros por el tiempo empleado en completar la distancia, (por ejemplo, 14 segundos para completar 10 metros se convierten en 10/14 = 0,71 m/s).

Cuando ahora compruebo la normalidad de la "velocidad", se distribuye de forma muy normal (Shapiro-Wilk: W = 0,984, df = 108, Sig. = 0,234, +véase el "histograma 2" más abajo).

¿Estoy haciendo algo mal o hay una explicación lógica para esto? Al añadir las etiquetas, stackexchange mencionó la "distribución gaussiana inversa", ¿es esto lo que ocurre aquí?

Histogram 1 Histogram 2

37voto

user164061 Puntos 281

La imagen siguiente ilustra intuitivamente por qué la variable transformada tiene una distribución diferente:

He trazado dos líneas paralelas.

  • En la línea inferior he trazado puntos espaciados uniformemente a $0.1, 0.2, ..., 1.1, 1.2$ que representan la velocidad $v$ .
  • En la línea superior he dibujado puntos según la fórmula $t=0.1/v$ (nota que he invertido el eje que tiene 1,2 a la izquierda y 0 a la derecha)

He trazado líneas que conectan los distintos puntos. Puedes ver que el puntos espaciados uniformemente $v$ no se transforman en puntos uniformemente espaciados $t$ sino que los puntos son más densos en los valores bajos que en los altos.

Esta compresión se producirá también en la distribución de la densidad . La distribución de los tiempos $t$ no será igual que la distribución de $v$ con una ubicación transformada. En su lugar, también se obtiene un factor que se basa en cuánto se estira o aprieta el espacio.

  • Por ejemplo: La región $0.1 < v < 0.2$ se extiende por una región $0.5 < t <1$ que es una región de mayor tamaño. Así, la misma probabilidad de caer en una región concreta se reparte entre una región de mayor tamaño.

  • Otro ejemplo: La región $0.4 < v < 0.5$ se mete en una región $0.2 < t <0.25$ que es una región de menor tamaño. Así, la misma probabilidad de caer en una región concreta se comprime en una región de menor tamaño.

    En la imagen inferior, estas dos regiones correspondientes $0.4 < v < 0.5$ y $0.2 < t <0.25$ y el área bajo las curvas de densidad están coloreadas, las dos zonas de diferente color tienen el mismo tamaño de la zona .

Por lo tanto, como la distribución de los tiempos $g(t)$ no se toma simplemente la distribución de la velocidad $f(v)$ donde se transforma la variable $v=0.1/t$ (que en realidad ya hacen que la distribución tenga un aspecto diferente de la curva normal, véase la curva verde de la imagen), pero también se tiene en cuenta la dispersión/compresión de la masa de probabilidad en regiones más grandes/pequeñas.

intuitive explanation

nota: he tomado $t=0.1/v$ en lugar de $t = 100/v$ porque esto hace que las dos escalas sean iguales y que la comparación de las dos densidades sea equivalente (cuando se aprieta una imagen, esto influye en la densidad).


Ver más sobre transformaciones:

https://en.wikipedia.org/wiki/Random_variable#Functions_of_random_variables

La inversa de una variable con distribución normal es más general:

$$t = a/v \quad \text{with} \quad f_V(v) = \frac{1}{\sqrt{2 \pi \sigma^2}} e^{-\frac{1}{2}\frac{(v-\mu)^2}{\sigma^2}}$$

entonces

$$g_T(t) = \frac{1}{\sqrt{2 \pi \sigma^2}} \frac{a}{t^2} e^{-\frac{1}{2}\frac{(a/t-\mu)^2}{\sigma^2}}$$

puede encontrar más información al respecto buscando el término "distribución normal recíproca". https://math.stackexchange.com/search?q=reciprocal+distribución+normal

Es no lo mismo que "distribución gaussiana inversa", que se refiere al tiempo de espera en relación con el movimiento browniano con deriva (que puede describirse mediante una curva gaussiana).

4voto

Sí, es un caso de Gaussiana inversa. Se ha observado que existe una relación inversa entre la función generadora cumulante del tiempo necesario para recorrer una unidad de distancia y la función generadora cumulante de la distancia recorrida en una unidad de tiempo. Dado que la distancia recorrida en una unidad de tiempo (en este caso, la velocidad al caminar) es aproximadamente normal, el tiempo para recorrer una unidad de distancia (que es aproximadamente el tiempo de primer golpe de una partícula browniana unidimensional) es, por definición, aproximadamente gaussiano inverso.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X