La razón por la que se oye el tren más lejos es más consecuencia de la geometría de los diferentes espacios que otra cosa.
Comienza con una capa de inversión de aire frío pegada al suelo. Al igual que el vidrio deforma la luz al hacer que ésta se mueva más lentamente a través de él, una capa de inversión de aire frío deforma el sonido porque éste se mueve más lentamente a través del aire frío (las moléculas se mueven más lentamente, por eso). Así, esta capa de inversión se comporta como el equivalente sonoro de una gran lámina de vidrio que cubre el suelo y aleja el sonido del aire que hay sobre ella. Este es el mismo principio que permite que una fibra óptica totalmente transparente capte la luz que se mueve a través de ella y transmita esa luz durante muchos kilómetros con muy pocas pérdidas. (@hwlau ya se dio cuenta de la inversión en la segunda de sus tres posibles respuestas).
En el lado del suelo de la capa de inversión, una caída fresca de nieve ayuda aún más a confinar y preservar el sonido porque parece suave a las largas longitudes de onda del sonido. Por lo tanto, aunque la nieve desordena completamente las longitudes de onda mucho más cortas de la luz, razón por la cual se ve blanca, su aspecto es muy diferente y mucho más parecido al del sonido.
Si se juntan estos dos elementos -difracción en la parte superior y reflexión en la inferior- se obtiene un ejemplo de dispersión sonora bidimensional. Por el contrario, la dispersión del sonido de un tren en un día de verano que carece de capa de inversión y tiene hierba que absorbe el sonido en el suelo es un ejemplo de dispersión del sonido en gran medida tridimensional.
Entonces, ¿por qué es importante la dimensionalidad de la dispersión del sonido?
Porque el sonido (o cualquier otra radiación) se dispersa a una velocidad que depende del número de dimensiones del espacio en el que se dispersa. Si $L_n$ es la intensidad percibida del sonido, $s$ es la distancia a la fuente de sonido, y $n$ es el número de dimensiones espaciales en las que se dispersa el sonido, la ecuación general para saber cómo sonará el tren es:
$L_n = 1/s^{n-1}$
Observe que cuanto menor sea el número de dimensiones, más lentamente se dispersará el sonido. (Hace unos meses traté esta misma cuestión desde una perspectiva ligeramente diferente en mi respuesta a esta pregunta sobre por qué los objetos parecen más pequeños cuando están más lejos).
Esta ecuación explica por qué las fibras ópticas pueden transmitir la luz muchos kilómetros sin pérdida significativa de intensidad ("loudness"). El espacio de dispersión $n$ para las fibras ópticas es $n=1$ Así que $L_1 = \frac{1}{s^{1-1}} = \frac{1}{s^0} = 1$ . Es decir, hay no disminución de la intensidad. El equivalente en audio sería un tubo largo, como los que se usaban como intercomunicadores en las casas antiguas (y que aún se usan en algunos parques infantiles).
Ahora, el caso de la capa de inversión, $n=2$ y:
$L_2 = 1/s^{n-1} = 1/s$
Pero debido a que su percepción de la distancia del tren estaba sintonizada con $n=3$ espacio, usted esperado los sonidos del tren para disminuir al ritmo mucho más rápido de:
$L_3 = 1/s^{n-1} = 1/s^2$
El análisis de cómo mucho La distancia a la que se encuentra realmente el tren resulta ser más complicada de lo que parece. Esto se debe a que el modelo que acabo de describir supone que la energía de una fuente de sonido 3D puede comprimirse en un plano 2D matemáticamente preciso. El mundo físico no funciona así, ya que la energía del sonido en un volumen 3D no puede ser forzada en un plano 2D real sin crear densidades de energía infinitamente altas en el plano. ¿Por qué? Bueno, más o menos por la razón de que no se puede comprimir un volumen 3D de aire en un plano 2D infinitamente delgado sin crear densidades de masa infinitas. El cruce de dimensionalidades se hace a menudo un poco a la ligera en física, pero hay que tener cuidado con ello.
Así que, en este caso, en lugar de suponer un simple plano 2D, lo que hay que hacer es modelar el problema utilizando un "panqueque" que represente de forma más realista el espesor de la capa de inversión que confina el sonido. Eso permite que las intensidades sonoras "parezcan" 3D en las inmediaciones del tren, pero que luego se desvanezcan más según las reglas de difusión de la dimensionalidad a medida que las distancias aumentan hasta varias veces el grosor de la capa de inversión.
A partir de aquí, todo son conjeturas sobre lo que ha ocurrido en tu caso, pero una altura aproximada para tu capa de inversión podría ser de 10 metros. Aproximando de nuevo, esos 10 metros también se convierten en la "unidad de igualdad" para la distancia desde el tren en la que el sonido del tren se percibe igual en ambos casos. Esta aproximación debería funcionar razonablemente bien para cualquier fuente de sonido más o menos puntual procedente del tren, en particular su silbato. Así, llamamos a esta unidad de distancia $s_u$ para escuchar un volumen similar para el silbato $s_u = s_w = 10 m = 0.01$ km.
Por desgracia, la cosa se complica. El sonido del propio tren es cualquier cosa menos una fuente puntual, ya que se pueden escuchar los sonidos de las ruedas sobre los raíles durante tramos muy largos, como un kilómetro para un tren largo. Eso también desordena el modelo y añade aún más complejidad en forma de orientación y retrasos sonoros. Por lo tanto, voy a agrupar toda esa complejidad en una única y enorme aproximación y decir que, para un tren largo, el sonido de todas las ruedas del tren en toda la vía suena "más o menos igual" para cualquiera que se encuentre a un kilómetro de distancia del tren a su paso, con o sin capa de inversión. Por lo tanto, la unidad de longitud para evaluar cómo cambia el ruido de las vías del tren a lo largo de la distancia es $s_u = s_t = 1$ km.
Ahora hay que modificar ligeramente la ecuación para que estas unidades "suenen igual" $s_u$ se tienen en cuenta:
Actual: $L_2 = s_u/s^{n-1} = s_u/s$
Percibida: $L_3 = s_u/s^{n-1} = s_u/s^2$
Resolver el $s$ distancias en términos de sonoridad:
Actual: $s_2 = s_u/L$
Percibida: $s_3 = \sqrt{s_u/L}$
El factor de error $e$ por lo lejos que estaba su estimación de distancia entonces es:
$e = \text{(actual)}/\text{(perceived)} = s_2/s_3 = \frac{s_u/L}{\sqrt{s_u/L}} = \sqrt{s_u/L}$
Para el silbato del tren, $s_u = s_w = 0.01 km$ . Con $L$ en km:
$e_w = \sqrt{s_u/L} = \sqrt{0.01/L} = 0.1/\sqrt{L}$
Por el ruido de la vía de todo el tren, $s_u = s_t = 1 km$ . Con $L$ en km:
$e_t = \sqrt{s_u/L} = 1/\sqrt{L}$
Así que, finalmente, son posibles un par de ejemplos de estimaciones muy aproximadas.
Supongamos que el tren está realmente a punto de $L = 16$ km de distancia. En ese caso, el silbato suena como si fuera $e_wL$ km de distancia, o:
$e_wL = 16e_w = 16(0.1/\sqrt{16}) = 0.4$ km. de distancia.
En el mismo caso, el sonido de la vía del tren aparecerá $e_tL$ km de distancia, o:
$e_tL = 16e_t = 16/\sqrt{16} = 4$ km. de distancia.
Por lo tanto, los sonidos que se mueven a través de una capa de inversión invernal no sólo son altamente engañosos para estimar las distancias, sino que pueden ser engañosos de diferentes maneras al mismo tiempo. Una fuente puntual como el silbato del tren puede sonar como si estuviera incluso más cerca que el tren en su conjunto, y ambas percepciones sonarán mucho, mucho más cerca que la distancia real.