12 votos

¿Por qué funcionan los coros?

En un coro, varias personas cantan la misma nota al mismo tiempo. El sonido que emite cada persona se compone de una tónica y ciertos sobretonos, pero gran parte de lo que oímos es la frecuencia tónica, por lo que me gustaría concentrarme en ella.

Una aproximación muy burda es que la tónica es una onda sinusoidal de cierta frecuencia, $$ H(t) = A \sin (kt + d) $$ donde la constante $k$ determina la frecuencia, y el fase , $d$ determina el instante en que la señal alcanza su pico: si tú y yo empezamos a cantar en momentos ligeramente diferentes, cada uno tendrá su propio valor "d". Para simplificar las cosas, supongamos que ajustamos nuestras unidades de tiempo para que $k = 1$ y ajustar nuestras unidades de intensidad sonora para hacer $A = 1$ para que $$ H(t) = \sin(t + d). $$

Por el principio de superposición, el sonido emitido por varios cantantes se parece a $$ C(t) = \sum_{i = 1}^n \sin (t + d_i) $$ donde el $d_i$ son (supongo) variables aleatorias uniformemente distribuidas en el intervalo, digamos, $0 \le d_i \le 2\pi$ .

Me parece que para cualquier momento $t_0$ los valores $A\sin(t_0 + d_i)$ se distribuyen entre $-1$ a $1$ con una distribución simétrica en torno a $0$ La onda sinusoidal de cualquier cantante tiene la misma probabilidad de estar en el semiciclo "negativo" que en el positivo, etc.

Es decir: parece que el valor esperado del sonido producido es cero.

Reconozco que esta no es exactamente la pregunta correcta, ya que esto mira a la expectativa sobre todo conjuntos de fases más que para un coro específico. Uno podría formar un coro (es decir, un conjunto de fases) que fuera bonito y ruidoso, y luego compensar a todos con un medio ciclo y obtener otro coro bonito y ruidoso, pero la suma de los dos coros sería cero, lo cual no es un problema: los coros individuales eran bastante ruidosos.

Supongo que la pregunta que tengo es entonces la siguiente:

¿Cuál es el máximo esperado de $|C(t)|$ en el intervalo $0 \le t \le 2\pi$ con la expectativa tomada con respecto a las elecciones uniformes iid de las fases $d_i$ ? Los experimentos en matlab me sugieren que podría ser algo alrededor de $0.9 \sqrt{n}$ (donde $0.9$ debe provenir seguramente de alguna extraña combinación de constantes que impliquen $\pi$ etc.)

Lo curioso es que un coro de 100 personas me parece mucho más fuerte que 10 veces el volumen de un solo cantante. Teniendo en cuenta la naturaleza logarítmica de la percepción para la mayoría de los sentidos, esto parece contradecir salvajemente la estimación que di anteriormente.

¿Puede alguien sugerir alguna idea al respecto?

Supongamos, en aras del argumento, que el coro está dispuesto en círculo alrededor de mí, el director, de modo que si todos cantan exactamente en el mismo momento, los sonidos llegan todos a mi (único) oído exactamente en el mismo momento, ¿de acuerdo?

Me doy cuenta de que la cuestión más amplia de por qué funcionan los coros es una combinación de percepción, física, matemáticas y probablemente algunas otras cosas, pero la matemáticas La pregunta aquí es sobre la amplitud esperada de una suma de ondas sinusoidales de fase aleatoria, y eso es lo que espero que se responda aquí en MSE.

1 votos

Recuerdo la expectación del energía $\int C(t)^2\,\mathrm dt$ escalando precisamente de forma lineal en $n$ pero no recuerdo la prueba de la cabeza.

0 votos

Esto es sólo una idea de cómo proceder. Puede escribir $$ C(t) = \sin t \Big(\sum_{j=1}^n \cos d_j\Big) + \cos t \Big( \sum_{j=1}^n \sin d_j \Big) = \langle (\cos t, \sin t), (B, A) \rangle $$ donde $A$ y $B$ son la primera y la segunda suma, respectivamente. Esto demuestra que $\sup_{t \in [0, 2\pi]} C(t) = \sqrt{B^2 + A^2}$ .

0 votos

Usando eso $\sin^2 x + \cos^2 x = 1$ ya tiene las expresiones alternativas $$ \mathbb{E}[\sup_{t} C(t)] = \mathbb{E}\left[\Big[n + 2\sum_{i<j} (\sin d_i \sin d_j + \cos d_i \cos d_j) \Big]^{1/2}\right] = \mathbb{E}\left[\Big[n + 2\sum_{i<j} \cos (d_i - d_j) \Big]^{1/2}\right] $$

2voto

JaakL Puntos 1715

Un enfoque mejor que el que estaba adoptando en los comentarios es ver todo el proceso como una pregunta sobre variables aleatorias en el plano. Definamos $$ X_j := \begin{bmatrix}\cos d_j \\ \sin d_j\end{bmatrix}\quad \text{and} \quad S_n := \sum_{j=1}^{n} X_j,$$ donde $d_j$ es una familia de variables aleatorias uniformes iid en $[0, 2 \pi]$ . Entonces, $S_n$ es un vector aleatorio en $\mathbb{R}^2$ con las coordenadas primera y segunda dadas respectivamente por $$ A_n = \sum_{i=1}^n \cos d_j \quad \text{and} \quad B_n = \sum_{i=1}^n \sin d_j. $$ Como se menciona en los comentarios, tenemos que $$ C(t) = \sum_{i = 1}^n \sin (t + d_i) = \sin t \Big(\sum_{j=1}^n \cos d_j\Big) + \cos t \Big( \sum_{j=1}^n \sin d_j \Big) = \langle (\cos t, \sin t), (B_n, A_n) \rangle, $$ lo que implica que $$ \sup_{t \in [0,1]} |C(t)| = \sqrt{A_n^2 + B_n^2} = \lVert S_n \rVert $$ Por lo tanto, sólo quiere entender bien el comportamiento de $S_n$ una suma de vectores aleatorios iid. Obsérvese que los marginales de $X_j$ tienen la misma distribución, y que $$ \mathbb{E}[\cos d_j] = \mathbb{E}[\sin d_j] = 0 \quad \text{and} \quad \mathbb{E}[\cos^2 d_j] = \mathbb{E}[\sin^2 d_j] = \frac12, $$ aplicando el operador de valor esperado a $\sin^2 d_j + \cos^2 d_j = 1$ . Además, tenemos $$ \mathbb{E}[\cos d_j \sin d_j] = \frac12 \mathbb{E}[\sin (2d_j)] = 0. $$ Así, podemos aplicar el Teorema del límite central multidimensional para la suma $S_n$ y ver que $$ \frac{S_n}{\sqrt{n}} \to Z $$ en la distribución, donde $Z$ es una normal de media $0$ y la matriz de covarianza $\Sigma = \begin{bmatrix}\frac12 & 0 \\ 0 & \frac12\end{bmatrix}$ . No estoy muy familiarizado con estos resultados multidimensionales, pero estoy bastante seguro de que a partir de aquí debería ser capaz de derivar estimaciones precisas sobre la distribución de $\lVert S_n \rVert$ y sus momentos.

1 votos

Para ser honesto, esto es exactamente lo que he sacado de tu comentario: que lo fundamental es tener en cuenta el $e^{i\omega t}$ y me doy cuenta de que tengo una suma de constantes que son (aproximadamente) elegidas al azar de un disco. La suma esperada es cero, pero la longitud esperada de la suma es considerablemente mayor que cero. :) Pensaba escribirlo como respuesta en la wiki de la comunidad, pero te has adelantado y lo has hecho mejor que yo.

1voto

Minow Puntos 11

Permítanme intentar una posible respuesta, tal vez alguien más puede saltar y espero confirmar. Yo estaba publicando una pregunta muy similar aquí y luego se dio cuenta de la discusión sobre esta cuestión aquí.

En realidad es cierto que el valor esperado de un solo cantante $\sin(t+d_i)$ es igual a cero; por tanto, lo mismo ocurre con el valor esperado de la suma. Como se señala en un comentario a mi pregunta original, hay que distinguir entre el valor esperado y la realización real. Un hecho que también hay que tener en cuenta es que el oído probablemente no capta las ondas sonoras en un solo punto infinitesimalmente pequeño, sino en toda un área de tamaño finito. Cada punto dentro del área adquiere la intensidad (o energía) de la onda sonora que le llega, es decir, su cuadrado (no se puede restar una onda sinusoidal negativa de una positiva que incide en el plano en una posición diferente). La integración de la energía a través de esa zona proporciona la señal que realmente se convierte en una señal nerviosa que le da una sensación de audición. Por tanto, lo que ocurre en realidad es que, efectivamente, se puede tener una interferencia destructiva total en uno o varios puntos diminutos del plano de audición como realización actual del experimento aleatorio, pero los demás puntos dan cuenta de ello y, en promedio, se recibe la misma intensidad, aunque se mueva la cabeza ligeramente a la izquierda o a la derecha. Tal vez sea necesario considerar la longitud de onda y el tamaño real de la zona sensible a la intensidad del sonido (que son de magnitudes bastante diferentes), pero hay una superposición de docenas de ondas sonoras con fase diferente en cada punto, por lo que un desplazamiento minúsculo en el plano de audición podría dar lugar a una diferencia de fase bastante grande del seno general adquirido.

Creo que eso tiene sentido desde un punto de vista matemático; sería estupendo que alguien pudiera confirmarlo también desde un punto de vista fisiológico.

0 votos

El sonido viaja 1200 pies/segundo; a 440 Hz ("concierto A"), se obtiene una longitud de onda sonora típica de unos 2,7 pies; eso es unas 100 veces el diámetro del canal auditivo. No creo que las diferencias en el tiempo de llegada vayan a explicar mucho la "no cancelación". El segundo comentario de @Daniel me parece la explicación más convincente que he visto aquí.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X