15 votos

¿Cómo una voz humana es única?

Bueno, yo soy bastante nuevo a los conceptos de sonidos vocales. De la física punto de vista creo que un sonido tiene dos parámetros básicos que yo.e, frecuencia y amplitud.

Teniendo en cuenta el final de la onda de sonido producidos por la voz humana, se debe tener la frecuencia y la amplitud como parámetros. Así, cuando un ser humano se puede hablar en múltiples frecuencias (varios tonos) y amplitudes (varios volúmenes) me preguntaba lo que hace que cada ser humano voz única?

Incluso si dos personas se produce un sostenido de la nota(es decir que una misma nota musical) sus voces pueden ser fácilmente distinguidos.Entonces, ¿por qué las voces parecen diferentes?

Hay otros parámetros que distingue o tengo una idea errónea?

17voto

Brionius Puntos 4898

Un "tono puro" es un sonido que tiene una sola función seno como su perfil de presión. La voz humana no es un tono puro; es una superposición de diferentes ondas sinusoidales con frecuencias diferentes y de diferentes amplitudes. Aquí está una imagen que ilustra cómo muchos de ondas sinusoidales de diferentes frecuencias se pueden combinar para hacer una más complicada de la forma de onda como la voz humana:

Wave superposition image example

(crédito de la imagen)

Por lo tanto una voz humana tiene muchos más parámetros de una sola de amplitud y frecuencia. Tiene muchas de las amplitudes, uno para cada una de muchas frecuencias diferentes (junto con una fase para cada uno así). Además, estas amplitudes de cambio a lo largo del tiempo como la voz humana tiene diferentes sonidos.

Esta imagen, por ejemplo, es un "espectrograma" de una voz humana.

Human voice spectrogram image

(crédito de la imagen: Por Dvortygirl, Mysid - FFT había en baudline; sonido original por DvortygirlThis archivo se deriva de:En-us-todo es griego para mí.ogg, CC BY-SA 3.0 )

El eje x es el tiempo, el eje y es la frecuencia y la intensidad indica la amplitud de cada componente de frecuencia en cada punto en el tiempo. Un tono puro se muestran como una sola sólida línea horizontal. Se puede ver que la voz humana está hecha de muchos componentes de frecuencia de diferentes amplitudes.

Esta es la misma razón por la que un violín, oboe y piano de sonido diferentes, incluso cuando juegan a "la misma nota". La terminología musical específicamente para el equilibrio de los distintos componentes de frecuencia se conoce como "timbre".

Ver el artículo de la Wikipedia para leer más.

10voto

MW99 Puntos 1

Aquí está una imagen de las formas de onda de tres personas diciendo que la palabra "ramen." Los dos primeros son en realidad la misma persona en diferentes ocasiones, teniendo por lo tanto el mismo que el tono de su voz. La tercera es una mujer diciendo que la misma palabra "ramen". He modificado la duración de los clips de forma que todos ellos tienen la misma cantidad de tiempo en la general.

enter image description here

(haga clic para ampliar).

Si se mira muy de cerca, no es un segmento inicial de menos turbulencia (R) se transforma en un segmento con una gran cantidad de turbulencia (A) se transforma en lo que es esencialmente un puro de frecuencia (M), en el caso del hombre, un armónico; seguido por otro más áspero de revisión (E), seguido por otro "más pura" de la nota (N), que parece ser muy similar aunque un poco más suave, más prolongado, y posiblemente con un mayor entonado en cada caso.

Una cosa que es muy notorio es que la voz de mujer se va para arriba-y-abajo mucho más, que se manifiesta como su voz el tono más alto.

Otra cosa es esto de "turbulencia" materia: esta materia, y cualquier tipo de "ruido", que es un montón de diferentes frecuencias sucediendo a la vez. La oreja de hecho tiene una parte que se llama el "cóclea", que parece tener poco pelo que cada uno de ellos son un poco diferentes de la frecuencia de resonancia debido a sus diferentes ubicaciones en el órgano-tan diferentes frecuencias de vibración diferentes pelos en sus oídos! Es el patrón entero de cómo estos pelos vibrar juntos, lo que hace la diferencia entre la "a" sonidos en el Padre y el Padre, que son muy diferentes de las vocales, los sonidos (al menos en el inglés Americano!).

En general no hay dos números puros que distinguir un sonido puro (su frecuencia y amplitud), pero en su lugar hay dos funciones de frecuencia que distinguir un sonido puro. La primera función es la amplitud en función de la frecuencia, cualquier sonido puro, va a tener un montón de diferentes componentes en diferentes frecuencias! -- y el segundo parámetro es llamada la fase de las diferentes frecuencias. Los dos números son sólo vamos a distinguir dos ondas sinusoidales que empiezan en la fase, pero muy pocos de los sonidos que se escuchan son ondas sinusoidales y muy pocos de los sonidos que se escuchan son perfectamente en fase.

Desde una fase que está mejor representado como un ángulo con periódicos y cuasi-periódicos de formas de onda, la descripción natural de un sonido es en realidad en términos de una función que asigna a cada frecuencia de 2D a escala matriz de rotación , donde el ángulo de rotación es la fase y de la escala-que es el factor de la escala; es en 2D, ya que sólo necesita un ángulo. Tal escala de rotación de las matrices también son conocidos como números complejos y se llama a esta función el sonido de la transformada de Fourier, que se define como: $$y[f] = \mathcal F_{t \to f}~y(t) = \int_{-\infty}^\infty dt~ e^{-2\pi i f t} y(t).$$ It turns out that this has a very cool property which is its "inverse transform"$$y(t) = \mathcal F^{-1}_{f\to t}~ y[f] = \int_{-\infty}^\infty dt~ e^{+2\pi i f t} y[f].$$En primer lugar, el hecho de que esto existe en todos los medios de que ambas fotos son 100% equivalente para cualquier tiempo de la señal: siempre podemos analizar lo que se ve en el dominio de la frecuencia. Segundo, el hecho de que su inversa se lleva casi exactamente de la misma forma nos permite reutilizar nuestro transformada rápida de Fourier trucos para construir un rápido inversa de la transformada de Fourier, por lo que estos se utilizan todo el tiempo en el procesamiento de la señal.

Cada voz humana contiene una línea de base diferente tono, un acento diferente (mapeo de palabras con sonidos reales!), en una fase diferente perfil, algunas opciones diferentes de armónicos. Es un testimonio de cuán poderoso nuestro cerebro es, y cuánto tiempo nos lleva a aprender un idioma, que incluso podemos reconocer que dos diferentes personas de diferentes lugares están diciendo la misma palabra! Pero obviamente, hay algunos patrones, como el simple "más pura" de la naturaleza de la M y N los sonidos, que nuestro cerebro puede "prenderse" en el fin de agrupar a los sonidos comunes. Así que no es imposible, es muy difícil.

2voto

vissu pepala Puntos 186

Según lo declarado por los demás, es un sonido compuesto por sinusal ondas de diferentes frecuencias. La sintonía que oye, está determinado por la frecuencia más baja (fundamental). Las otras frecuencias son múltiplos de la tierra de la frecuencia y son llamados armónicos.

Resumiendo lo que se muestra a continuación: la cantidad en la que los diferentes armónicos están presentes, determinar el color del sonido, lo que hace la diferencia entre tu voz y la mía, entre el piano y el saxofón.

Como un ejemplo, me examinaron dos una la (440 Hz). Uno producido por un diapasón, el otro juega en un oboe (el habla humana es un poco más complejo, pero cualitativamente, es el mismo).

A continuación, los dos grabados de sonido se muestran en forma simultánea: Yellow: sound of a tuning fork / White: sound of an oboe

La realización de una transformada de fourier (buscando en qué frecuencias están presentes en el sonido) en el ajuste de la horquilla de sonido, el resultado es el siguiente: una de las frecuencias es muy dominante: la de 440 Hz, las otras frecuencias apenas tienen influencia (observe el dB-escala y por lo tanto la escala logarítmica en el eje de las y).

Fourier Transform Tuning fork

El mismo análisis en el oboe de sonido se revela mucho más: Varios picos en 440 Hz, 880 Hz, 1320 Hz, ... (2x, 3x, 4x, ... 440 Hz) Como se puede ver, la sintonía que escuchar (440 Hz), no es la frecuencia a la que está más presente en el sonido (a menudo, el primer pico es el más alto, pero el patrón se ve a continuación es lo que le da el oboe su particular sonido). Su audiencia está capacitado para percibir la serie de picos, como un todo, y reconocer la tierra de la frecuencia como de la cancha.

Fourier Transform Oboe

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X