Esto se ha estudiado ampliamente en la lingüística y la acústica. Los humanos y otros primates predicen el género del hablante a través de una combinación de frecuencia fundamental $F_0$ ("tono") y estimaciones de la longitud del tracto vocal ( $VTL$ ) que son un indicador del tamaño del cuerpo.
A veces se utiliza la "dispersión de formantes" para $VTL$ . Se suele definir como $$\frac{\sum_{i=1}^n(F_{i+1}-F_i)}{n-1}$$ donde $F_i$ es el $i$ frecuencia de los formantes y $n$ es el número de formantes medidos. Sin embargo, esta medida es problemática y no capta información sobre los formantes de rango medio ni sobre la posición de los formantes. Véase Las voces masculinas señalan el potencial de amenaza de los hombres en las sociedades forrajeras e industriales
Una alternativa $VTL$ es la "posición de los formantes", definida como $$\frac{\sum_{i=1}^nF'_i}{n}$$ donde $F'_i$ es el $i$ El formante estandarizado en toda la población medida.
Sin embargo, el hallazgo habitual es que una combinación de tono y estimaciones de la longitud del tracto vocal nos da información sobre el género del hablante y la madurez sexual. Si se observan los espectros masculinos frente a los femeninos, por término medio las voces masculinas son más graves y los formantes están más espaciados.
Los correlatos acústicos del sexo del hablante y la identidad individual del hablante están presentes en un segmento vocálico corto producido en el habla corriente
La percepción de la longitud del tracto vocal y la evolución del lenguaje
La longitud del tracto vocal y la dispersión de la frecuencia de los formantes se correlacionan con el tamaño del cuerpo de los macacos rhesus , pero ver Las frecuencias de los formantes y el tamaño del cuerpo del hablante: una relación débil en humanos adultos