next Escala de mels
up Psicoacústica
previous Escala de fonos y escala de sonos
  Índice General   Índice de Materias


Altura (pitch)

Tal como sucede con la intensidad perceptual, en el idioma inglés existe un término especial para referirse a la percepción de la periodicidad de un sonido, llamado pitch. En el idioma castellano podría traducirse como tono o altura. Ambas palabras tienen inconvenientes. Usualmente, la palabra tono se refiere indistintamente a un tipo especial de sonido, de carácter sinusoidal o bien a la percepción de la frecuencia o periodicidad. Por otra parte, la palabra altura proviene del espacio, es una medida de distancia y no aparece como muy apropiada para referirse a un fenómeno exclusivamente temporal. Además, tal como se verá más adelante, la percepción de periodicidad sonora es un fenómeno bi-dimensional, y se divide en lo que se llama en inglés pitch height (que podría traducirse como altura) y pitch chroma (color). Por lo tanto, en realidad la palabra altura se refiere a sólo una de las dimensiones de esta medida.

A pesar de estas limitaciones, en el presente texto se utilizará la palabra altura para referirse a la medida perceptual de la periodicidad de un sonido, siempre teniendo en cuenta la otra dimensión de color, y la palabra tono se referirá a un sonido sinusoidal, comúnmente referido como tono puro.

La altura, que es un fenómeno puramente perceptual, está muy correlacionada con la frecuencia física, pero no existe una relación exacta uno a uno entre ellas. La altura no debe confundirse con lo que se conoce como ``brillo'', el cual depende de la distribución de energía entre las altas y bajas frecuencias y no exclusivamente de la periodicidad de un sonido.

El rango de frecuencias que percibe el sistema auditivo humano se extiende usualmente desde los 20 Hz hasta los 20.000 Hz o 20 kHz. Si bien el límite inferior es comúnmente aceptado, existe controversia sobre el límite superior. Existe evidencia que indica que el rango normal de una persona adulta no supera los 17 kHz como límite superior, dada la típica pérdida auditiva asociada a la edad, pero hay investigadores que afirman que el rango de audición humana va más allá de los 20 kHz.

La mínima diferencia notoria (JND) de alturas es de alrededor de 1/30 de la banda crítica para una frecuencia determinada. Ésta depende de la frecuencia, intensidad y la duración, como también de cambios súbitos en la frecuencia. La resolución de frecuencia auditiva es muy superior a la resolución de frecuencia visual o la percepción de color. La visión humana abarca en total unas 120 JND, lo que equivale a una octava. En cambio, el sistema auditivo humano abarca unas 5000 JND, lo que equivale a unas diez octavas.

Los mecanismos de percepción de altura funcionan en forma distinta para las altas y bajas frecuencias. No existe una teoría que explique completamente el funcionamiento de la percepción de alturas por sí sola y es necesario, entonces, recurrir a dos teorías distintas pero complementarias para explicar nuestra percepción de alturas.

La teoría de la posición (o frecuencia) argumenta que la percepción de alturas está determinada por el lugar de máxima vibración en la membrana basilar, tal como se muestra en la figura 3.6. Esta teoría funciona muy bien para altas frecuencias, y no así para las bajas frecuencias, dado que en este caso la membrana entera vibra con los sonidos graves y no sería posible discriminar alturas usando solamente esta información.

La teoría temporal (o de periodicidad) considera que la altura percibida está determinada por la distribución de los impulsos eléctricos en las neuronas auditivas. Sucede que éstos impulsos eléctricos producidos por las neuronas se sincronizan con la frecuencia fundamental del estímulo que está siendo percibido. Este fenómeno se conoce como sincronización de fase (en inglés phase locking). Esta teoría funciona para bajas frecuencias, hasta unos 5 kHz, porque hay un límite físico que impide a las neuronas disparar impulsos eléctricos a tasas mayores.

La altura es en realidad una medida bi-dimensional que puede ser mejor descrita en forma circular, o por una espiral, tal como lo muestra la figura 3.17. Esta representación fue propuesta por Roger Shepard en 1982.

Figura 3.17: Pitch
\includegraphics[width=7cm]{capitulo3/images/pitchhelix}

De acuerdo a esta idea, la altura posee realmente dos atributos, denominados en inglés pitch height y pitch chroma. El primero efectivamente mide la altura de un sonido en una escala ascendente y el segundo mide algo que se podría denominar como color o croma, que se refiere a la nota musical más próxima a una determinada frecuencia física y que se representa en forma circular. Esta es la razón por la cual los seres humanos son capaces de reconocer las notas musicales independiente de la octava en que se encuentren. En algunas situaciones es más fácil determinar el croma de un sonido que su altura efectiva.

La relación entre frecuencia, medida en Hz, y la altura percibida no es lineal. Esto se debe a que la estimulación en la membrana basilar ocurre en puntos espaciados de acuerdo a una función logarítmica de la frecuencia. Cuando la frecuencia de un estímulo sonoro se duplica, la distancia entre los puntos de estimulación de la membrana basilar se encuentran aproximadamente a una distancia constante, de unos 3.4mm para el caso de las altas frecuencias. Esto implica que los seres humanos comparamos sonidos de distintas frecuencias no en base a la diferencia entre estas frecuencias, si no en base a la razón entre ellas, lo que musicalmente se conoce como un intervalo musical. Un ejemplo claro de aquello es justamente la octava, intervalo que implica una razón 2:1, cuando la frecuencia se duplica. Perceptualmente, cuando hay una razón 2:1 esta distancia se juzga como la misma, una octava, independiente del rango de frecuencias donde ocurra.

Por lo general, la altura está altamente correlacionada con la frecuencia fundamental de un sonido. Sin embargo, existe evidencia que muestra que la percepción de altura no está relacionada únicamente con la fundamental. Ejemplo de esto son algunas ilusiones auditivas tales como los tonos de Shepard o de Risset, diseñadas especialmente para engañar al sistema auditivo.

Los tonos de Shepard se construyen con componentes sinusoidales separados por una octava, a los cuales se les aplica un envolvente de tipo Gaussiano, tal como se muestra en la figura 3.18. Si se elevan las frecuencias de los componentes de frecuencia en un semitono, se percibe un incremento en la altura. Pero cuando esto se repite 12 veces, se vuelve al punto de partida y el sistema auditivo ya no es capaz de determinar si la altura ha subido o bajado. Si el incremento es de 6 semitonos, alguna gente escucha un movimiento ascendente y otras uno descendente.

Figura 3.18: Espectro de un tono de Shepard
\includegraphics[width=7cm]{capitulo3/images/shepard}

Otra variante de los tonos de Shepard, son los de Risset, en los cuales los parciales no se encuentran en una relación armónica y los parciales están separados por un poco más de una octava. Si se doblan las frecuencias de los parciales, se percibe un descenso en la altura. Esto se debe a que el sistema auditivo explica este fenómeno mediante el reemplazo del tono por parciales de frecuencias un poco menores que las existentes, de otra manera, la situación no le hace ningún sentido.

Estas ilusiones demuestran que la percepción de altura depende del patrón de armónicos del sonido y no sólo de la frecuencia fundamental. Contrariamente a lo que se pudiera pensar, ni siquiera depende de la presencia física de un tono de la frecuencia correspondiente a la altura percibida. Este fenómeno se conoce como altura virtual y se muestra en la figura 3.19. En la figura se observa un experimento dividido en tres partes. En la parte a) se tiene una sinusoide pura con frecuencia fundamental $ f_0$ y un tono virtual compuesto por los tres primeros armónicos $ f0$, $ f1$ y $ f2$. En ambos casos se percibe la misma altura, correspondiente a la frecuencia fundamental. Esto sucede por que el sistema auditivo al encontrar los primeros armónicos automáticamente trata de encontrar algún patrón que tenga sentido y concluye que lo más evidente es que se trate de un tono con frecuencia fundamental $ f0$, aunque no esté presente físicamente. Para probar ésta hipótesis, en la parte b) se aplica un filtro pasa bajo con frecuencia de corte entre $ f0$ y $ f1$ y en la parte c) un filtro pasa altos con la misma frecuencia de corte. En el caso b) la sinusoide no se percibe porque es eliminada por el filtro pasa bajos pero el tono virtual se percibe con la misma altura de antes, ya que el filtro en realidad no elimina nada. En el caso c) la sinusoide se percibe ya que no es afectada por el filtro pasa altos, pero el tono virtual deja de percibirse, ya que desaparecen los armónicos que permitían su percepción.

Figura 3.19: Demostración de la existencia del tono virtual
\includegraphics[width=9cm]{capitulo3/images/virtual_pitch}

El fenómeno de la altura virtual por lo general sólo se presenta para frecuencias bajo 1000 Hz. Para frecuencias sobre éste valor, la altura sólo se percibe cuando la fundamental correspondiente a esa altura está efectivamente presente.

La sensación de altura también depende de otros factores, tales como la intensidad y la duración. En términos de la intensidad, la percepción de una determinada depende de la intensidad del estímulo, tal como se muestra en la figura 3.20. Cambios en la intensidad de un sonido pueden generar pequeños cambios en la altura percibida.

Figura 3.20: Altura e intensidad
\includegraphics[width=8cm]{capitulo3/images/pitch_and_level}

La altura también está condicionada por la duración de los estímulos. Para sonidos de bajas frecuencias la duración mínima necesaria para percibir esa altura es considerablemente mayor que para tonos de frecuencias más altas. Dependiendo de la frecuencia fundamental, si la duración del estímulo es muy corta el sistema auditivo no es capaz de generar la percepción de una altura determinada. Esto se ejemplifica en la figura 3.21, donde se muestra la percepción de la altura en función de la duración.

Figura 3.21: Altura y duración
\includegraphics[width=8cm]{capitulo3/images/pitch_and_duration}



Subsecciones
next Escala de mels
up Psicoacústica
previous Escala de fonos y escala de sonos
  Índice General   Índice de Materias

Copyright © 2008-06-05
Rodrigo F. Cádiz   - Centro de Investigación en Tecnologías de Audio, Instituto de Música, Pontificia Universidad Católica de Chile