Archivo de etiquetas| foniatria forense

Análisis Acústico de Voz

HERRAMIENTAS Y PROCEDIMIENTOS EN EL ANÁLISIS VOCAL

 

 

La fonética constituye uno de los ámbitos de la lingüística que más se ha beneficiado de los avances informáticos dado su carácter experimental. Disponer de potentes herramientas de análisis ha favorecido el desarrollo de teorías cuyo fin principal es explicar la comunicación mediante el habla entre los seres humanos.

El estudio experimental del habla desde las diferentes perspectivas de la fonética (articulatorio, acústico, perceptivo) condiciona y determina la elección de las técnicas de análisis adecuadas. Técnicas que determinarán los parámetros que caracterizan a los sonidos , así como los patrones entonativos y rítmicos.

Desde el punto de vista acústico el estudio del habla requiere de un profundo análisis en los dominios de lafrecuencia,amplitud y tiempo  que configuran la onda sonora portadora del habla.

Algunas de las técnicas empleadas en esta tarea son el análisis oscilográfico, espectrográfico, espectral y de predicción lineal (LPC).

El análisis oscilográfico es una técnica que permite la  representación de una señal en los dominios de tiempo y amplitud, también conocida como forma de onda.Mediante el análisis oscilográfico podremos segmentar y delimitar cada unidad fonética aunque no siempre sea tarea fácil como en el caso de sonidos aproximantes,cuando se trata de determinar  los limites entre la consonante y las vocales  adyacentes.

 

Mediante el análisis espectrográfico podemos visualizar la onda sonora en sus tres dominios, frecuencia, amplitud y tiempo.La frecuencia de los formantes se calcula trazando una línea imaginaria en el centro del formante y tomado la frecuencia del punto medio de esta línea. Sin embargo la determinación de la frecuencia de los formantes presenta dificultades en algunos casos como en la consonante nasal palatal donde se advierte en la mayoría de espectrogramas la fusión entre formante segundo y tercero.

Al introducir la variable de tiempo en la representación de la onda sonora, el espectrograma permite representar la trayectoria de los formantes  y obtener las transiciones de un sonido a otro. Sin embargo  determinar los limites de la transición (entre formantes) es especialmente difícil cuando las muestras del habla proceden de una situación comunicativa informal, caracterizada por una relajación en la pronunciación.Por ello se suele considerar la secuencia vocálica como una unidad y se  toman los datos de frecuencia de formantes en varios puntos desde el inicio hasta el final.

 

En la determinación de los formantes también es posible utilizar el análisis espectral mediante el que obtenemos una representación de la onda sonora en el dominio de la frecuencia y amplitud. El espectro de un sonido es la función resultante de aplicar el algoritmo denominado Transformada rápida de Fourier (FFT,Fast Fourier Transform)que descompone la onda sonora en sus armónicos.

Este procedimiento no proporciona información acerca de la evolución frecuencial en el tiempo y por tanto no permite analizar transiciones . Sin embargo permite obtener información sobre la distribución de energía en la escala de frecuencias.

 

En el espectro, los formantes aparecen como agrupación de armónicos.La frecuencia del formante se toma en el punto medio de la agrupación mientras que la intensidad corresponde al armónico con mayor amplitud.

El armónico de frecuencia más baja que se observa en el espectro corresponde a la frecuencia fundamental (Fo), que tiene como correlato articulatorio la frecuencia de vibración de las cuerdas vocales.

 

 

Determinados software de análisis vocal permiten conocer el pitch o seguimiento de la fundamental a lo largo del tiempo para determinar la melodía de la voz,tanto a nivel de entonación(frases) como acentuación (palabras).Interesante para conocer la variación de los rasgos fonéticos dentro de una misma lengua.

 

Otra técnica que permite obtener información sobre la estructura acústica de los sonidos del habla  es elanálisis de predicción lineal (LPC, Linear Predictive Codingque representa la onda sonora en términos de parámetros relacionados con la función de transferencia del tracto vocal y las características de la función de la fuente que varían con el tiempo.

Es un procedimiento de separación entre la estructura fina del espectro  y la envolvente espectral (formada por los picos correspondientes a los formantes).

Seguir

Recibe cada nueva publicación en tu buzón de correo electrónico.