Analisis Espectrografico
Analisis Espectrografico
Analisis Espectrografico
Juan Byron
Resumen
En principio se presenta una descripción escueta de la fonética y su objeto de estudio.
A seguida se establece una clasificación de esta disciplina. Posteriormente, se define,
también de forma escueta, la fonética articulatoria y la perceptiva. Luego se define la
fonética acústica y algunos de los programas informáticos que se emplean para los
análisis acústicos. Después se presentan los medios de almacenamiento de los sonidos
del habla. Finalmente, se describen el espectrograma y sus clases.
Introducción
1
Por otro lado, la fonética acústica se encarga del estudio de las propiedades físi-
cas de los sonidos lingüísticos, de su estructura acústica. Para ello se apoya en
un conjunto de conceptos de la física acústica y se vale de dispositivos electró-
nicos, que en años recientes han sido sustituidos por programas informáticos,
como el Speech Analyzer, el WaveSurfer, el Speech Filing System y el Praat,
que pueden instalarse en cualquier computadora con al menos 1 GB de memoria
RAM y un procesador, como, por ejemplo, Athlon II x2 de AMD o core 2 duo
de Intel.
En la actualidad, los sonidos lingüísticos, como todos los sonidos, pueden gra-
barse, guardarse o almacenarse en memorias USB, en discos compactos o
DVDs, en grabadoras digitales, en los antiguos casetes, en el disco duro de una
computadora o en un disco duro externo. Luego estos archivos fónicos, a través
de uno de los programas de análisis del habla (el Speech Analyzer es muy reco-
mendable), deben convertirse en ficheros Wav –en caso de que ya no estén con-
vertidos– para que puedan recuperarse, modificarse y analizarse por medio de
estos programas de análisis del habla. Algunos programas reconocen ficheros
Mp3, aiff, voc, au, wma, entre otros.
1. Espectrograma
Un espectrograma o sonograma se puede definir como una sucesión de espec-
tros. Es la representación de las variaciones de la frecuencia en la ordenada (eje
vertical: abajo-arriba) de la señal sonora a lo largo del tiempo en la abscisa (eje
horizontal: izquierda-derecha). También se puede decir que el espectrograma
corresponde a la distribución frecuencial (espectro) de la señal (eje vertical) re-
gistrada en función del tiempo (eje horizontal).
2
El análisis espectrográfico o sonográfico involucra en todo caso una ventana
temporal. Esta ventana es la parte de la onda lingüística objeto de observación
en un momento dado con el propósito de determinar sus componentes frecuen-
ciales.
3
Los sonidos que se producen por la vibración de las cuerdas vocales presentan
una estructura armónica. Esta estructura generalmente se muestra con claridad
en los espectrogramas de banda estrecha.
También se observa que algunas líneas son más oscuras que otras. Estas líneas
más oscuras son los armónicos reforzados por las resonancias del tracto vocal.
Asimismo, se observan variaciones de las líneas o armónicos. La razón de estos
cambios es la variación del tono laríngeo.
4
Fig. 2.1. Espectrograma de banda estrecha de tremendo.
5
Fig. 2.2. Espectrograma de banda estrecha de la palabra cosa.
6
primera zona inarmónica corresponde a la explosiva velar sorda o áfona [k], en
tanto que la segunda corresponde a la fricativa predorsoalveolar sorda [s].
7
3. Espectrograma de banda ancha
Los formantes son las frecuencias que caracterizan el timbre de una vocal. Son
las resonancias asociadas con las cavidades del tracto vocal. Constituyen el re-
forzamiento de la amplitud de grupos de armónicos situados alrededor de una
determinada frecuencia, lo que significa que el formante, que generalmente po-
see un ancho de banda de 300 Hz (espectrograma de banda ancha) no es una fre-
cuencia única, sino un conjunto de frecuencias. Por tanto, las mediciones de los
formantes no son absolutas, sino estadísticas, y en todo caso, se procura obtener
la frecuencia central del formante.
Los sonidos que son producidos por la vibración de las cuerdas vocales presen-
tan una estructura formántica. Además de las vocales existen otros sonidos con
estructura formántica, como las nasales, las aproximantes, las laterales y las róti-
cas.
8
En este espectrograma, el primer segmento corresponde a la vocal [e], y
claramente se distinguen los tres primeros formantes. Después de la [s] se
observan los formantes de la vocal central baja [a], que se encuentra solapada
con la lateral [l] y la segunda vocal [a]
9
WaveSurfer. En el gráfico es posible observar 14 segmentos, la mayoría perió-
dicos. Solo la interrupta velar áfona [k] y la fricativa predorsoalveolar áfona [s]
son aperiódicos. Es importante destacar la fase oclusiva y la fase explosiva –
barra de explosión– del segmento velar áfono, así como la turbulencia de la fri-
cativa, cuya frecuencia de inicio se sitúa a unos 3,500 hercios.
10
secuencia acerca del método [aséɾka δel métoδo], realizada por un comunicador
dominicano de sexo masculino. Solo la fricativa predorsoalveolar áfona [s] y la
interrupta dental áfona [t] son aperiódicas y, en consecuencia, carecen de pulsos
glotales. Es una característica de la fricativa el inicio de la concentración de la
energía por encima de los 3,500 hercios. En el caso de la interrupta es posible
observar la fase oclusiva, al inicio de la consonante, y la barra de explosión, que
sigue a la oclusión.
Fig. 3.3.
11
primero es una consonante velar áfona [k] y tres son consonantes dentales áfo-
nas [t]. Estas consonantes presentan durante su tensión una fase oclusiva. Estas
oclusiones se manifiestan en el espectrograma como trechos carentes de energía
o zonas carentes de formantes, que están señaladas con flechas en el gráfico.
Además, hay tres róticas: una vibrante simple y dos vibrantes múltiples. Asi-
mismo, es importante indicar que se observan dos fricativas predorsoalveolares
áfonas [s]. Al igual que en los casos anteriores, la frecuencia de inicio de la
turbulencia de estas consonantes se encuentra por encima de los 3,500 hercios.
En el caso de las vocales, cabe señalar que en la secuencia aparecen una
posterior media [o], tres anteriores medias [e] y una central baja [a].
12
Conclusión
13
Referencias
Baart, Joan. 2010. A Field Manual of Acoustic Phonetic. SIL International, Dal-
las, Texas.
Byron, J. 2012. Manual de fonética acústica. Ed. Somos Literatura, Santo Do-
mingo.
Denes, P. y Pinson, E. 1973. The Speech Chain: The Physics and Biology of
Spoken Language. Anchor Books, New York.
14