Clase 3 - Lenguaje
Clase 3 - Lenguaje
Clase 3 - Lenguaje
Al escuchar una palabra entran en funcionamiento los detectores de rasgos fonéticos correspondientes a los sonidos
que esa palabra tiene y esos detectores activan a los detectores de los fonemas que poseen esos rasgos. A su vez, los
detectores de fonemas trasmiten la activación a las representaciones de las palabras que contienen esos fonemas. La
forma en que esto se hace es materia de discusión, ya que algunos modelos defienden una actuación serial, en la que la
información fluye solo desde los procesos periféricos a los más centrales, y otros interactiva, en la que la información
fluye en ambas direcciones, de tal manera que la identificación de los fonemas ayuda, a su vez, a identificar los rasgos
fonéticos y las palabras a los fonemas (McClelland y Elma, 1986). Pero aquí no vamos a entrar en estas cuestiones.
¿Y qué papel juega la sílaba? Hasta ahora hemos estado considerando que los oyentes tenemos que identificar los
fonemas como paso previo al reconocimiento de las palabras, debido a que los fonemas constituyen la unidad más
pequeña del lenguaje. Sin embargo, también existe la posibilidad de que la unidad activada no sea el fonema, sino la
sílaba, tal como defienden algunos investigadores (Massaro, 1975, Mehler, Dommergues, Frauenfelder y Seguí, 1981).
Ciertamente, parece más fácil segmentar el habla, al menos de manera consciente, a nivel de sílaba que de fonema. Los
niños desde muy pequeños son capaces de seguir juegos que exigen tener conciencia de la sílaba, pero hasta mucho
después (los analfabetos no lo llegan a conseguir nunca) no adquieren conciencia del fonema (Morais, Caty, Alegría y
Bertelson, 1979). ¿Por qué entonces se ha dado tanta importancia al fonema y tan poco a la sílaba? La explicación
pudiera estar en que la mayor parte de los estudios sobre segmentación del habla de han hecho en inglés y el inglés es
un idioma en el que es difícil precisar la sílaba (muchas veces ni siquiera hay acuerdo entre los ingleses sobre dónde
termina una sílaba y comienza la siguiente). Pero en idiomas tan claramente silábicod como el francés o el castellano las
cosas pueden ser diferentes.
En unos famosos experimentos realizados en francés por Mehler y col. (1981), los sujetos tenían que detectar
secuencias de sonido "CV" (consonante-vocal) o "CVC" (consonante-vocal-consonante) en palabras bisílabas cuya
primera sílaba tenía estructura CV o CVC. Cuando había coincidencia entre la secuencia que tenían que detectar y la
sílaba por la que comenzaba la palabra (por ejemplo "PA" en "PAlacio" o "PAL" en "PALmera"). Si los sujetos utilizasen
como unidad de segmentación el fonema no se tendrían que producir esas diferencias, ya que los fonemas eran los
mismos en ambos casos (PALacio PALmera). En cambio, el hecho de que la coincidencia silábica produzca esas
diferencias es un dato robusto a favor de una segmentación silábica.
Estos resultados encontrados en francés abogan claramente por la
segmentación silábica más que por la fonémica. Sin embargo, cuando
trataron de replicar estos experimentos en inglés (Cutler, Mehler, Norris y
Seguí, 1983, 1986) no encontraron el efecto silábico, esto es, el hecho de
que los sonidos a detectar coincidiesen con la sílaba no disminuía los
tiempos de reacción. La interpretación que se hace es que los sujetos
franceses utilizan la sílaba como unidad de segmentación y los ingleses el
fonema. ¿Y en castellano? ¿Qué unidad de segmentación utilizamos los
hablantes del castellano? Puesto que en nuestro idioma la sílaba también
está claramente definida, es de esperar que se produzca una segmentación silábica. Y efectivamente eso es lo que
parece suceder, ya que diferentes investigaciones han mostrado que también los hablantes españoles son sensibles a la
sílaba en la percepción del habla (Bradley, Sánchez-Casas y García-Albea, 1993, Sebastián, Dupoux, Seguí y Mehler,
1992).
En definitiva, que al menos en los idiomas silábicos, como el francés o el castellano, tenemos que tener en cuenta a
la sílaba, ya que parece jugar un papel importante, bien como estadio inicial en vez del fonema, bien como paso
intermedio entre el fonema y la sílaba, tal como se refleja en el siguiente modelo. (Fig. 3).
Procesos léxicos
Si en el primer estadio de percepción del habla la misión era categorizar la variedad de sonidos verbales que nos
llegan en unos pocos fonemas y/o sílabas, en el siguiente estadio, que denominamos léxico o de reconocimiento de
palabras, la tarea es atribuir un significado a esa secuencia de sonidos. Para ello necesitamos disponer de un almacén de
memoria en el que se encuentren representadas todas las palabras que conocemos oralmente para sí poder identificar
cuál es la que corresponde a una secuencia de sonidos determinada. A este almacén de palabras lo denominamos léxico
auditivo (para diferenciarlo de otros léxicos que iremos exponiendo).
Resulta sorprendente pensar lo efectivos y rápidos que son los procesos de reconocimiento de palabras ya que a
pesar del enorme número de palabras que conocemos, pocos milisegundos después de escuchar una secuencia de
sonidos ya hemos identificado la palabra correspondiente. ¿Cómo se lleva a cabo este proceso? Se podría pensar que
primero se identifican los fonemas y/o sílabas e inmediatamente a continuación comienzan a funcionar los procesos de
reconocimiento de palabras. Sin embargo, el carácter temporal del habla, esto es, el hecho de que los sonidos de una
palabra vayan llegando sucesivamente al oído favorece el que se realice un procesamiento en paralelo de los fonemas y
de las palabras. Ciertamente, tal como demostraron hace ya algún tiempo Marlen-Wilson y Tyler (1980), los procesos de
reconocimiento de palabras comienzan a funcionar en el mismo instante en que se comienzan a percibir los primeros
sonidos sin tener que esperar a escuchar la palabra completa. En unos experimentos realizados por estos autores en los
que los sujetos tenían que reconocer las palabras que iban escuchando, los tiempos que empleaban en el
reconocimiento eran incluso más cortos que el tiempo que duraba la emisión de las palabras (tiempo medio de
pronunciación de la palabra 400ms, tiempo medio de reconocimiento 275 ms). ¿Cómo es posible que se pueda
reconocer una palabra antes de terminar de ser escuchada? Se podría pensar que gracias a la ayuda del contexto.
Ciertamente, el lenguaje es muy previsible, de manera que cuando el hablante va a decir una palabra en un contexto
determinado, basta con escuchar los primeros sonidos para saber de qué palabra se trata. Pero no es solamente el
contexto en que nos ayuda a reconocer con rapidez las palabras, ya que incluso cuando se presentan aisladas se pueden
reconocer antes de que se hayan terminado de pronunciar. En este caso, la rapidez de reconocimiento depende
principalmente de donde tenga situada la palabra el "punto de unicidad". Se llama punto de unicidad al fonema a partir
del cuál la palabra es única, es decir, no existe ninguna otra palabra que comience con esos fonemas. Sólo hay una
palabra que comience por "rinoc" que es rinoceronte. En cambio, hay varias que comienzan por "rino" (rinología,
rinoplastía, etc). En consecuencia, el punto de unicidad de la palabra rinoceronte es el fonema /c/. Pues bien, cuando la
palabra tiene el punto de unicidad al principio, el tiempo de reconocimiento es más corto incluso que el de
pronunciación ya que enseguida sabemos de qué palabra se trata (la palabra "etcétera" se podrá reconocer
rápidamente, porque el punto de unicidad está en el tercer fonema). En cambio, cuando el punto de unicidad está al
final (por ejemplo "aguja") es necesario escuchar toda la palabra para poder identificarla.
El modelo que proponen Marslen-Wilson y Tyler (1980), Marslen-Wilson y Welsh (1978) para explicar el sistema de
procesamiento léxico es el siguiente. En el momento en que se identifica el primer fonema de la palabra se activan
todas las palabras que comienzan por ese fonema (por ejemplo cuando se identifica el fonema /e/ se activan palabras
como "edad", "estrella", "escaso", etc.). A este grupo de palabras activadas se denomina "cohorte" de la palabra. Una
vez identificado el segundo fonema, el número de palabras activadas se reduce (por ejemplo, si se trata del fonema /p/
quedarán activadas palabras como "epopeya", "episodio", "época", etc.). Y a medida que se van identificando nuevos
fonemas se va reduciendo la cohorte hasta que se llega al punto de unicidad y sólo queda la palabra clave que es la que
se reconoce como correspondiente a esos sonidos.
De todas formas, aún siendo el punto de unicidad la variable más importante, no es la única que interviene en el
reconocimiento de las palabras, sino que existen otras variables también relevantes. Por ejemplo, la frecuencia de uso
de las palabras. Ante dos palabras que tengan el mismo punto de unicidad la más frecuente se reconoce primero (Taft y
Humbley, 1986). De hecho, en una nueva versión del modelo de cohorte (Marslen-Wilson, 1987) ya se incorpora un
nuevo mecanismo para dar cuenta del efecto frecuencia. La explicación es que las palabras tienen diferentes umbrales
de encendido de acuerdo con la frecuencia. A medida que se escucha una y otra vez la misma palabra, disminuye el
umbral de la representación de esa palabra y es necesario entonces menos activación para alcanzar ese umbral. La
mayor parte de los modelos actuales de reconocimiento de palabras ya asignan
umbrales diferentes a las representaciones de las palabras en función de la
frecuencia de uso. Otra variable importante es el patrón de acentuación. El
acento marca también un punto de distinción de la palabra. La categoría
gramatical, la complejidad morfológica o la composición silábica, son también
otras de las muchas variables que influyen en este estadio léxico.
Procesos semánticos
Los procesos explicados hasta ahora se refieren a todo lo que ocurre hasta que
se activa la representación auditiva de una palabra. Pero esto no significa que se
hubiese activado el significado de esa palabra, puesto que la forma fonológica y el significado se encuentran en
almacenes separados. Y aunque, generalmente, la recuperación de una forma fonológica conlleva la inmediata y
automática recuperación del significado (cuando escuchamos la palabra "lámpara" no podemos evitar la activación de
su significado), sin embargo, hay ocasiones en las que se produce la activación de la forma fonológica y no del
significado (y viceversa). A veces escuchamos una palabra que estamos seguros que hemos escuchado anteriormente y
de la que sin embargo no recordamos su significado. De la misma manera que a veces activamos un significado y no
encontramos la palabra que lo designa. Por lo tanto, es necesario postular un nuevo almacén, aunque en este caso para
los significados de las palabras, o lo que es lo mismo, para los conceptos. A este almacén lo denominamos sistema
semántico.
La organización del sistema semántico es diferente de la del léxico auditivo, así como también su funcionamiento.
Para empezar, las representaciones del sistema semántico o conceptos se organizan por categorías tal como reflejan los
datos experimentales. Desde hace tiempo se sabe que tendemos a agrupar las listas de los objetos que tenemos que
recordar por categorías. También desde hace tiempo se conoce el efecto de priming semántico que se encuentra en las
tareas de categorización semántica; esto es, cuando tenemos que decidir si "un tigre es un mamífero" el tiempo que
invertimos en la decisión es menor si previamente hemos escuchado una palabra relacionada semánticamente (por
ejemplo la palabra "león").
Lo que no está claro es si los conceptos se representan mediante nodos tal como sostiene la teoría de redes
propuesta por Collins y Quillian (1969) y Collins y Loftus (1975) o a través de sus rasgos, tal como defienden Smith,
Shoben y Rips (1974). Según la teoría de redes, los conceptos están representados en la memoria como unidades
independientes conectadas entre sí por medio de una red de relaciones y es en esas relaciones con otros conceptos
dónde reside su significado. El significado de "mesa" vendría dado por su relación con el concepto más general de
"mueble" al que está unido por la relación "es un" (una mesa es un mueble), con el concepto "patas" mediante la
relación "tiene" (la mesa tiene patas), con los conceptos, "madera", "silla", etc. La teoría de rasgos, en cambio, defiende
que lo que está representado en la memoria no son los conceptos, sino los rasgos que definen a esos conceptos. El
concepto "mesa" estaría representado en el mismo sistema semántico mediante los rasgos “es un mueble”, “tiene
cuatro patas”, “es de madera”, etc. Es difícil probar experimentalmente cuál de estas dos teorías es la correcta ya que
tienen muchos aspectos en común y prácticamente hacen las mismas predicciones. Hollan (1975) llega incluso a afirmar
que estas dos teorías son isomórficas y sólo difieren en su aspecto externo. Para Hollan la teoría de rasgos podría ser
reformulada como una teoría de redes sin pérdida alguna de su poder explicativo y viceversa.
Sí está bastante claro, en cambio, cuáles son los tipos de categorías en las que se agrupan los conceptos. Se sabe, por
ejemplo, que esas categorías no son producto de una peculiar organización innata del sistema semántico, sino que son
resultado del aprendizaje. Así, una de las distinciones más generales de los conceptos en nuestro sistema semántico es
la de seres vivos vs artefactos. Esta división obedece a las características que distinguen a unos y otros. Mientras que los
seres vivos se diferencian por sus rasgos perceptivos (la trompa del elefante, las rayas del tigre, etc.) los artefactos
tienen unos rasgos que permiten deducir su función (la hoja afilada del cuchillo permite deducir que sirve para cortar,
las ruedas de la carretilla que sirve para rodar, etc.). Incluso estas dos categorías podrían almacenarse en zonas distintas
del cerebro; en este sentido, la categoría seres vivos podría estar situada en la zona témporo-límbica, mientras que la
categoría artefactos estaría por la zona frontoparietal (Gonnerman, Devlin, Kempler, Seidenberg y Andersen, 1996). Y de
hecho, como veremos más adelante, se han encontrado pacientes que tienen dañados los conceptos pertenecientes a
una de estas categorías y no a la otra.
Otro dato bien establecido es que el sistema semántico es común para todas las modalidades perceptivas. Mientras
que el léxico auditivo sólo sirve para reconocer las palabras que nos llegan a través del lenguaje oral, las
representaciones del sistema semántico se activan igual para cualquier modalidad perceptiva. El concepto “manzana” se
activa de la misma manera cuando escuchamos la palabra /manzana/, cuando leemos la palabra “manzana”, cuando
vemos un dibujo de una manzana, cuando nos llega el olor de manzana, etc. No obstante, esta opinión no es compartida
por todos los investigadores. Shallice (1988), por ejemplo, afirma que existen diferentes sistemas semánticos: un
sistema semántico verbal para la comprensión de palabras, un sistema semántico pictórico para la comprensión de
dibujos, etc. Pero los datos de los pacientes que sufren lesión en el sistema semántico apoyan más la existencia de un
sistema semántico único.
En cualquier caso, hemos de reconocer que a pesar de los muchos avances que últimamente se están consiguiendo,
el sistema semántico sigue siendo el almacén menos conocido de cuantos
intervienen en la comprensión del lenguaje.
Ya para terminar este apartado de percepción de habla, vamos a exponer
en forma de diagrama y a modo de resumen los procesos que intervienen en
la comprensión de una palabra hablada. Primero comienzan a funcionar los
procesos de análisis auditivo, y bajo este término englobamos todos los
estadios de análisis acústico, análisis fonético y análisis fonológico y/o
silábico. Después la identificación de la forma fonológica en el léxico auditivo
y finalmente la activación del significado en el sistema semántico. (Fig. 4).
En este modelo, la activación iría del nivel conceptual al nivel del lemma, de éste al lexema para finalmente activar
los fonemas. Y los tipos de errores en este caso podrían ser de tres tipos. Cuando el error se produce en el nivel
conceptual la palabra seleccionada sería una relacionada semánticamente (“gato” por “perro”, “primo” por “sobrino”,
etc.). Cuando ocurre a nivel de léxico fonológico la palabra seleccionada sería una relacionada fonológicamente (“prisa”
por “brisa”). Y los errores tan frecuentes de cambiar una palabra por su antónimo (“arriba” por “abajo”, “ayer” por
“mañana”, etc.) y que en otros modelos se explican a nivel semántico, en éste de tres estadios se explicaría a nivel de
lemma.
Este modelo de tres estadios se encuentra actualmente sometido a fuerte discusión, ya que algunos autores
(Caramazza, 1997) sostienen que no es necesario postular que este estadio del lemma se encuentre intermedio (y
obligatorio) entre los estadios semánticos y léxico, sino que se puede acceder a él de forma independiente.
Procesos articulatorios
En cualquiera de los casos, una vez seleccionados, los fonemas son retenidos en un almacén a corto plazo,
denominado retén de respuesta, mientras se preparan las órdenes articulatorias que posibilitan su emisión. Cualquiera
que sea la tarea (denominación, lectura en voz alta, repetición, etc) los fonemas tienen que esperar un breve tiempo
para que puedan ser articulados de una manera ordenada. Este almacenamiento es muy
breve, pues el almacén no dispone de capacidad para repetir una palabra larga
(especialmente si es desconocida) es fácil que nos olvidemos de algún fonema antes de
terminar de pronunciarla.
Finalmente entran en funcionamiento los procesos motores. Pero para ello, es
necesario comenzar por especificar los rasgos articulatorios que tenemos que producir.
Es así, porque como ya hemos dicho, los fonemas son entidades abstractas que aglutinan
todos los sonidos de un idioma; de ahí que cuando tenemos que pronunciarlos, tenemos
que buscar las formas concretas que vamos a usar en ese momento y que
constituyen los fonos. Cada fono tiene unos rasgos articulatorios determinados y
para producirlos se ponen en funcionamiento los procesos motores encargados de
mover los órganos del aparato fonador. Cada fonema, o quizás cada sílaba (al
menos en idiomas como el español) tiene establecido un código desde el cuál salen
las órdenes a los músculos que intervienen en la fonación: laringe, lengua, labios,
etc. Estos programas motores están automatizados, lo que nos evita tener que
pensar en los movimientos que tenemos que realizar cuando queremos expresar
una palabra.
Este es el esquema de los procesos que intervienen en esta última etapa de
producción del habla, desde el retén de respuesta. (Fig. 8).
Repetición
Otra tarea del lenguaje oral de la que también tenemos que dar cuenta es la repetición, pues aunque no el lo más
común, a veces, cuando escuchamos una palabra tenemos que repetirla, bien porque así lo exige la tarea, bien porque
no estamos seguros de haberla escuchado correctamente y la exponemos en voz alta para asegurarnos de que es eso lo
que hemos oído, o para que nuestro interlocutor nos confirme que es eso lo que ha dicho. La repetición implica
procesos tanto de comprensión como de producción ya que para poder decir la palabra primero tenemos que percibirla.
De acuerdo con los modelos expuestos anteriormente, estos serían los procesos que implica la retención de una
palabra. En primer lugar, análisis auditivo con el fin de identificar los fonemas. Después, activación de la representación
de la palabra en el léxico auditivo y del correspondiente significado en el sistema semántico. A continuación, activación
de la forma fonológica en el léxico fonológico. Finalmente, activación de los fonemas que componen esa palabra y
articulación de los mismos.
No obstante, no es éste el único camino posible para llevar a cabo la repetición ya que
sabemos que a veces repetimos las palabras que nos piden que repitamos sin entrar en
su significado. Esto es posible a través de la conexión directa que existe entre el léxico
auditivo y el léxico fonológico sin pasar por el sistema semántico.
También podemos repetir palabras que no hemos escuchado antes e incluso palabras
inventadas (pseudopalabras), que por lo tanto no pueden estar representadas en el
léxico. Para repetir estos estímulos es necesario postular una vía no léxica que permita la
repetición mediante algún mecanismo diferente. A este mecanismo se le denomina de
conversión acústico en fonológico y funciona identificando cada fonema y activando los
programas encargados de pronunciar esos fonemas.
En el diagrama que se expone a continuación aparecen todos los procesos que
intervienen en el lenguaje oral, tanto en comprensión como en producción. En ese
gráfico se señalan las tres vías que se pueden seguir en repetición: en línea discontinua
la que se utiliza para repetir palabras desconocidas, en línea continua la ruta léxica
asemántica, utilizada para repetir palabras conocidas pero sin entrar en el significado y
en línea gruesa la ruta semántica, que se emplea cuando además de repetir la palabra se
comprende su significado. (Fig. 9).