Fonología Italiana
Fonología Italiana
Fonología Italiana
Marco Svolacchia
PREMESSA
1
INTRODUZIONE
fusione delle tecnologie informatiche, l’analisi acustica è diventata facilmente abbordabile per
chiunque, anche per chi che non dispone di risorse esclusive. Lo stesso non può dirsi per la ri-
cerca sperimentale in fonetica articolatoria, che resta ancora un settore che richiede laboratori
estremamente specializzati e costosi. La fonetica uditiva, infine, è la branca della linguistica al
momento meno sviluppata e conosciuta.
1.2.2. Fonologia
È evidente che i diversi meccanismi che realizzano la fonazione non sono che strumenti della
mente, ovvero dei componenti mentali a questo predisposti, i quali forniscono le istruzioni ne-
cessarie alla realizzazione di ogni compito. Prima che un messaggio possa essere convertito in
suoni è necessaria un’accurata programmazione. Questa, a sua volta, è possibile solo sulla base
di una serie di informazioni, dati e istruzioni operative, che sono depositate nella mente in qual-
che forma. Dopo essere stati prodotti e percepiti, i suoni linguistici devono essere interpretati
linguisticamente. Di nuovo, questa interpretazione può solo avvenire sulla base di un sistema
complesso di informazioni depositate nella mente.
È probabile che queste considerazioni possano sembrare inutilmente cerebrali ai non ad-
detti ai lavori. Eventualmente, ciò è vero solo perché non si è consapevoli dell’incredibile spe-
cializzazione cerebrale e neuromuscolare che permette questa attività negli esseri umani, i soli
in grado di realizzarla. Ma si immagini quanto la nostra mente deve fare quando è sottoposta ad
un messaggio sonoro come in una normale conversazione. Deve computare un’enorme massa di
informazioni sonore che arrivano a grande velocità e in condizioni tutt’altro che ideali: non
conversiamo normalmente in un laboratorio insonorizzato; il parlante spesso e volentieri ipoar-
ticola, termine grosso modo corrispondente al più comune “si mangia le parole”, ecc.
In realtà, c’è molto di più: non è solo l’aspetto quantitativo che stupisce ma anche e so-
prattutto la complessità delle informazioni elaborate. Oltre alle informazioni connesse col rico-
noscimento delle parole (i segmenti di suono e, eventualmente, l’accento o il tono, a seconda
delle lingue e dei casi), un ascoltatore deve decodificare tutti quei segnali paralleli correlati alla
durata, al ritmo e all’intonazione. Tutti questi segnali sono sovrapposti in modo assolutamente
intricato (p.e. un tono alto può essere un segnale tanto di accento, tanto di un elemento intonati-
vo) e hanno per lo più un valore relativo (p.e. una sillaba è considerata accentata non perché sia
associata ad un valore, di forza e/o durata e/o altezza, assoluto e definito ma perché in quel con-
testo è contrassegnata da un valore più alto rispetto ad un’altra sillaba).
Un barlume della realtà ci appare solo quando siamo esposti ad enunciati di una lingua
che non conosciamo, o anche, in una certa misura, che conosciamo ma non come lingua madre:
è esperienza comune che, a seconda dei casi, non si riesca a delimitare i segmenti di suono, e
ancor meno a identificarli con sicurezza. Non stupisce il fatto che non esistano macchine (ovve-
ro software) che possano compiere questa analisi; anzi, un risultato del genere è tuttora incon-
cepibile. Il fatto che la nostra mente riesca in questa impresa con la rapidità, facilità e precisio-
ne che conosciamo accresce l’impressione che si tratti di un’attività molto semplice. In realtà, è
naturale per gli esseri umani solo per due ragioni: la prima è che gli strumenti e le istruzioni ge-
nerali che permettono l’elaborazione del suono linguistico sono parte del nostro bagaglio gene-
tico, e come tali inaccessibili alla nostra consapevolezza e al nostro apprezzamento; la seconda
è che le istruzioni linguo-specifiche, che sono acquisite successivamente e che rinforzano la de-
codifica di una particolare lingua umana, vengono assunte con sforzo e consapevolezza irrisori
durante il processo di acquisizione della propria lingua madre, risultato anch’esso del nostro “i-
stinto linguistico”.
Queste considerazioni hanno delle conseguenze importanti per lo studio del linguaggio,
perché l’osservazione di una gran massa di dati proveniente da molte lingue diverse ha mostrato
inequivocabilmente che il modo in cui noi interpretiamo e computiamo le sequenze foniche può
essere significativamente diverso rispetto alla realtà strettamente fisica, ovvero da quello che
appare in base ai dati articolatori e acustici. Ci sono almeno due ragioni per questo. La prima è
che non è detto che il modo in cui una macchina analizza il suono sia identico a quello in cui
noi lo percepiamo; in altre parole, esistono differenze di hardware, per così dire. La seconda, e
di gran lunga più importante, è che gli algoritmi di elaborazione del suono del software esisten-
Principi di Fonologia
te ha poco a che vedere con i criteri che la mente umana utilizza per elaborare e categorizzare i
suoni linguistici. Di questo verrà data ampia illustrazione nel corso della trattazione.
Questo campo di indagine, che potremmo chiamare la “fonetica umana”, costituisce
l’essenza della fonologia.
AVULSIVI [ÿ, Ÿ, –, †]
Questi suoni, detti comunemente ‘click’, consistono di una doppia occlusione, una, quella fondamenta-
le, con la parte posteriore della lingua (postdorso), l’altra con un altro articolatore orale (le labbra o
una parte della lingua). Il rilascio di quest’ultimo crea una depressione nella cavità orale, con conse-
guente risucchio e emissione sonora. Questo tipo di fonazione viene utilizzata con valore distintivo
(cioè per codificare le parole di una lingua) solo in pochissime lingue del mondo, tutte parlate in una
ristretta area geografica, l’Africa australe, e per lo più appartenenti alla stessa famiglia, quella Khoisan
(boscimano e ottentotto). In molte altre comunità linguistiche, tra cui la nostra, questi suoni sono im-
piegati solo per scopi comunicativi particolari – p.e. per negare, per richiamare un cucciolo, incitare un
cavallo, ecc. – ma non sono parte della lingua italiana, non di più di quanto lo sia, p.e., il gesto del ne-
gare fatto col capo.
INGRESSIVI [„, –, µ]
Anche questo tipo di fonazione consiste di una doppia occlusione, quella fondamentale a livello della
laringe, l’altra con un altro articolatore orale (labbra, parte anteriore della lingua, dorso della lin-
gua). L’aria viene modificata in entrata, a seguito di una depressione creata da un deciso movimento in
basso della laringe. Si può pensare a questo proposito a quando si fischia aspirando l’aria piuttosto
che, come è più normale, espirandola.
2
FONOLOGIA SEGMENTALE
di ostruzione”. Per questa ragione è ormai assunto a un sistema “preteorico”, un quadro neutro
di riferimento convenzionale. Ne consegue che non si può prescindere da entrambi i modelli.
Luogo (o punto) di articolazione: il punto della cavità orale in cui avviene la modificazione della cor-
rente d’aria (p.e. dentale = al livello dei denti superiori; velare = al livello del velo palatino).
Modo di articolazione: il tipo di modifica che un articolatore effettua sulla corrente d’aria (p.e. occlusi-
va = ostruzione totale; approssimante: ostruzione debole).
Sonorità: presenza o assenza della vibrazione glottidale.
Anteriorità/posteriorità: il movimento orizzontale, avanti/indietro, del dorso della lingua.
Altezza: il movimento verticale, alto/basso, del dorso della lingua.
Arrotondamento: presenza/assenza dell’articolazione delle labbra in una configurazione grosso modo
circolare.
Un’applicazione tipica del sistema IPA si ha negli inventari fonologici, l’elenco ordinato di tutti
i segmenti di suoni distintivi di una lingua. Quelli che seguono sono gli inventari dell’italiano,
consonantico
e vocalico
È importante chiarire un equivoco abbastanza diffuso: i simboli dell’IPA non hanno un valore
univoco, perché questo varia in funzione del livello di astrazione a cui ci si riferisce. È solo dal
contesto che si può evincere il valore esatto di un simbolo. Questo è particolarmente evidente
per le vocali, in quanto intrinsecamente più difficilmente categorizzabili delle consonanti.
Nella tabella dell’inventario vocalico dell’italiano i simboli non si riferiscono a delle ar-
ticolazioni concrete ma a qualunque unità articolatoria che rientra in un certo spazio fonetico
Marco Svolacchia
convenzionalmente suddiviso. Ne consegue che lo stesso simbolo può avere valori apprezza-
bilmente diversi in lingue diverse: [i], p.e., ha un valore diverso in italiano rispetto a quello che
ha in francese o tedesco standard.
Nel caso si richieda una maggiore precisione, il sistema IPA mette a disposizione degli
strumenti supplementari. Per le vocali si ricorre al trapezio vocalico, una griglia grafica in cui si
colloca ogni vocale, che è una rappresentazione idealizzata dello spazio nella cavità orale uti-
lizzabile per l’articolazione di suoni vocalici. Tale spazio vocalico è definito dai movimenti
orizzontali e verticali del dorso della lingua (più ridotto nell’asse orizzontale e più esteso in
quello verticale rispetto a quello consonantico):
L’esatto valore di un fono è indicato dalla sua posizione nella griglia: il simbolo diventa così
ampiamente ridondante. In questo modo, l’esatta pronuncia di [i] dell’italiano sarebbe indicata
come in (a) seguente, dove quella del francese e tedesco, cardinale, sarebbe rappresentata come
in (b):
a b
Quando non viene inserito nel trapezio fonetico, il valore di un simbolo viene precisato tramite
un diacritico che indica la deviazione rispetto al suo valore tipo (più alto/basso; più avanza-
to/arretrato, ecc.). Il valore tipo di un simbolo è espresso per mezzo delle “vocali cardinali”,
rappresentate in (b) sopra. Queste sono derivate convenzionalmente, senza alcun riferimento a
dati linguistici reali, in base a criteri strettamente geometrici: si tratta dei punti estremi del tra-
pezio, con l’aggiunta delle quattro vocali medie ottenute divedendo i lati verticali in tre parti
uguali. In questo modo, [i] dell’italiano sarebbe trascritto in modo più preciso come [ i Ñ]. I dia-
critici vengono utilizzati anche per sottospecificare le consonanti.
Si noterà che il sistema non prevede vocali cardinali interne. Questo rende il sistema in-
determinato per le vocali centrali, lasciando il campo libero a personalizzazioni, in primis sulla
base della lingua o delle lingue dominanti tra i fonetisti al momento della prima fissazione del
sistema. Un esempio è il simbolo [a], che nell’IPA designa una vocale bassa anteriore (non ar-
rotondata) e non, come è uso comune da parte di molti fonetisti e fonologi, una vocale bassa
centrale, che andrebbe invece trascritta canonicamente con un diacritico di ‘centralità’ [ä].
Questo contrasto deriva dal fatto che il francese e l’inglese non hanno una vocale bassa centra-
le, quale invece ricorre in moltissime lingue del mondo, tra cui l’italiano. I parlanti di questi si-
stemi trascriveranno una vocale bassa anteriore piuttosto come [a+], con un diacritico di avan-
zamento. Anche qui si è seguita questa convenzione.
L’inventario dell’italiano dato sopra elenca i fonemi, i segmenti di suono distintivi
dell’italiano, ovvero tutte e solo quelle proprietà di un segmento di suono in grado di differen-
ziare una parola da un’altra. Vengono invece ignorate le proprietà di suono “accessorie”, ovve-
ro gli automatismi che dipendono dal contesto in cui un fonema si trova (p.e. il fonema /s/ non
viene pronunciato in modo identico in snaturato e in scontento), o che sono un modo un po’ di-
Principi di Fonologia
verso di pronunciare un fonema, in dipendenza dei diversi parlanti o della situazione in cui uno
stesso parlante si trova (p.e. dopo una vocale /s/, p.e. in rosa, può venire occasionalmente pro-
nunciata sonora dai parlanti del Centro e del Sud d’Italia).
Esamineremo ora alcune caratteristiche problematiche del sistema.
Alcuni fonetisti hanno integrato l’altro parametro vocalico fondamentale, il movimento oriz-
zontale della lingua, nel sistema generale, sostituendo i valori di anteriorità posteriorità con
specificazioni di luogo di articolazione, analogamente alle consonanti. Lo spazio vocalico vie-
ne ad essere così categorizzato come quell’area della cavità orale che va dal palato (da cui risul-
tano le vocali anteriori) al velo palatino (da cui risultano le vocali posteriori). Le vocali centrali
si producono quando il dorso della lingua punta verso un punto intermedio tra il palato e il ve-
lo, convenzionalmente chiamato prevelo.
una combinabilità naturale, sebbene non deterministica: un articolatore mira normalmente in di-
rezione del punto della cavità orale più immediatamente accessibile, tale da comportare il minor
sforzo articolatorio.
Per il punto velare, p.e., che è situato molto all’interno della cavità orale, è la parte poste-
riore della lingua (il postdorso) che articola; per quello dentale è la parte anteriore (la corona),
per i foni gutturali (uvulari e faringali) è la radice della lingua che articola, ecc. Dato un punto
d’articolazione, perciò, ne consegue per lo più automaticamente l’articolatore attivato. Per que-
sta ragione in IPA l’articolatore è normalmente sottaciuto ([t], p.e., è descritto come dentale,
non come coronale-dentale). In caso di ambiguità, quando esistono foni in cui articolatori di-
versi puntano verso lo stesso luogo di articolazione, si ricorre alla doppia denominazione artico-
latore-luogo di articolazione per il fono che consiste nell’abbinamento meno prevedibile: per
[f], p.e., si parla di labiodentale, mentre per [t] solo di dentale, piuttosto che di ‘coronodentale’,
in base all’assunto che l’articolatore standard per i denti sia la CORONA e non il LABBRO
INFERIORE.
Esistono anche combinazioni articolatore-punto di articolazione meno ovvie, che richie-
dono maggiori specificazioni e che risultano linguisticamente relativamente rare. Un esempio è
quello dei foni variamente denominati retroflessi, postalveolari, cacuminali, per riferirsi ad ar-
ticolazioni in cui è la corona, e non il predorso (la parte anteriore del dorso), come sarebbe più
naturale, ad articolare contro un punto dietro gli alveoli. Per ottenere questo risultato la lingua
si deve retroflettere, compiendo un movimento poco agevole.
Altre combinazioni articolatore-punto di articolazione sono invece estremamente rare o
addirittura escluse. Non si conoscono, p.e., lingue che presentino foni labioalveolari.
C’è un’altra possibile ragione per cui il criterio del luogo di articolazione può essere più
fondato di quanto possa apparire a prima vista: è stato proposto che nella cavità orale (nella
parte superiore, in effetti) ci siano dei punti specifici che forniscono l’appropriato feedback
propriocettivo ai vari articolatori quando vengono attivati.
essere una teoria della “fonetica universale”, tale, cioè, che specifichi tutte e solo le possibilità articolato-
rie del linguaggio umano. Si accontentava di essere in grado di categorizzare e trascrivere qualunque fono
di qualunque lingua del mondo. Il problema è che prevede anche molti foni che non esistono in nessuna
lingua umana. Limitandosi a un livello molto superficiale di analisi, non riesce a cogliere molte caratteri-
stiche importanti dei sistemi di suoni del linguaggio. In sintesi, l’IPA è un sistema poco “ristretto”. Questo
aspetto si nota particolarmente a proposito della relazione tra luogo e modo di articolazione: l’IPA preve-
de in linea di principio molte combinazioni tra i due parametri che sono invece impossibili. Un esempio è
dato dal luogo di articolazione faringale, che è utilizzato solo da foni fricativi. Questo non è un problema
per il sistema: la casella corrispondente viene lasciata vuota, pronta ad essere riempita nel caso in cui si
scoprisse una lingua con occlusive faringali. Il problema è che non possono esistere lingue simili. La ra-
gione è che l’articolatore utilizzato per produrre questi foni, la radice della lingua, non è in grado di bloc-
care completamente il passaggio dell’aria puntando contro la cavità faringea, come è invece in grado di
fare quando punta al luogo immediatamente più avanzato, l’uvula (come per l’occlusiva [q]).
Vi sono buoni motivi per considerare anche le consonanti bilabiali e labiodentali due varianti di
uno stesso luogo di articolazione. Uno è che incrociando i due parametri ci dovremmo aspettare un buon
numero di lingue con quattro serie di consonanti labiali (sorde):
BILABIALI LABIODENTALI
OCCLUSIVE p –
FRICATIVE (F) f
Ma un sistema del genere non esiste: solo [p] e [f] sono comuni; [F] è una rara alternativa di [f] e la labio-
dentale occlusiva è inesistente. Quindi, di quattro possibilità se ne realizzano solo due. Considerazioni si-
mili valgono per le dentali e le alveolari. Queste osservazioni richiedono la seguente semplificazione dei
luoghi di articolazione:
LABIALE DENTOALVEOLARE
2.4.1. Articolatori
Gli articolatori sono sei. Il primo articolatore che la corrente d’aria polmonare incontra è costi-
tuito dalle cosiddette corde vocali, che si trova nella cavità laringea. Al di là del nome pittore-
sco, si tratta di due membrane contenute nella laringe, la formazione cartilaginea nota come
“pomo di Adamo”, perché più visibile esternamente nell’uomo che nella donna. Queste mem-
brane possono essere azionate simmetricamente in modo da accostarsi o allontanarsi, sia per
l’intera lunghezza sia, grosso modo, per una solo metà (le due parti inferiori si chiamano arite-
noidi). Quando vengono accostate senza eccessiva tensione, le corde vocali vibrano sotto
l’azione della corrente polmonare e producono il cosiddetto tono glottidale, senza il quale non
esisterebbe la fonazione come la conosciamo.1 Questa vibrazione caratterizza i foni sonori.
Il secondo articolatore è il velo palatino (detto anche palato molle in quanto membrano-
so, a differenza del resto del palato, detto duro perché osseo), che si trova nella cavità faringea,
e che abbassandosi mette in comunicazione la faringe con la cavità nasale e produce suoni na-
salizzati.
1
L’importanza fondamentale della laringe nella fonazione umana è sottolineata dal fatto che essa è configurata in
modo diverso che in qualsiasi altro animale. Lungo la linea evolutiva dell’uomo si è verificata una drastica mutazione
della posizione della laringe, che si è abbassata lungo la cavità faringea, come risulta evidente dal contrasto con
l’apparato fonatorio degli altri primati, in cui essa è posta immediatamente al di sotto della radice della lingua. In
conformità con la nota generalizzazione darwiniana (“L’ontogenesi riassume la filogenesi”), una traccia di questa e-
voluzione è visibile nei neonati al di sotto dei tre mesi, in cui la laringe ha una posizione simile a quella dei primati
non umani.
Marco Svolacchia
10
Nella cavità orale si trova la lingua, che, per le sue caratteristiche anatomiche e neuro-
muscolari, è l’articolatore per eccellenza. Dato che la lingua presenta una grande reattività e
analiticità, essa funziona in realtà come tre articolatori diversi, essendo possibile attivare la
parte anteriore, la corona, quella mediana, il dorso, e la radice. Quest’ultima è situata tra la
cavità orale e quella faringea: per questo alcuni la considerano un articolatore della cavità
faringea. La lingua può anche effettuare articolazioni complesse, venendo attivata
contemporaneamente in due parti diverse, p.e. la corona e il dorso (come per la ‘dark l’
dell’inglese, in parole come tall).
Le labbra, il labbro inferiore in particolare, sono un articolatore di grande importanza,
potendo da solo produrre delle articolazioni orali complete (p.e. [p, m]), o fornendo
un’articolazione secondaria, specialmente nelle vocali, in concomitanza con un altro articolato-
re (p.e. [u]).
Inversamente all’IPA, dove l’articolatore e il suo movimento sono normalmente desunti
dal luogo o dal modo di articolazione (se un fono è “nasale”, p.e., ne consegue che il velo pala-
tino è abbassato), per ogni fono in questo sistema va specificato ogni movimento che
l’articolatore effettua.
Quella che segue è una tabella schematica che dà una visione d’insieme del sistema degli
articolatori. Nella prima colonna è riportata la cavità in cui l’articolatore è situato; nella secon-
da l’articolatore, che può essere attivato (+) o meno (-); nella terza i movimenti possibili attuati
(+) o meno (-); nella quarta colonna alcuni esempi di foni caratterizzati dalla proprietà positiva
o negativa in oggetto:2
2
Questo sistema può sembrare molto complesso a prima vista, ma bisogna ricordare che è costruito per rendere conto
di tutte le possibilità articolatorie del linguaggio umano, ovvero, minimamente, di tutti i foni di tutte le lingue passate
e presenti (e future). Applicato a una singola lingua, che seleziona solo una parte delle possibilità articolatorie uni-
versali, esso apparirebbe sensibilmente più semplice. Al fine di rendere più trasparente la relazione con gli articolato-
ri, i termini utilizzati differiscono in alcuni casi da quelli standard (p.e. si parla di [±labbra] invece di [±labiale]).
Principi di Fonologia
11
Come la tabella evidenza, i movimenti sono attribuiti ai singoli articolatori, piuttosto che essere
espressi in termini astrattamente generali. Questo non deve stupire dal momento che gli artico-
latori sono estremamente eterogenei tra loro, conseguenza del fatto che essi hanno ciascuno una
funzione primaria che non ha nulla a che vedere con la fonazione. Infatti, la fonazione è un suc-
cesso evolutivo di rifunzionalizzazione aggiuntiva di organi utilizzati (e che continuano ad es-
sere utilizzati) per la respirazione e l’alimentazione.
Un fono è l’insieme di tutti i movimenti effettuati dagli articolatori simultaneamente. Nel
gergo specifico si parla di “tratti distintivi” di un fono. A differenza dell’IPA, tutti i tratti sono
binari. Un fono come [m], p.e., è caratterizzato dai tratti seguenti (in cui ‘Ø’ indica che il tratto
non è rilevante):
LABBRA -arrotondate
CORONA Ø
DORSO Ø
RADICE Ø
VELO +abbassato
-serrate
CV
+accostate
La tabella di sopra equivale a “[m] è prodotta attivando le labbra senza arrotondamento, con il
velo palatino abbassato e le corde vocali accostate ma non serrate; gli altri articolatori sono a
riposo”.
2.4.2. Ostruzione
L’altro parametro fondamentale, il tipo di ostruzione, è correlato al grado di opposizione al pas-
saggio dell’aria provocato da un’articolazione. Pertanto, a differenza che per gli articolatori, i
tratti che riguardano il tipo di ostruzione tendono ad essere molto generali. Anche tutti questi
tratti sono binari. La tabella che segue illustra il sistema del tipo di ostruzione:
OSTRUENTI SONORANTI
p, t, k; f, Q, x s, S l, á m, n, N; r, Ü, R; j, i &, i, e, E, é
– STRIDULE STRIDULE LATERALI – LATERALI
CONSONANTI VOCALI
p, t, k; m, n, N; f, s; x; l, á; r, Ü, R j, i &, i, e, E, é
– CONTINUE CONTINUE
Il tratto [±sonorante] divide i foni in due gruppi: sonoranti, articolati al di sopra di un livello
soglia di ostruzione, e ostruenti, articolati al di sotto di un livello soglia di ostruzione. Questo
livello soglia, per quanto difficile da definire, non è convenzionale ma si manifesta attraverso
una proprietà facilmente riscontrabile. I suoni articolati con poca ostruzione complessiva sono
articolati preferenzialmente sonori; quelli articolati con elevata ostruzione, viceversa, sono arti-
colati preferenzialmente sordi. Il senso di “preferenzialmente” viene chiarito tramite i seguenti
universali implicazionali che si applicano agli inventari fonologici:
a. una sonorante sorda implica una sonorante sonora;
b. un’ostruente sonora implica un’ostruente sorda.
(a) prevede che una lingua non possa avere una sonorante sorda senza avere la sonorante corri-
spondente sonora; (b) prevede che una lingua non possa avere un’ostruente sonora senza avere
la corrispondente sorda. Ne consegue che le lingue del mondo potranno avere i seguenti tipi di
inventari fonologici
i. sonoranti sonore, ostruenti sorde;
ii. sonoranti sonore e sorde, ostruenti sorde;
iii. sonoranti sonore, ostruenti sorde e sonore;
Marco Svolacchia
12
13
che si applicano, variamente, a tutti gli articolatori, a gruppi di articolatori (p.e. a seconda della
cavità in cui sono situati) o almeno a più di uno. In questa categoria rientra il tratto [continuo],
che designa il grado totale vs. parziale che un qualunque articolatore orale deve realizzare. Ma
che cosa si può dire del tratto [sonorante], che non realizza nessuna specifica istruzione artico-
latoria? Nasali e vocali basse sono entrambe sonoranti, sebbene siano agli antipodi dal punto di
vista articolatorio: completamente ostruite a livello della cavità orale le une, per nulla le altre. Il
tratto [stridulo], d’altra parte, si riferisce forse solo ad un unico articolatore, la corona, come
abbiamo visto. Perché non viene allora integrato nel sistema dell’Articolatore? Anche per il
tratto [laterale] valgono considerazioni simili.
Un altro aspetto poco convincente riguarda il valore binario dei tratti di ostruzione. In re-
altà, alcuni dei tratti proposti sembrano rientrare nella stessa categoria. Così, i tratti [consonan-
tico], [sonorante] e [continuo] sembrano valori disposti lungo un continuum di grado di emis-
sione d’aria, come mostrato di seguito:
+ < G R AD O D I E M I S S I O N E D ’ A R I A > –
Una ragionevole conclusione è che la teoria dell’ostruzione è ancora lontana dall’essere soddi-
sfacente e che è possibile che in futuro venga radicalmente modificata.
2.5. Marcatezza
Sarà evidente che la teoria appena illustrata suggerisce una concezione della fonazione più a-
stratta di quella tradizionale. Ci sono buone ragioni, infatti, per ritenere che da un punto di vista
mentale la fonazione consista nella scelta obbligata tra una serie di opzioni. Ogni articolatore
impone l’opzione di essere o meno attivato. Il velo palatino, per esempio, presenta l’alternativa
Marco Svolacchia
14
di essere sollevato o abbassato, le corde vocali di essere accostate o meno, ecc. Da questo punto
di vista, anche il non attivare un articolatore è un aspetto della fonazione quanto l’attivarlo. Ma
non sarebbe più giusto dire che non attivare un articolatore è più naturale e semplice che
l’attivarlo? In generale la risposta è sì. Banalmente, un’articolazione complessa (= con doppia
articolazione) è meno naturale (tecnicamente: più ‘marcata’) di una semplice, una vocale orale
più naturale di una nasalizzata, ecc. Le cose, però, sono un po’ più complicate.
È evidente che da un punto esclusivamente articolatorio è più economico attivare meno
articolatori possibile. Ma il meccanismo articolatorio interagisce con quello uditivo. I foni de-
vono essere anche ben udibili e distinguibili tra loro, oltre che “facili da pronunciare”. Questo
determina che ciò che è naturale e normale non è assoluto ma relativo alla classe
d’appartenenza di un fono. La labializzazione (o arrotondamento delle labbra), p.e., è di per sé
un “di più” articolatorio; tuttavia le vocali posteriori sono di norma arrotondate. Sono le vocali
posteriori non arrotondate ad essere marcate; per questa ragione sono assai più rare delle poste-
riori arrotondante nelle lingue del mondo. Un altro caso è dato dalla sonorità, che è naturale per
le sonoranti ma un’aggiunta per le ostruenti.
Cosa significa tutto ciò per la fonazione? L’idea è che quando articoliamo un fono non
siamo obbligati a scegliere tra tutte le opzioni, perché un valore di ogni tratto è predeterminato
dal sistema. Questo valore dipende dalla classe a cui un fono appartiene. Un’occlusiva, p.e., che
è un’ostruente, sarà automaticamente sorda: le corde vocali non si accosteranno e non si pro-
durrà vibrazione. Al contrario, per articolare un’occlusiva sonora è necessario che questa istru-
zione venga espressamente comunicata alle corde vocali. Detto in altre parole, si ritiene che la
fonazione sia costituita da un certo numero di scelte automatiche “fino a prova contraria”, in un
certo senso quindi di non scelte. Questo è in definitiva quello che s’intende con marcatezza/non
marcatezza.
Una serie di esperimenti condotta dal linguista Greenberg e dallo psicologo Jenkins (Gre-
enberg & Jenkins,1964) mostra con evidenza quanto il concetto di marcatezza fonologica sia
mentalmente reale. Alcuni parlanti di inglese americano furono sottoposti a un serie di stimoli
sonori in forma di coppie di occlusiva + /a/ (i.e. pa/ta, pa/ka, pa/ba, pa/da, pa/ga, ecc.) e venne-
ro richiesti di dare delle valutazioni riguardo al grado di differenza tra i due elementi di ciascu-
na coppia. I giudizi sulla somiglianza dei suoni risultanti si accordano strettamente con l’analisi
dei tratti distintivi: più tratti una coppia di suoni condivide più simili questi vengono giudicati (i
suoni della coppia p/t, p.e., che differiscono solo per il tratto di articolatore/luogo di articola-
zione, vennero giudicati sensibilmente più simili dei suoni nella coppia p/d, che differiscono
anche per il tratto di sonorità). Una serie di giudizi risultò però sorprendente (ma solo in
un’ottica strettamente fonetica): i soggetti valutarono come più simili tra loro (fino a circa il
100% in alcuni casi) i suoni di coppie occlusiva-sonora/occlusiva-sonora rispetto a quelli di
coppie occlusiva-sorda/occlusiva-sorda. In altre parole, le sillabe /ba, da, ga/ sono percepite più
simili tra loro rispetto alle sillabe /pa, ta, ga/. Come si spiega un fatto simile? Da un punto di vi-
sta astratto, tra le occlusive all’interno di entrambi le serie esattamente intercorrono le stesse
differenze: [pa:ta:ka] = [ba:da:ga]. Tuttavia, nell’ottica della teoria della marcatezza, il risultato
è spiegabile in modo naturale: le occlusive sonore sono più simili tra loro rispetto alle sorde
perché condividono un tratto in più, la sonorità. A questo proposito, si ricordi che (a) nelle o-
struenti la sonorità è un tratto aggiuntivo (marcato) e (b) condividere un tratto non è la stessa
cosa che condividere la mancanza dello stesso, come la tabella seguente mostra:
p, t, k b, d, g
CONSONANTE + +
SONORANTE – –
CONTINUA – –
SONORA Ø +
15
ciati dal bambino (e tra gli ultimi ad essere persi dall’afasico), sono quelli più rappresentati nel-
le lingue del mondo e godono di alcune prerogative a livello sillabico (p.e. s impura e coda di
sillaba in italiano). Molto naturale è anche l’articolatore labiale, che, insieme al precedente, è
utilizzato universalmente nelle lingue del mondo. Il dorso, pur essendo assai utilizzato nelle
lingue del mondo, non è però universale: in pochissime lingue del mondo non esistono conso-
nanti velari. Inoltre, negli inventari fonologici delle lingue del mondo, le consonanti dorsali so-
no in genere di numero inferiore rispetto a quelle coronali e labiali. Anche da parte dei bambini
piccoli il dorso viene utilizzato relativamente tardi per articolare consonanti e viene sostituito
dalla corona (p.e. macchina, pronunciato [mat:ina]. Questa è un’altra delle ragioni per cui si ri-
tiene che la corona sia l’articolatore meno marcato (ovvero più naturale).
La radice della lingua è meno utilizzata come articolatore primario. Per questo i foni gutturali
(faringali e uvulari) sono relativamente rari nelle lingue del mondo.
OCCLUSIVE p b t d k g
FRICATIVE f v s – – –
Stesse indicazioni provengono dal linguaggio dei bambini, che presenta all’inizio solo occlusi-
ve (p.e. sasso viene pronunciato [tat:o]).
Tutte le lingue hanno vocali, quasi tutte hanno nasali, ma alcune non hanno le liquide, in
particolare le vibranti. Del resto, mentre i bambini imparano ben presto a produrre vocali e na-
sali, impiegano molto più tempo a produrre le liquide, le vibranti in particolare.
16
Questo non significa però che le vocali non vengano mai pronunciate parzialmente o comple-
tamente sorde in nessuna lingua. In giapponese, p.e., una vocale alta si desonorizza in un conte-
sto sordo: in hito, ‘uomo’, p.e., i è pronunciata sorda (e nel parlato veloce diventa muta) perché
circondata da consonanti sorde. Ma si tratta di un automatismo, limitato a uno specifico conte-
sto, che si sovrappone a un automatismo più generale. Anche qui la sonorità non serve a distin-
guere vocali diverse: esse saranno solo sonore, come da principio universale, eccetto che in
specifiche condizioni, dove saranno solo sorde.
Una situazione molto simile vale anche per le nasali, laterali e vibranti, che nella maggior
parte delle lingue esistono solo sonore. Non esistono però lingue dove ricorrano solo nasali o
liquide sorde. Pertanto per vocali, liquide e nasali (appunto le ‘sonoranti’) la condizione natura-
le è di essere sonore. Per le ostruenti, occlusive e fricative (e ovviamente affricate) la condizio-
ne naturale è di essere sorde. Questo non significa che non ci siano ostruenti sonore, né che es-
se siano rare, piuttosto che non si prevedono lingue che non presentino ostruenti sorde, mentre
è possibile trovare lingue che non hanno ostruenti sonore (o che ne hanno relativamente poche).
In modo formale si dice che le ostruenti sono marcate in sonorità. L’italiano esemplifica questo
principio:
Come risulta dalla tabella, in italiano si utilizzano solo sonoranti sonore. Le ostruenti, invece,
possono essere sorde e sonore. Tuttavia, non c’è una ostruente sonora senza che ci sia la corri-
spondente sorda. D’altra parte, ricorrono due ostruenti sorde, [s, S], senza le corrispettive sono-
re.
17
tura del processo viene rivelata nella sua essenza: nell’articolazione di una consonante viene
anticipato l’arrotondamento delle labbra che interessa un fono seguente. Si tratta, cioè, di eco-
nomia articolatoria: invece di inviare alle labbra due istruzioni diverse (inattive – arrotondate)
viene inviata una sola istruzione (arrotondate).
Quante sono le classi naturali? Un numero indefinito: in linea di principio, qualunque in-
sieme di tratti può definire una classe naturale. Sono i singoli processi che chiamano in causa
specifiche classi naturali. Ad alcune classi le lingue del mondo fanno riferimento assai frequen-
temente; ad altre meno.
La tabella seguente mostra alcune classi naturali vieppiù estese. Logicamente, più tratti
definiscono una classe, meno estesa questa risulta (N.B. cont.inuo, nas.ale, son.oro,
s.o.n.o.r.a.n.te, cons.onantico):
A B C
b b b
d d d
g g g
v v
–cont z z
–nas m
+son –snrt n
+son l
r
+cons
+son
La classe (a) comprende tutte consonanti occlusive (–continue) sonore; in spagnolo queste con-
sonanti diventano continue dopo una sonorante continua (p.e. guapa – la [V]uapa; balon – el
[B]alon; decena – una [D]ecena).
La classe (b) comprende tutte ostruenti sonore; in tedesco queste consonanti si desono-
rizzano in coda di sillaba (p.e. Rä.der [d] ‘ruote’ – Rad [t] ‘ruota’).
La classe (c) comprende tutte consonanti sonore; in italiano s si sonorizza davanti a que-
ste consonanti (p.e. in s-dentato, s-vogliato, s-modato s è pronunciata [z]).
Tutte le classe naturali precedenti sono definite da tratti relativi all’ostruzione. I tratti re-
lativi all’articolatore possono parimenti definire una classe naturale. Un esempio è fornito
dall’arabo egiziano. In questa lingua la consonante dell’articolo definito il, invariato per genere
e numero, in certi casi si assimila completamente alla consonante iniziale della parola a cui è
prefisso. L’assimilazione ha però luogo solo con alcune consonanti, come la tabella seguente
mostra (le consonanti sono ordinate per luogo di articolazione e seguite da un esempio):
A B
+ASSIMILAZIONE –ASSIMILAZIONE
Q, D iQ-Qaman, iD-Dahab f, b il-funduq, il-bajt
t, d it-ta?riiX, id-dars m il-madiina
s, z is-saa/a, iz-zajt j il-jawm
t, d it-taa?ira, id-dajf k, g il-kursi, il-gamal
s, z is-sadiiq, iz-zuhr w il-walad
S iS-Sams q il-qamar
n in-nahr X, ¢ il-Xamr, il-¢urfa
l il-laban Ð, / il-Ðamdu, /ajn
r ir-ra?s ?, h il-?ab, il-hawaa?
Che cosa hanno in comune tutti foni della colonna (a) che è assente in quelli della colonna (b)?
Si tratta semplicemente del tratto [+coronale]. Quindi i foni in (a) costituiscono una classe natu-
rale. Viceversa, i foni in (b) non hanno nulla in comune a parte il fatto che non sono articolati
con la corona. Non costituiscono una classe naturale ma un gruppo residuale.
È evidente che il ricorso ai tratti articolatori permette di cogliere l’essenza dei fenomeni.
Si descrive un fenomeno apparentemente complesso non come una lista della spesa (elencando
Marco Svolacchia
18
tutti i foni coinvolti) ma in modo estremamente semplice. Inoltre diventa chiara la ragione del
processo: la consonante dell’articolo, una coronale, si assimila completamente solo prima di
un’altra coronale. Questo significa che più due foni sono simili e più tenderanno a diventare i-
dentici. In altre parole, è più difficile mantenere una sequenza di istruzioni diverse di ostruzione
per lo stesso articolatore che per due articolatori diversi.
Una classe naturale può essere definita anche da tratti relativi all’ostruzione e agli artico-
latori insieme, come attesta il fenomeno seguente, l’inserimento di una vocale epentetica prima
del morfema del plurale in inglese. La vocale [Õ] viene pronunciata prima di s solo con parole
che terminano in specifiche consonanti:
A B
s bus p tap
z rose Q breath –s
S bush D clothe
J garage
–Õ
Õs
tS church
dJ pledge
In questo caso non basta il tratto [+coronale] per definire la classe naturale in (a) perché anche
in (b) ricorrono consonanti coronali. Quello che differenzia le coronali in (a) da quelle in (b) è
che sono [+stridule]. Quindi il fenomeno di inserimento di una vocale si attua dopo consonanti
coronali stridule. Perché le cose stanno in questi termini? La risposta risulta immediatamente
dall’analisi del contesto: s del plurale è anch’essa coronale e stridula. Quindi il fenomeno si
mostra per quello che è: un tipo di dissimilazione per cui è difficile pronunciare in uno stesso
elemento sillabico due foni troppo simili.
19
psicologo, seppure faccia parte del lessico italiano, viene sentita come ‘strana’, di aspetto ano-
malo rispetto alle parole tipicamente italiane. Questo dimostra che la conoscenza fonologica
(sillabica in questo caso) non ha nulla a che fare con l’apprendimento meccanico di singole pa-
role, ma si basa su delle generalizzazioni (‘regole’) di livello molto più astratto. Nel caso in
questione questi giudizi si basano sulla conoscenza inconsapevole della struttura sillabica
dell’italiano.
a. Suoni diversi che si sentono uguali. Un chiaro esempio è fornito dalle nasali in coda di sil-
laba in italiano (e nella maggior parte delle lingue del mondo). Esempi:
in-possibile, in-felice, in-tonso, in-civile, in-credibile
Ognuna delle nasali in coda della prima sillaba (sottolineate negli esempi) è articolata in modo
differente (rispettivamente: bilabiale, labiodentale, dentale, palatoalveolare, velare). Nonostante
ciò qualunque parlante di italiano (e di moltissime altre lingue) è convinte di pronunciare lo
stesso ‘suono’, che lui identifica semplicemente come [n], il fono cioè che si trova in una parola
come in-adatto, formata con lo stesso prefisso. Così in parole come campo, ogni parlante inter-
preta la nasale come /n/, nonostante sia effettivamente pronunciata come [m] ed esista una lette-
ra dell’alfabeto che codifica il suono [m], anzi, nonostante che l’ortografia prescriva la lettera m
(scrivere forme come la precedente con n, *canpo, è uno degli errori ortografici più comuni nel-
la prima alfabetizzazione).
b. Suoni uguali che si sentono diversi. Il rovescio della medaglia della situazione precedente
è rappresentato da quei casi in cui suoni oggettivamente uguali vengono interpretati come di-
versi. Esempi:
a. imparare, mano
b. San Pietro – sampietrino
c. sawed ‘segato’ – soared ‘librato’
Negli esempi italiani in (a) [m] di imparare viene interpretato differentemente da [m] di mano.
Come abbiamo visto prima, viene interpretato come /n/. Si noti anche il contrasto ortografico
tra le forme in (b) San Pietro e sampietrino, in cui la nasale ha la stessa fonetica della prima, da
cui peraltro deriva. La ragione è solamente convenzionale: solo nel secondo caso la nasale e la
consonante labiale successiva si trovano nella stessa parola, quindi scatta l’applicazione della
regola ortografica.
Un fenomeno simile è rappresentato dagli esempi inglesi in (c), che (nelle varietà non ro-
tiche, come lo standard britannico) sono pronunciati in modo identico, [so:d], ma vengono
“sentiti” dai madrelingua come diversi. La ragione sta nel fatto che soar ha /r/ latente, vale a di-
re ha una rappresentazione sottostante come /so:r/, che però non viene pronunciata in queste va-
rietà non rotiche in coda di sillaba; /r/ riemerge però quando si risillabifica in attacco di una sil-
laba seguente, p.e. soar and fly ([so-rən-flai]). La conclusione, quindi, è che il parlante interpre-
ta i suoni in base alla rappresentazione sottostante.
20
Per tutte le forme sopra qualsiasi parlante nativo di italiano ha la convinzione di pronunciare il
suono tra parentesi, ciò che non corrisponde a realtà, a meno di non forzare una pronuncia ipe-
rarticolata diminuendo drasticamente la velocità d’eloquio e inserendo una piccola pausa tra il
prefisso e il tema (cioè, p.e., [kon:=stata:re]).
d. Suoni che non si pensa di pronunciare. Si osserva anche la situazione inversa quando il
parlante pronuncia effettivamente dei suoni senza che ne abbia la minima consapevolezza. Se-
guono alcuni esempi dall’italiano:
a. p[i]sicologo; tec[ke]nica; rit[ti]mo; film[ə];
b. più f[:]orte, metà t[:]orta;
c. hotel[:] economico;
d. sogno (= sonno; vs sono):
e. ro[:]-sa (vs ros-sa)
La trascrizione delle forme in (a) registra la pronuncia di alcuni parlanti italiani generalmente
poco scolarizzati di forme sillabicamente anomale: sono caratterizzate dall’inserzione di una
vocale epentetica, che ha la funzione di sciogliere i nessi illegittimi in italiano. (b) esemplifica
il fenomeno del Raddoppiamento Sintattico dopo una parola tronca. (c) illustra un caso di Rad-
doppiamento Inverso. (d) è un caso di Geminazione Intrinseca. (e) illustra l’Allungamento Vo-
calico. In tutti questi casi il parlante nativo non ha la minima consapevolezza di questi fatti fo-
netici, nonostante che, per esempio, sia perfettamente in grado di percepire la lunghezza in for-
me come cassa, palla. Fatti simili si incontrano in tutte le lingue e diventano particolarmente
evidenti nell’accento ‘straniero’, come gli esempi seguenti illustrano:
a. I espeak espanish
b. Bob[:ə]
(a) riporta una comune pronuncia dell’inglese da parte di ispanofoni, i quali normalizzano i
nessi illegittimi in spagnolo con l’inserimento di [e] prima di [s] extrasillabica (v. avanti, alla
SILLABA). (b) trascrive una comune pronuncia dell’inglese da parte di parlanti italiani, i quali
inseriscono un vocale epentetica per normalizzare la forma inglese che termina in consonante.
A seconda dei parlanti, la vocale può essere una vocale molto breve tipo schwa, o, più comu-
nemente, un semplice rilascio vocalico. In entrambi i casi, i parlanti spagnoli e italiani non han-
no nessuna consapevolezza di pronunciare la vocale epentetica.
e. Linguaggio dei bambini. Il linguaggio dei bambini esemplifica forse al meglio la differenza
tra fonetica e fonologia. È noto che i bambini in età evolutiva dal punto di vista linguistico ma-
nifestano una sorta di apparente dissociazione linguistica tra la loro produzione e la loro, per
così dire, percezione. È comune esperienza, per esempio, che un bambino reagisca negativa-
mente alla ripetizione della sua emissione linguistica ‘difettosa’ da parte di un adulto, mostran-
do di non riconoscerla o comunque manifestando, a seconda dei casi, fastidio, spaesamento o
divertimento.
Un caso emblematico si ha quando il bambino impiega, per significati diversi o persino
opposti, quella che nella sua produzione foneticamente semplificata è la stessa forma, come
quando dice [vet:i:re] sia per ‘vestire’ che per ‘svestire’. Quando un adulto ripete la forma di-
versa da quella che il bambino intende, questo mostra crescente irritazione e corregge l’adulto
con quella che è oggettivamente la stessa forma dal punto di vista fonetico (p.e. [vet:i:re nO
vet:i:re!]).
È evidente che ci troviamo di fronte ad una discrepanza tra l’immagine mentale (cioè fo-
nologica) dei suoni delle parole, che è già ben sviluppata, e l’emissione articolatoria, ancora
molto lontana da quella di un parlante adulto. Il bambino non ha consapevolezza della propria
produzione ma interpreta le sequenze di suono in conformità con la rappresentazione mentale
dei suoni della lingua target, la lingua madre parlata dagli adulti. Questa situazione ripropone in
forma estrema i fatti sopra descritti che riguardano il linguaggio degli adulti.
Principi di Fonologia
21
Suoni diversi che si sentono uguali. Come si ricorderà, nelle forme seguenti la nasale
del prefisso in- viene percepita identica, pur essendo obiettivamente pronunciata in modo diver-
so in ciascuna:
in-possibile, in-felice, in-tonso, in-civile, in-credibile
Questo fenomeno, in realtà, riguarda tutte le nasali in coda di sillaba. Ma perché un parlante
non ha difficoltà a individuare la differenza tra le nasali in attacco (p.e. [m] vs [n]) ma non tra
le stesse in coda di sillaba? La risposta è che questo dipende dalla distintività specifica. In at-
tacco di sillaba in italiano esistono tre diverse nasali in grado di distinguere una forma
dall’altra, /m, n, ù /, come le seguenti coppie minime illustrano:
mani – nani; sonni – sogni; camme – cagne
In coda di sillaba la situazione è ben diversa, come la tabella seguente mostra:
Marco Svolacchia
22
Il luogo di articolazione (ovvero l’articolatore) che caratterizza la nasale in coda di sillaba (in
maiuscolo) concorda con quello della consonante seguente. Questo significa che il luogo di ar-
ticolazione della nasale non è una sua proprietà autonoma ma lo assume dalla consonante se-
guente. Di conseguenza, le diverse nasali non possono mai ricorrere nello stesso contesto, cioè
sono in distribuzione complementare; quindi non sono mai in contrasto e non possono identifi-
care da sole forme diverse. In conclusione, in coda di sillaba la differenza di luogo di articola-
zione per una nasale non è distintiva, “non conta”. Detto in termini generali, in italiano sono di-
sponibili tre fonemi nasali in attacco di sillaba, ma uno solo in coda di sillaba, non specificato
per luogo di articolazione. Questo spiega le differenze percettive tra nasali in attacco e in coda
di sillaba: la diversità nell’articolatore attivato è notato dal componente fonologico in attacco di
sillaba perché distintiva mentre è ignorata in coda di sillaba perché non distintiva.
Suoni uguali che si sentono diversi. Dalle precedenti considerazioni deriva immedia-
tamente la spiegazione delle proprietà percettive dei casi inversi, di seguito ripetuti per comodi-
tà, in cui due suoni oggettivamente uguali vengono percepiti differentemente:
a. imparare b. mano
Nella forma in (a) la nasale non viene interpretata come una nasale labiale perché, come si è vi-
sto, l’articolatore viene assegnato automaticamente dalla consonante seguente. Viceversa, nella
forma in (b) la nasale sottolineata ricorre in attacco di sillaba, dove l’articolatore utilizzato è
un’informazione pertinente perché distintiva.
Suoni che si pensa di pronunciare. Per quanto riguarda i casi di foni non pronunciati
ma percepiti o, all’inverso, pronunciati ma non percepiti, la spiegazione è di natura diversa e
necessita di illustrare i rapporti del componente fonologico con gli altri componenti della lin-
gua, particolarmente con il lessico e il componente morfologico. La morfologia, in particolare,
accresce la complessità di una parola. Così, da una parola semplice ne deriva una complessa: da
prendere è derivato comprendere (con+prendere). Questi processi fanno sì che si creino delle
sequenze di suono altrimenti impossibili in una lingua. Nella gran parte dei casi è la sillaba il
dominio interessato da queste restrizioni sequenziali. Ogni lingua risolve in un determinata ma-
niera, tra un insieme di scelte molto limitate, il conflitto tra la rappresentazione dei suoni pro-
dotta dal componente morfologico e dal lessico, da una parte, e le esigenze specificatamente
fonologiche, dall’altra. Per lo più si attua un processo che riaggiusta la sequenza inaccettabile.
Questo è il caso degli esempi già visti, ripetuti di seguito per comodità:
pe(r)-spicace; supe(r)-stite; co(n)-statare; i(n)-stallare
Tutte queste forme hanno in comune il fatto che sono derivate tramite prefissazione a un tema
che inizia per “S impura” di un affisso che termina in consonante. Da ciò risulta una sequenza
illegittima per l’italiano (e per qualsiasi altra lingua), in quanto si viene a creare una sillaba im-
possibile, con due elementi in coda di sillaba (il punto segnala la divisione in sillabe, la sequen-
za illegittima è sottolineata):
pers.pi.ca.ce; su.pers.tite; cons.ta.ta.re; ins.tal.la.re
Così le sillabe illegittime vengono riaggiustate in italiano eliminando (= non pronunciando) una
delle due consonanti che si contendono la posizione della coda di sillaba (indicata come barra-
ta):
pers.pi.ca.ce; su.pers.tite; cons.ta.ta.re; ins.tal.la.re
Principi di Fonologia
23
Suoni che non si pensa di pronunciare. L’ultima illusione fonetica, che riguarda
suoni che non ci si rende conto di pronunciare, sebbene inversa alla precedente, è prodotta dalle
stesse cause. Tutte le forme in (1) di seguito sono caratterizzate da qualche problema sillabico:
1. a. p[i]sicologo b. tec[ke]nica c. film[ə]
In psicologo (a) /ps/ non è un attacco possibile in italiano; in tecnica (b) la prima sillaba termi-
na in /k/, che è una coda impossibile in italiano; film (c) è una parola illegittima sia dal punto di
vista sillabico, perché presenta una consonante (quella finale) non sillabificata, sia perché non è
conforme alla struttura di parola dell’italiano, che richiede che termini in vocale. Parlanti poco
scolarizzati introducono una vocale (cosiddetta “epentetica”) che normalizza la sequenza ille-
gittima.
Come si ricorderà, le forme in (2) sono tutte caratterizzate da fenomeni di allungamento:
2. a. più f[:]orte b. hotel[:] economico c. sogn[:]o d. ro[:]-sa
(a) è un esempio di Raddoppiamento Sintattico, (b) di Raddoppiamento Inverso, (c) di Raddop-
piamento Intrinseco e, infine, (d) di Allungamento Vocalico. In tutti i casi si tratta di raddop-
piamenti che non hanno funzione distintiva ma sono il prodotto di automatismi causati da
ragioni diverse.
Le forme in (3), sono esempi di pronuncia straniera, che sono l’analogo degli automati-
smi che caratterizzano la pronuncia di ciascuna lingua quando vengono trasferiti in un’altra lin-
gua:
3. a. I espeak espanish b. Bob[:ə]
(3.a) è il risultato dell’applicazione di un automatismo della pronuncia dello spagnolo a quella
dell’inglese: in spagnolo non sono ammessi nessi con “S impura”; il risultato è l’epentesi voca-
lica, già vista nelle forme in (1), che aggiusta la sequenza illegittima. (3.b) è il risultato
dell’applicazione di due automatismi: /b/ raddoppia, analogamente a (1.b), perché una conso-
nante occlusiva non può occupare la coda di sillaba in italiano a meno che non sia il primo
membro di una consonante doppia; la vocale epentetica ([ə] o un rilascio vocalico, a seconda
dei casi) viene introdotta per sillabificare il secondo membro della consonante doppia.
Come si vede, tutti i fenomeni di illusioni fonetiche qui esemplificati trovano una spiegazione
comune: la discrepanza tra forma ideale, fornita dal lessico o dalla morfologia, e forma reale,
quale risulta dall’applicazioni di una serie di automatismi che aggiustano le sequenze illegitti-
me. I fatti mostrano che il parlante ha consapevolezza della prima, non della seconda. Di qui
l’illusione fonetica.
24
Si noti, però, che quando si parla non si apre normalmente la bocca come nella figura, nemmeno quando si
pronunciano vocali basse. Si ricordi, inoltre, che quando si articola una nasale la bocca è completamente
chiusa.
b. Quando i due stimoli, acustico e visivo, sono dissociati, il componente fonologico si trova da-
vanti a una situazione completamente imprevista che mette in crisi la sua capacità di elaborazione. Come
si è visto, il dilemma percettivo viene risolto nella stragrande maggioranza dei casi con un compromesso.
c. Il fatto che il fenomeno sia pressoché universale non ristretto per sesso, età, lingua madre,
consapevolezza e livello di dettaglio mostra che la coordinazione acustico-articolatoria è innata, a buon
diritto parte del componente fonologico della Grammatica Universale.
3
Questo è mostrato chiaramente dai soggetti sordi che imparano una lingua verbale. In alcuni casi raggiungono una
competenza paragonabile a quella di un madrelingua, ma con una serie di eccezioni sistematiche per quanto riguarda
la pronuncia. Uno di questi “errori” riguarda la differenza tra ostruenti sorde e sonore, che questi soggetti hanno dif-
ficoltà ad apprendere, anche in presenza di aiuti logopedistici.
Principi di Fonologia
25
26
3
SILLABA
Una sequenza di segmenti di suono prima di poter essere effettivamente pronunciata deve esse-
re organizzata mentalmente a più livelli. Senza questa organizzazione, a cui si dà tradizional-
mente il nome di prosodia, non sarebbe possibile la computazione mentale necessaria alla pro-
grammazione e all’esecuzione della fonazione, il meccanismo che produce i suoni linguistici. Il
primo passo è la sillabificazione, per cui una sequenza di suoni viene organizzata in sillabe.
La sillaba, sebbene abbia assunto nella teoria fonologica degli ultimi decenni un ruolo
sempre più importante, non è certo un elemento nuovo; al contrario, rientra nei concetti che
fanno parte della grammatica tradizionale. Inoltre, in molti sistemi ortografici, come il nostro, la
divisione in sillabe è la base dell’“andare a capo”. In non pochi sistemi grafici, presenti e passa-
ti, è proprio la sillaba (o, a volte, una parte di essa), e non il fonema, l’unità di base della scrit-
tura. Questo si spiega con il fatto che la sillaba è un elemento fonologico “naturale”, nel senso
che può essere facilmente prodotta in isolamento, a differenza dei fonemi e ancor più dei tratti
distintivi. Tutto ciò fa sì che la sillaba risulti forse l’elemento fonologico più intuitivo.
La pratica tradizionale dell’andare a capo si basa sull’integrità sillabica: si può dividere
una parola in qualsivoglia modo a condizione che le sillabe non vengano divise. Questo implica
che se ne conosca la divisione. Come è noto, la divisione in sillabe è una pratica del tutto intui-
tiva: i bambini non ancora scolarizzati sono in grado di sillabare una parola senza difficoltà sul-
la base di pochissimi esempi e dopo l’alfabetizzazione imparano senza difficoltà la pratica
dell’andare a capo.
Ma che cos’è concretamente una sillaba? Per quanto sorprendente, non esiste ancora una
definizione unica e soddisfacente. Articolatoriamente, ad ogni sillaba corrisponderebbe secon-
do alcuni un’unità di espirazione, causata da una contrazione dei muscoli del torace. Ma si trat-
ta di un’idea ormai abbandonata dai più per mancanza di sufficiente sostegno empirico. Una de-
finizione acustica, molto più solida, è che si tratta di una sequenza di foni raggruppati attorno a
un picco di prominenza o intensità sonora (cioè, tante onde di sonorità tante sillabe). Qualunque
sia esattamente la base fonetica della sillaba, dal punto di vista fonologico la conclusione è che
è un’unità mentale di organizzazione dei segmenti di suono regolata dalla scala di sonorità.
27
(a) (b)
sorde –
occlusive
sonore
sorde + N
fricative
sonore
nasali – A Co
laterali
vibranti
consonanti
semi
vocali
alte
vocali medie
basse +
La scala di sonorità ha un’importanza fondamentale per la costituzione della sillaba, esprimibile
mediante il Principio della Progressione di Sonorità, di portata universale, per cui gli elementi
di una sillaba devono essere disposti in modo che si abbia un crescendo di sonorità verso il cen-
tro della sillaba (il nucleo, per cui v. avanti), e quindi un decrescendo di sonorità verso i margi-
ni della sillaba, come rappresentato in (b) sopra. Questo spiega perché, p.e., [tre], in cui [e], il
nucleo, è l’elemento più sonoro in quanto vocale, e [t], quello più lontano dal nucleo, è
l’elemento meno sonoro, in quanto occlusiva, sia una sillaba possibile in italiano, mentre [rte],
con gli stessi elementi, ma con diverso ordine non è una sillaba possibile in italiano (e in nes-
sun’altra lingua). Se si prende una parola monosillabica complessa come trend lo stesso princi-
pio si evidenzia al meglio: man mano che da entrambi i lati ci si avvicina al centro, cioè al nu-
cleo, il grado di sonorità aumenta.
S(illaba)
A(ttacco) R(ima)
N(ucleo) Co(da)
3.2.1. Rima
Ma perché si pensa che la sillaba abbia una struttura come sopra, cioè gerarchica, con un sotto-
costituente, la rima, invece che lineare? La risposta è che serve a rendere conto di alcuni impor-
tanti fatti delle lingue.
La denominazione di rima deriva dalla poesia, in cui gioca un ruolo importante. Noto-
riamente, quella che in poesia viene chiamata ‘rima’ consiste nella ripetizione della parte ‘fina-
le’ di una parola in fine di verso. Ma cosa esattamente significa finale? La risposta è che ciò
che conta come rima si estende dal nucleo accentato in poi (ovvero, come vedremo poi, il piede
forte di una parola). Quello che qui importa è che l’attacco di sillaba viene completamente
ignorato nella rima poetica, vale a dire che l’attacco, pur facendo parte della sillaba accentata,
non partecipa alla rima poetica: so, p.e., rima con può, e dan rima con van (quella sottolineata è
la rima sillabica).
Marco Svolacchia
28
Un altro fatto importante che dimostra l’esistenza della rima è che in molte lingue, tra cui
l’italiano, l’accento è attirato dalle sillabe pesanti. Una sillaba è pesante quando ha una vocale
lunga o finisce in consonante, vale a dire quando ha una coda, perché sia la seconda parte di
una vocale lunga che la consonante dopo un nucleo appartengono alla coda. Quindi una sillaba
è pesante quando ha una rima doppia, cioè con due costituenti. La conclusione è che la rima
gioca un ruolo fondamentale per quello che tradizionalmente si chiama quantità di una sillaba.
Un fenomeno che fa appello alla costituenza della rima è la distribuzione delle vocali
medie anteriori in francese. I dati sono illustrati ed esemplificati nella tabella seguente:
1 2
SILLABA APERTA SILLABA CHIUSA
[e
e] [E
E]
a. béton, spécial veston, spectacle
-ACCENTATA
b. élevé [elWve] élevé [Elve]
+ACCENTATA c. élevé, oreille, conquête
Come si vede, in sillaba aperta, i.e. senza coda, ricorre la vocale [e] (a); in sillaba chiusa, i.e.
con una coda, ricorre la vocale [E] (c). Le forme in (b) sono particolarmente significative: se la
vocale centrale ridotta viene pronunciata (come è tipico della pronuncia lenta e accurata) la
prima vocale è pronunciata [e], trovandosi in sillaba aperta (1.b); se, invece, la vocale ridotta
non viene pronunciata (come è tipico della pronuncia veloce) la vocale è pronunciata [E], in
quanto la sillaba precedente si chiude (2.b).
3.2.2. Nucleo
Il nucleo è il centro della sillaba, che corrisponde al picco di sonorità, ed è ciò che avvertiamo
come portatore dell’accento nel caso in cui la sillaba cui appartiene sia accentata. In italiano, e
in molte altre lingue, è l’unico costituente obbligatorio e può essere costituito solo da vocali.
Altre lingue ammettono nel nucleo anche consonanti con un alto grado di sonorità.
3.2.3. Coda
La coda è il costituente meno essenziale della sillaba. Ciò è mostrato da diversi fatti. Primo,
mentre in tutte le lingue il nucleo è obbligatorio, e in alcune lo è anche l’attacco, in nessuna
lingua la coda è obbligatoria.
Secondo, nella maggior parte delle lingue la coda presenta molte più limitazioni riguardo
al numero e al tipo di foni permessi. In italiano, p.e., abbiamo già visto che possiamo avere fino
a tre elementi nell’attacco (ma normalmente due), mentre nella coda solo uno è permesso.
Nell’attacco qualunque consonante può apparire; nella coda solo poche consonanti (le sonoran-
ti e /s/).
Terzo, una consonante ‘tende’ ad occupare l’attacco ogni volta che è possibile, non la
coda. In una parola come pane, p.e., la consonante sottolineata, tra vocali, fa parte dell’attacco
della seconda sillaba, non della coda della prima, pur potendo in ‘teoria’ farne parte (perché /n/
può stare in fine di sillaba, come, p.e., in can-to). Invece una sillabazione come pan-e è del tut-
to innaturale.
Quarto, i bambini pronunciano un segmento in coda di sillaba in uno stadio molto tardo
nell’apprendimento della lingua.
Ci sono poi molte regole fonologiche che si applicano in funzione della coda.
Un’importante regola fonologica del tedesco è la cosiddetta Auslatuverhärtung, la regola di de-
sonorizzazione delle ostruenti, per cui da sonore diventano sorde (le ostruenti interessate dal
fenomeno sono sottolineate perché la grafia non tiene conto della modificazione):
a b c d e
jag-en Jagd-en Jagd
‘cacciare’ ‘cacce’ ‘caccia’
Kind-er Kind Kind-heit Smaragd-e Smaragd
‘bambino’ ‘bambino’ ‘fanciullezza’ ‘smeraldi’ ‘smeraldo’
Principi di Fonologia
29
lieb-en lieb-lich
‘amare’ ‘amabile’
les-en les-bar
‘leggere’ ‘leggibile’
Come l’esempio nella colonna (b) mostra, l’ostruente sonora diventa sorda quando viene a tro-
varsi in fine di parola. In realtà la specificazione esatta del fenomeno non è in finale di parola:
negli esempi in (c) /d/, /b/ e /z/ vengono convertiti, rispettivamente, in /t/, /p/ e /s/ sebbene non
si trovino in fine di parola. Né una formulazione alternativa potrebbe essere in fine di morfema,
come gli esempi in (d) dimostrano: l’ostruente che si desonorizza non è quella in fine di mor-
fema, ma quella precedente. Del resto, se fosse quello di morfema il contesto dell’applicazione
della regola, tutte le forme in (a) dovrebbero presentare le ostruenti prima del trattino come
sorde, ciò che non risponde a verità. Nemmeno la formulazione in fine di sillaba è corretta, co-
me le forme in (e) indicano: non solo le consonanti in fine di sillaba (qui d) si desonorizzano,
ma anche quelle immediatamente precedenti. Una formulazione adeguata è allora la seguente:
DESONORIZZAZIONE TEDESCA: Un’ostruente sonora si desonorizza in coda si sillaba.
Questa regola copre tutti e solo i casi in cui la desonorizazione si applica. In (a) la regola non si
applica perché le ostruenti in fine di radice si trovano nell’attacco di sillaba, non in coda (p.e.
Die.be). In (b, c) si applica perché le ostruenti si trovano in coda di sillaba. In (e) si applica a
due ostruenti, ambedue in coda di sillaba. In (d) si applica solo alla prima delle due, l’unica che
occupa la coda di sillaba (p.e. Jag.den).
3.2.4. Attacco
L’attacco è ciò che precede il nucleo. In italiano non è obbligatorio (come, p.e., in a-pe), ma in
non poche lingue una sillaba deve avere un attacco. Così, se una sillaba ne è sprovvista viene
introdotta una consonante. Una lingua di questo tipo è il tedesco, come mostrano gli esempi se-
guenti:
a. The[?]ater
b. [?]Iß [?]auch [?]ein [?]Ei
In (a), essendo la seconda sillaba sprovvista di attacco, viene introdotta [?] (la consonante epen-
tetica per eccellenza). In (b) è esemplificata un’applicazione tipica: parole con una vocale ini-
ziale, a cui viene fornita la consonante epentetica per l’attacco di sillaba.
Mentre il nucleo, per definizione, è costituito da un solo elemento, l’attacco può essere
formato da più foni. In italiano l’attacco può essere costituito al massimo da due (p.e. tre-no);
in contesti particolari anche da tre foni (p.e. des-trie-ro). Di seguito viene data una tabella che
mostra le possibilità combinatorie di due elementi dell’attacco di sillaba (il primo membro è
quello della colonna verticale; – = non ricorre, + = ricorre, ? = combinazione dubbia; (+) =
marginale):
ATTACCHI DUPLICI IN ITALIANO
w j r l n m s f t p k
k + + + + – – (+) – – – –
p – + + + – – (+) – – – –
t ? + + – – – – – – – –
g + + + + – – – – – – –
b – + + + – – – – – – –
d ? + + – – – – – – – –
f – + + + – – – – – – –
v – + ? – – – – – – – –
s + + ? + + + + + + + +
m – ? – – – – – – – – –
n ? ? – – – – – – – – –
l ? ? – – – – – – – – –
r ? ? – – – – – – – – –
j ? – – – – – – – – – –
w – – – – – – – – – – –
Marco Svolacchia
30
Come si vede già al primo sguardo, le combinazioni possibili diminuiscono man mano che si
procede dall’alto in basso. Questo risultato consegue dal Principio di Progressione di Sonorità,
essendo i fonemi in colonna ordinati secondo la Scala di sonorità in senso crescente e i fonemi
in riga in senso decrescente.
1 2 3 4 5 6 7
SORDE
*kg *kf *kv *kn kl kr kj
OCCLUSIVE cloro croce chiave
*gf *gv *gn gl gr gj
SONORE
glassa grido ghiaia
SORDE
*fv *fn fl fr fj
FRICATIVE flotta frate fiume
*vn *vl ?vr vj
SONORE
(avrò) viola
NASALI *nl *nr ?nj
(niente)
LATERALI *lr ?lj
(lieto)
VIBRANTI ?rj
(ariete)
Come è immediatamente visibile, l’accettabilità dei nessi migliora procedendo verso destra,
conseguenza dell’aumento del livello di sonorità del secondo membro dell’attacco e quindi del-
la distanza in sonorità tra i due membri dello stesso. Nello stesso tempo l’accettabilità dei nessi
peggiora procedendo verso il basso, risultato dell’aumento del livello di Sonorità del primo
membro dell’attacco e quindi della diminuzione della distanza in sonorità tra due membri dello
stesso.
3.4. Extrasillabicità
Come si è visto, la capacità di individuare l’articolazione in sillabe ha basi intuitive molto soli-
de, ciò che permette di fondare la pratica dell’andare a capo in molte tradizioni ortografiche ba-
sate su sistemi alfabetici. Tuttavia, non sembra che l’intuizione abbia giocato un ruolo rilevante
nella creazione della norme ortografiche italiane dell’andare a capo. Piuttosto, i grammatici tra-
dizionali sentirono l’esigenza di darne un fondamento “oggettivo”. Il criterio utilizzato è sem-
plice e razionale: tutto ciò che può stare in inizio di parola può stare in inizio di sillaba e tutto
ciò che può stare in fine di parola può stare in fine di sillaba. L’assunto da cui questo criterio
deriva è che l’inizio e la fine di parola non siano ambigui per quel che riguarda l’assegnazione
dei fonemi (i.e., ciò che sta in inizio di parola, posizione non ambigua dato che non c’è alcun
elemento che precede, non può che stare in inizio di sillaba). Così, se in aratro il nesso sottoli-
neato è, in linea di principio, sillabicamente ambiguo (a.rat.ro o a.ra.tro ?), in treno lo stesso
nesso non può che essere scandito univocamente come tre.no.
Principi di Fonologia
31
Per quanto si tratti di un assunto assai ragionevole a priori, ormai è chiaro che è inaffida-
bile. La ragione è che l’inizio e la fine di parola sono particolari, in quanto ammettono (o, in al-
cuni casi, non ammettono) delle sequenze che non sono ammesse (o, rispettivamente, sono am-
messe) all’interno di parola.
Un esempio del primo caso è la s impura in italiano (e in molte altre lingue indoeuropee).
Con questa denominazione ci si riferisce a una /s/ che ricorre prima di una consonante, come in
storia, aspro, ecc. Applicando il criterio tradizionale già visto, dato che s ricorre in inizio di pa-
rola seguita da una o più consonanti, deve stare in inizio di sillaba. Perciò, una parola come a-
sta, deve essere sillabata come a.sta (cfr. sta.to). In realtà è ampiamente dimostrabile, come è
intuitivo e come attestano anche gli errori dell’andare a capo dei bambini, che la corretta silla-
bazione della stessa è as.ta.
Un esempio del secondo caso è che in italiano le parole veramente italiane (tolte quindi
le parole di origine straniera o dotta) propriamente dette (non forme funzionali, come articoli,
preposizioni, ecc., che non hanno una loro autonomia) finiscono sempre in vocale, sebbene una
sillaba possa finire in consonante, a condizione che sia di un certo tipo. La conclusione è che,
contrariamente a quello che pensavano i grammatici tradizionali, gli estremi di parola non sono
affidabili per la determinazione della divisione in sillabe.
Elementi come s impura, che si ricordi possono ricorrere solo ai limiti della parola (inizio
o fine), vengono analizzati come marginali, non facenti mai parte della sillaba propriamente
detta, nemmeno quando si trovano in inizio di parola. Per questa ragione vengono denominati
extrasillabici. Questo è dimostrato, tra l’altro, dal fatto che i nessi con s impura sono instabili,
come si vede quando una parola che inizia con s impura è preceduta da una forma che termina
in vocale. Così, un gruppo come, p.e., uno studente sarebbe sillabificato come /u.nos.tu.den.te/,
e non come */u.no.stu.den.te/. I nessi normali, invece, sono stabili, come un gruppo come una
tromba, sillabificato come /u.na.trom.ba/, mostra.
Marco Svolacchia
32
4
ACCENTO E RITMO
Dopo essere stata sillabificata, una sequenza di suoni deve essere metrificata, cioè organizzata
in unità ritmiche.
Abbiamo appena visto che nella sillaba agisce un principio di alternanza (la distanza mi-
nima di sonorità tra gli elementi) e che le sillabe si individuano acusticamente come modula-
zioni ondulatorie di sonorità, alternanze tra picchi e valli di sonorità. La stessa esigenza si ma-
nifesta nel ritmo, che è l’alternanza tra sillabe forti e sillabe deboli. Una sillaba è forte quando è
accentata. Con accento non s’intende qui solo l’accento principale di parola, ma anche gradi in-
feriori d’accento.
Si prenda, per esempio, una parola come improvvisamente: è evidente per qualsiasi par-
lante d’italiano che questa parola non presenta solo una sillaba accentata, men, bensì
un’alternanza regolare tra sillabe forti e deboli. Quindi deve essere rappresentata come ìm-prov-
vì-sa-mèn-te. Si noti la sequenza forte-debole, ripetuta qui tre volte. Ognuna di queste sequenze
costituisce un piede metrico.
La tendenza all’alternanza si manifesta anche a livelli più alti. Nell’esempio precedente
si noterà che la sillaba forte del primo piede è più forte della sillaba forte del secondo piede. Pe-
rò, è più debole della sillaba iniziale dell’ultimo piede. Quindi una rappresentazione più fedele
dell’esempio sarebbe: im 2 -prov-vi 3 -sa-men 1 -te (in cui ‘1 ’ indica l’accento principale, ‘2 ’
l’accento secondario, ecc.).
Il ritmo, però, non si manifesta solo all’interno di una parola, bensì anche tra parole di
uno stesso sintagma, tra sintagmi di una stessa frase intonativa e tra clausole intonative di uno
stesso enunciato. Ad esempio, in un sintagma come di Carlo, la parola Carlo è più forte, accen-
tata, di di. In la casa di Carlo, il sintagma di Carlo è più forte di la casa. In una frase come
Gianni è venuto a casa, è venuto a casa è più forte di Gianni, ecc. La generalizzazione è che in
italiano, come in molte altre lingue, è sempre l’ultimo costituente che riceve un grado aggiunti-
vo d’accento.
Questa generalizzazione è strettamente collegata con la rima poetica di abbiamo parlato
precedentemente. La domanda che ci eravamo posti era: che cosa deve essere ripetuto nella ri-
ma poetica? La risposta era stata: tutto ciò che segue la rima della sillaba accentata dell’ultima
parola in finale di verso. Alla luce delle regole di ritmo dell’italiano la regola della rima in ita-
liano diventa molto più chiara: ciò che viene ripetuto è il piede forte della parola forte del sin-
tagma forte della frase intonativa forte (molto più semplice di quanto non sembri), in parole po-
vere il piede più forte dell’intero verso (ovviamente escludendo l’attacco, che come si è detto,
non conta ai fini accentuali).
33
Le lingue, però, differiscono riguardo all’utilizzo dei tre fattori sopraelencati. Molte lingue li
utilizzano tutti e tre insieme, pur variando, a quanto pare, nell’importanza relativa che assegna-
no ad ognuno. Ad esempio, sembra che il fattore principale per l’italiano sia la lunghezza, men-
tre lo sarebbe l’altezza per l’inglese. Tradizionalmente si parla in questi casi di lingue ad accen-
to dinamico, sebbene il termine sia fuorviante, in quanto sembra che in genere l’intensità non
sia il fattore più importante. Altre lingue utilizzano invece solamente l’altezza, cioè il tono, per
la determinazione dell’accento principale, mentre nessun ruolo rilevante sembrano giocare la
durata e l’intensità. Si parla in questo caso di lingue ad accento tonale (o, usando un termine
tradizionale, ad accento musicale); esempi di queste lingue sono il giapponese, il somalo e, in
Europa, le lingue scandinave (ma non il danese) e il serbo-croato. Anche il greco classico era
una lingua di questo tipo. La conseguenza pratica di questo tipo di realizzazione dell’accento è
che per un parlante non nativo (specie se la sua lingua madre è del tipo accentuale più comune)
è spesso molto difficile percepire dove cada l’accento in queste lingue o, detto in altro modo,
distinguere parole diverse solo per l’accento.
È importante sottolineare che l’accento è un fenomeno relativo, non assoluto. Dire che
un accento è principale (qualunque sia la notazione utilizzata) significa che è l’accento più forte
nel suo dominio (a livello di parola semplice, composta, di frase, ecc.), e così per gli altri accen-
ti. Ciò che non significa è che questo corrisponda ad un valore fonetico assoluto, esprimibile
idealmente in termini matematici, qualcosa del tipo: “in italiano l’accento secondario misura
forza (o/e altezza/durata, ecc.) n”.
4.2. Ritmo
Come si è accennato all’inizio del capitolo, il ritmo viene assegnato da un meccanismo di me-
trificazione, che assegna la prominenza all’interno di ogni costituente.
All’interno di una parola, esso organizza le sillabe in sequenze di PIEDI METRICI (PM);
p.e. improvvisamente è costituito di 3 PM: im-prov│vi-sa│men-te.
Il meccanismo di metrificazione cerca di creare delle sequenze ritmiche ottimali, cioè co-
stituite da piedi binari (= formati di due sillabe), senza resti (= senza lasciare sillabe non metri-
ficate). Questo non è sempre possibile, come nel caso di una parola con sillabe dispari.
Il ritmo può essere trocaico (come in italiano, inglese, spagnolo, inglese, tedesco, ecc.),
vale a dire che consiste di piedi in cui la prima sillaba è forte (F), la seconda debole (D), da cui
risulta un’alternanza di sillabe accentate e sillabe atone. Oppure il ritmo può essere giambico,
in cui la prima sillaba è debole e la seconda forte (come in francese). Seguono alcuni esempi
dell’italiano:
PM PM PM
F D F D F D
im prov vi sa men te = ìm-prov│vì-sa│mèn-te
pi ro et ta = pì-ro│èt-ta
pos ta = pòs-ta
In italiano è l’ultimo piede metrico quello più prominente in una parola. Come nelle altre lingue
in genere, le prominenze relative tra gli altri piedi metrici sono assegnate automaticamente in
modo da ottimizzare il ritmo in senso binario. Per esempio una parola di tre sillabe come im-
provvisamente sarebbe accentata come [im2-prov-vi3-sa-men1-te] (in cui i numeri in apice stan-
no, rispettivamente, per ACCENTO SECONDARIO, TERZIARIO e PRIMARIO).
Questa configurazione ritmica viene assegnata come segue (in cui A1, A2, ecc. stanno,
rispettivamente, per ‘1A ASSEGNAZIONE’ (di prominenza), ‘2A ASSEGNAZIONE’, ecc.):
A3: PAROLA D F
A2: COPPIA DI PM F D F
A1: PIEDE METRICO F D F D F D
im prov vi sa men te
Marco Svolacchia
34
35
5
TONO E INTONAZIONE
5.1. Intonazione
Un altro fondamentale aspetto della fonologia delle lingue umane è l’intonazione, che è
l’ultimo livello di organizzazione fonologica.
L’intonazione ha diverse funzioni. Una di queste è, osservativamente parlando, di per-
mette di assegnare significati diversi a enunciati altrimenti (apparentemente) identici, cioè il
cosiddetto significato performativo.4 Ad esempio, un enunciato come ‘Allora vieni a casa’, a
seconda dell’intonazione con cui si accompagna, può ricevere un’interpretazione dichiarativa
(‘Sì, andiamo a casa’), interrogativa (‘Andiamo a casa?’), imperativa (‘Andiamo a casa!’). I-
noltre, in unione con l’accento di frase, può ricevere altre interpretazioni più sottili, legate a fat-
tori conversazionali. Ad esempio: ‘Sì, ANDIAMO a casa!’ (= Ci ANDIAMO a casa!); ‘Andiamo
A CASA!’ (‘NON al cinema!’).
Un altro utilizzo dell’intonazione, detto pragmatico, è quello di convogliare significati
meno strettamente linguistici, cioè di tipo emotivo, aventi a che vedere con l’atteggiamento del
parlante riguardo a ciò di cui sta parlando o a colui con cui sta parlando, quali ironia, irritazio-
ne, gentilezza, ecc., che formano un inventario molto aperto e indefinito.
L’ultima funzione dell’intonazione, che chiameremo sintattica, è più direttamente con-
nessa alla struttura delle frasi, che, in concomitanza con il ritmo, consiste nel guidare
l’ascoltatore alla decodifica della struttura sintattica di frasi e enunciati.
A cosa esattamente si applica l’intonazione (cioè un profilo intonativo)? La risposta con-
venzionale ‘a singole frasi’ è corretta solo se s’intende ‘frase’ in un senso più ristretto che non
nella grammatica tradizionale e in altri approcci sintattici simili. Così, in una “frase” come
‘Gianni, come sai, lavora molto’, l’inciso in corsivo è in effetti una frase autonoma (in inglese
si distingue un termine per “frase allargata” (sentence), per comprendere l’intera frase
dell’esempio e un termine per “sottofrase” (clause), per indicare ciascuna delle due frasi
dell’esempio, le quali costituiscono ciascuna una unità di predicazione completa, in quanto
formate da un soggetto e un predicato). Lo stesso vale anche per casi meno evidenti in cui non
compare espressamente un verbo, come in ‘Gianni, purtroppo, lavora molto’, in cui l’inciso di
nuovo costituisce una sorta di frase a sé e porta lo stesso sintagma intonativo dell’inciso prece-
dente in cui compare un verbo. Inoltre, entrambi spezzano, frapponendosi, il profilo intonativo
della frase principale.
Una conseguenza di questa proprietà dell’intonazione è che essa indirettamente convo-
glia tutta una serie di informazioni di tipo sintattico, rendendo più percepibile la divisione di un
enunciato nei suoi costituenti e contribuendo a disambiguare sequenze altrimenti ambigue. Ad
esempio, la frase ‘Amo tutti i cani(,) che sono intelligenti’ è di per sé ambigua, potendo signifi-
care (a) amo solo i cani intelligenti; (b). amo tutti i cani, perché sono intelligenti. Non è, però,
ambigua se completa d’intonazione, come anche il diverso uso della virgola suggerisce. Nella
prima interpretazione non c’è un’interruzione intonativa tra le due sottofrasi (e la virgola non è
richiesta); viceversa nella seconda c’è uno stacco intonativo tra le due (e la virgola è richiesta).
4
La ragione della formulazione di basso profilo è che la sintassi è la patria delle “illusioni ottiche”, in quanto molti
elementi dotati di senso non compaiano in modo esplicito. In particolare, molti casi (molto probabilmente tutti i casi)
in cui la sola intonazione sembra codificare il performativo di una frase hanno in realtà una realizzazione sintattica,
sebbene non immediatamente manifesta. In questo caso, quindi, l’intonazione si limita a codificare delle informazioni
già presenti a livello sintattico, analogamente a quella “sintattica” (per v. di seguito).
Marco Svolacchia
36
realizzare gli accenti, e che viene utilizzato per il canto. Questo è uno degli aspetti più sorpren-
denti del linguaggio, vale a dire che uno stesso mezzo articolatorio viene utilizzato per una va-
rietà di usi diversi, alcuni dei quali in contemporanea. Così mentre le corde vocali vengono at-
tivate e indotte a vibrare per produrre un fono sonoro, p.e. una vocale, contemporaneamente e-
seguono l’istruzione riguardo alla configurazione necessaria da assumere per realizzare il parti-
colare tono, associato alla specifica sillaba, che è parte del particolare profilo intonativo deside-
rato. In altre parole sia la sonorità sia il tono consistono nella vibrazione delle corde vocali;
quindi le corde vocali eseguono contemporaneamente l’istruzione di vibrare, per produrre un
fono sonoro, e l’istruzione di contrarsi in quella particolare misura per produrre la giusta fre-
quenza di vibrazione, per produrre il tono richiesto in quel momento dal componente intonati-
vo. Se si pensa che queste sono solo due tra le tante istruzioni contemporanee che il nostro ap-
parato fonatorio riceve dal nostro sistema nervoso centrale è sbalorditivo come noi riusciamo a
produrre e decodificare i messaggi vocali alla vertiginosa velocità a cui avviene la normale co-
municazione quotidiana. E questo rappresenta un’ulteriore prova del carattere innato dei com-
ponenti di base del linguaggio umano.
37
(c) si astrae da come una sequenza di toni viene realizzata concretamente, se in modo
compresso, nel caso di forme brevi, o in nodo “stiracchiato”, nel caso di forme molto lunghe.
Ciò che per noi contano sono le variazioni tonali, cioè l’alternanza tra toni (sensibilmente) di-
versi. Tutti gli esempi precedenti, p.e., hanno un andamento del tipo ‘basso-alto-basso’. Anche
questo è parallelo alla nostra percezione musicale, in quanto sentiamo melodicamente identiche
due esecuzioni diverse per tempo di una stessa sequenza di note. Anche qui ciò che conta sono
gli intervalli.
Quando si passa dai profili intonativi, i grafici lineari che esprimono l’andamento nel tempo
delle variazioni di frequenza (espresse in hertz), ai toni che ne rappresentano gli elementi costi-
tutivi, cioè la modulazione, paralleli alle note in musica, si parla di melodie tonali. Quindi le
melodie tonali sono la controparte fonologica dei profili intonativi, che sono invece parte della
fonetica. In un certo senso si può affermare che i profili intonativi sono la sostanza
dell’intonazione, quella che le macchine registrano, mentre le melodie intonative sono la forma
dell’intonazione, quelle che la mente umana astrae nella decodifica e che sottintende nella codi-
fica del parlato.
Lo scopo principale della fonologia dell’intonazione è di scoprire il lessico intonaziona-
le, l’inventario delle melodie intonative associate a specifici significati proposizionali, quali
‘interrogazione’, ‘comando’, ‘ironia’, ‘scetticismo’, ecc., così come la lessicologia si occupa
dell’inventario delle parole di una lingua, associazioni di suono e significato.