Tip_brasile
Tip_brasile
Tip_brasile
net/publication/267958185
Article
CITATIONS READS
3 110
3 authors, including:
All content following this page was uploaded by Alexsandro R. Meireles on 23 March 2015.
Resumo — Este artigo analisa o ritmo da fala de três dialetos do Geralmente, as abordagens de osciladores acoplados
português brasileiro sob a luz de uma abordagem de osciladores classificam o ritmo da fala pela força de acoplamento entre
acoplados à tipologia rítmica. Os dados mostram uma escala de osciladores silábicos e acentuais, a qual é medida pelo
um dialeto menos acentual a mais acentual da seguinte forma: quociente (forca relativa, de agora em diante, r) entre o
MG (força de acoplamento = 1.83, taxa de elocução = 6.3) > SP
coeficientes intercepto (a) e inclinação (b) da equação de
(1.66, 6.6) > BA (1.26, 4.2) > ES (0.95, 4.0). Além disso, os
resultados mostram que o ritmo acentual parece estar regressão linear I = a + bn, em que I é a duração do grupo
relacionado a taxas mais rápidas. Finalmente, coeficientes de acentual e n é o número de unidades do tamanho da sílaba.
intercepto significativos em uma equação de regressão ocorreram Assim, línguas de ritmo acentual teriam uma maior influência
mais freqüentemente na taxa rápida. Este fato é apoiado por do oscilador acentual (r > 1) e línguas de ritmo silábico teriam
resultados anteriores que mostram um decréscimo de desvio- uma maior influência do oscilador silábico (r ≤ 1). Foi
padrão nas taxas rápidas. Conseqüentemente, equações de demonstrado por [7], porém, que a inclusão do nível de
regressão significantes podem ser mais fáceis de serem proeminência (de agora em diante, p) do oscilador acentual
encontradas nessas taxas. reflete melhor a variância das durações dos grupos acentuais.
Por isso, p foi incluído em nossa analise, a qual e baseada nos
Palavras-chave: ritmo de fala, taxa de elocução, ritmo de fala, ritmo
acentual e silábico. conceitos teórico-metodológicos do MDR [5]. A fórmula
utilizada para análise do ritmo da fala foi, portanto:
A literatura apresenta duas abordagens principais na Barbosa [2,7] e Meireles [19], entretanto, mostram que
pesquisa do ritmo da fala: a) a abordagem dos osciladores devemos ser cuidadosos na analise do ritmo da fala, pois r
acoplados [4, 22]; e b) a abordagem descritiva [16, 23]. pode variar bastante em função do estilo de fala [1,6,7,] , da
A abordagem descritiva realiza uma tipologia rítmica de taxa de elocução [2,17,19,21] e dos dialetos [10,19].
acordo com parâmetros como %V (durações de intervalos Meireles [19], por exemplo, realizou um estudo interdialetal
vocálicos, [23]), 8C (durações de intervalos consonantais, para estudar a variação rítmica nos dialetos mineiro e baiano
[23]), PVI (índice de variabilidade pareada, [20]) e CCI com as seguintes premissas: a) línguas de ritmo silábico
(índice controle/compensação, [8]). Embora os dois últimos possuem menor desvio-padrão da duração da unidade vogal-a-
parâmetros tenham melhorado consideravelmente as medidas vogal (de agora em diante, VV), bem como maior desvio-
de ritmo da fala, por incluírem informações de diferenças padrão da duração do grupo acentual (de agora em diante,
locais de duração, nenhum desses modelos considera as duas GA); b) línguas de ritmo acentual possuem maior desvio-
propriedades essenciais de produção do ritmo postuladas por padrão da duração da unidade VV, bem como menor desvio-
[14]: periodicidade e estrutura. Da mesma forma, Kohler [15] padrão da duração do grupo acentual (de agora em diante,
comenta que nem as durações de intervalos consonantais e/ou GA).
vocálicos nem o PVI e um modelo explicativo do ritmo da Essa diferente abordagem para analisar tipologia rítmica,
fala; e apenas uma forma de “data sorting on the basis of baseada em medidas descritivas de dados acústicos, embora
consonantal and vocalic, i.e. local segmental, durations in their plausível, perde a interação entre os osciladores silábico e
point-to-point variability, not with global rhythmical patterns”. acentual. Esta pesquisa, por outro lado, compara os resultados
Por outro lado, a abordagem dos osciladores acoplados, a anteriores de Meireles [19] sobre esses dois dialetos usando a
qual lida com a interação entre um oscilador silábico e um abordagem de classificar os ritmos da fala de acordo com o
acentual, é capaz de explicar “both universal and language- parâmetro força de acoplamento, bem como acrescenta o
specific properties of rhythm by means of general principles dialeto capixaba na análise.
applicable to all languages” [7]. Além disso, uma comparação
entre o índice PVI do tamanho da sílaba e a força de II. METODOLOGIA
acoplamento entre os dois osciladores do modelo dinâmico do
ritmo (de agora em diante, MDR) mostrou que o último A. Corpora (Heading 2)
parâmetro é mais afinado com o desempenho rítmico dos Para este estudo, um excerto de um livro de Monteiro
falantes, pois reflete melhor diferenças em estilos de fala [7]. Lobato [17] foi lido por 12 falantes nativos do português
4
brasileiro, na faixa de 15 a 25 anos, em três taxas de elocução III. RESULTADOS
(lenta, normal e rápida). Os falantes são mineiros de Belo Semelhantemente aos resultados de [6, 7], o número de
Horizonte (2 homens e 2 mulheres), baianos de Conceição do unidades VV não produzir interceptos significativos para a
Jacuípe (2 homens e 2 mulheres) e capixabas de Vitória (2 maioria dos falantes e condições (6 de 32 coeficientes, 2
homens e 2 mulheres). São, pois, considerados representantes dialetos x 4 falantes x 3 taxas, mais o dialeto baiano x 4
típicos de seus dialetos. falantes x 2 taxas (normal, rápida)). Por essa razão, incluímos
As distintas taxas de elocução foram obtidas com as o número de sílabas fonológicas (SF) como uma variável
seguintes instruções e ordem: (1) normal: fala de maneira independente na análise. No entanto, diferentemente dos
confortável; (2) lenta: fale o mais lento que puder, sem estudos de Barbosa, o uso da SF não resultou em um maior
introduzir pausas entre as sentenças; (3) rápida: fale o mais número de interceptos significativos (5 de 32 coeficientes).
rápido que puder sem introduzir distorções na fala. Como podemos notar, a taxa lenta foi excluída da análise do
dialeto baiano, pois todos falantes introduziram pausas entre
B. Procedimentos as palavras.
É importante ressaltar que dos 6 interceptos significativos
Procedimentos semi-automáticos foram usados na
com unidades VV, 5 foram encontrados na taxa rápida. Além
observação de diferentes estruturas rítmicas com o aumento da
taxa de elocução. Primeiramente, as unidades VV foram disso, todos coeficientes significativos com SF foram achados
etiquetadas no Praat [9] com o script BeatExtractor [4], na taxa rápida. Esse achado relaciona-se com os resultados de
Meireles [17, 18, 19] sobre a diminuição do desvio-padrão da
seguida de correção manual. O intervalo do começo de uma
duração das unidades VV e do GA nas taxas rápidas.
vogal até a próxima vogal define a unidade VV. Por exemplo,
“em seguid(a)” foi segmentada como: /eNs/, /eg/ e /id/, e então Considerando essa diminuição, a probabilidade de achar
resultados significados em regressões lineares é maior nas
foi extraída a duração de cada unidade VV. Por fim, o script
Stress Group Detector do Praat [9] foi rodado, resultando em taxas rápidas.
Como tínhamos um conjunto complexo de dados para
informações como: (i) duração do VV momento-a-momento;
correlação (3 dialetos x 3 taxas x 4 falantes), decidimos
(ii) duração do grupo acentual; e (iii) unidades VV por GA.
primeiramente usar a taxa normal para comparação dialeto, e,
Os grupos acentuais foram delimitados automaticamente
então, comparar individualmente os efeitos da taxa de
pelos seguintes passos: a) normalização por z-score para
eliminar os efeitos da duração intrínseca dos segmentos em elocução em cada dialeto. Assim, executamos ANOVAs
cada duração do VV [4]; b) suavização da evolução dos unifatoriais para observar similaridades de taxa de elocução
valores de z-scores usando a fórmula: entre os dialetos e falantes. Em outras palavras, queríamos
5 z i + 3z i −1 + 3 z i +1 + z i − 2 + z i + 2 . Esse procedimento minimiza os
saber se as taxas qualitativas (lenta, normal, rápida) eram
i
z smoothed =
13 similares às correspondentes taxas quantitativas (sílabas/s).
efeitos de oscilação local de duração (acentos lexicais não Com base nesses resultados, por não serem suas taxas
marcados frasalmente e efeitos remanescentes de duração qualitativas iguais a dos outros falantes, os seguintes falantes
intrínseca) e determina as fronteiras de grupos acentuais por foram excluídos das seguintes taxas: a) lenta: BC e RC (MG);
pontos de máximo na curva de duração suavizada; c) b) normal: VH (MG); e c) rápida: BM (ES), VH (MG), e BA
computação da duração do GA e do número de unidades VV (BA). Todas as análises subsequentes, portanto, não incluíram
por GA para comparar as distribuições em três taxas de esses falantes.
elocução rates — lenta, normal e rápida — para cada falante (a Uma ANOVA unifatorial com taxa de elocução em função
distribuição de duração e número de unidades VV. O número dos dialetos, todos falantes incluídos, mostrou uma diferença
de sílabas fonológicas por grupo acentual foi contado significativas entre os dialetos apenas para a taxa normal (F(2,
manualmente. 2068)=8,6228, p < 0.00019). Esse resultado pode ser
C. Força de acoplamento entre os osciladorestions explicado pelas instruções para aquisição da taxa. Os sujeitos
falaram o mais lentamente possível na taxa lenta e o mais
Como visto anteriormente, a força de acoplamento entre os rapidamente possível na taxa rápida, mas, confortavelmente,
osciladores silábico e acentual é calculada pelo quociente entre na taxa normal, i.e., essa última taxa reflete melhor uma forma
o intercepto (a) e a inclinação (b) da equação de regressão (r =
natural de pronunciar sentenças nos dialetos. Em acréscimo,
a/b). Além disso, como o acréscimo do nível de proeminência
(p) reflete melhor a variância das durações dos grupos essa taxa reflete resultados anteriores comparativos entre os
acentuais, essa medida foi acrescentada na regressão linear dialetos mineiro e baiano. Meireles e colegas [19] mostraram
múltipla. Essa última medida é simplesmente o z-suavizado de que os falantes do sudeste falam mais rápido que os do
cada acento frasal, que é retornado pelo script SGDetector. nordeste. Assim, nossos dados corroboram esse resultado, pois
Como [6,7] aponta: “due to the techniques applied, this value is os dois dialetos do sudeste (MG, ES) foram significantemente
not a subpart of the stress group duration”, mas melhora os diferentes do do nordeste (BA) na taxa normal (MG média (x)
coeficientes de correlação dos dados. = 4.6, e desvio-padrão (dp) = 0.5; ES x = 4.4, e sd = 0.4; BA x
= 3.9 média, e dp = 0.4).
No entanto, apenas um exemplo de intercepto significativo
foi achado na taxa normal. Por outro lado, todos os outros
interceptos significativos foram encontrados na taxa rápida.
CNPq. (sponsors)
5
Assim, todas comparações rítmicas entre os dialetos foram periodicidade e a estruturação), mas também e sensível a
baseadas nessa taxa. Além disso, os textos sem significância variações linguísticas em função do estilo de fala, da taxa de
para este parâmetro foram excluídos da comparação dialetal. elocução, das estruturas sintáticas e do conhecimento prévio
Por fim, tivemos 2 falantes representando o dialeto baiano, 2 do texto lido.
representado o mineiro e 1 falante o capixaba. Como podemos
ver, esses falantes foram agrupados na tabela 1.
A tabela 1 mostra as equações de regressão linear na taxa Coupling strength x rate
rápida de acordo com o dialeto (MG, ES, BA) e o tipo de
unidade silábica (VV ou SF). A força de acoplamento c é o
quociente entre o intercepto (a) e a inclinação das equações.
Todos coeficientes de correlação foram altamente significantes
1.5
(R2 > 0.82, p < 10-4). As significâncias desses interceptos estão
indicada entre parênteses. c é considerado indefinido para um
valor não-significativo de intercepto ou para um a negativo. A
taxa de elocução (te) é dada em VV/s ou SF/s. Esses resultados
1.0
estão plotados em função da taxa de elocução na figura 1.
c
Tabela 1. Equações de regressão na taxa rápida para 3
0.5
dialetos do PB (MG, ES, BA) considerando o número de BA_VV
BA_Syl
unidades VV (nVV) e o número de sílabas fonológicas (nSil). MG_VV
Força de acoplamento (c), speech rate (te), e a magnitude do MG_Syl
ES_VV
acento frasal (p) são dadas.
0.0
ES_Syl
MG I = 187 + 102nSil +86p (7.1e-5) 1.83 6.3 Figure 1. Relação entre taxa de elocução (unidades VV ou
ES I = -232 + 272nVV +60p (0.01) u 4.0 SF) e a força de acoplamento para 3 dialetos do PB.
ES I = 121 + 128nSil +49p (0.02) 0.95 4.0
BA I = 125 + 153nVV+63p (0.002) 0.81 4.2 Um ponto a ser considerado na abordagem, contudo, e o
BA I = 143 + 113nSil +63p (6.4e-3) 1.26 4.2 fato da analise ser bastante demorada. Muitos falantes
precisam ser usados para serem selecionados poucos dados
Considerando o número de SF, os resultados mostram que com o coeficiente intercepto estatisticamente significativo. Em
o dialeto mais acentual é o mineiro (1,83), seguido pelo baiano nosso caso, apenas 5 regressões lineares (de 36) puderam ser
(1,26) e capixaba (0,95), o que está de acordo com os usadas na analise. Também precisamos investigar porque a
resultados de Meireles [19], o qual seguiu uma diferente silaba fonológica pode ser um parâmetro mais confiável do
abordagem metodológica. Pelo menos para dois dialetos, esse que a unidade VV (vide [6,7]).
padrão é o mesmo se consideramos o número de VVs (MG Nossos resultados mostram uma aplicação da abordagem de
(1.68) > BA (0.81). Em acréscimo, embora não foi encontrada osciladores acoplados para tipologia rítmica. De acordo com
significância para taxa em função dos dialetos, a maior taxa os dados, devidamente tratados estatisticamente, encontramos
foi encontrada para o dialeto mineiro, que também está de uma escala de ritmo menos acentual para mais acentual da
acordo com resultados prévios de Meireles. seguinte forma: MG (r = 1,83; taxa de elocução = 6,3) > SP
Apesar de nossos dados sugerirem que o dialeto baiano é (1.66; 6.6) > BA (1,26; 4.2) > ES (0,95; 4,0).
mais acentual do que o capixaba, mais dados precisam ser Barbosa [6] argumenta que o aumento da taxa de elocução
coletados para clarear esse ponto, pois apenas um a favorece o ritmo silábico. Esse argumento parece estar
significante foi encontrado para este dialeto. Pode até ser que refletido em seus dados (vide tabela 2 do artigo de Barbosa
o falante capixaba estudado seja um falante naturalmente [6]). No entanto, não temos certeza se isso é verdadeiro para o
devagar que não segue as tendências rítmicas de sua área português brasileiro em geral, pois, em nossos dados, os
dialeto. Além disso, nenhuma análise ANCOVA foi rodada dialetos mais acentuais foram os mais rápidos. Meireles e
para observar se as equações de regressão desses dialetos colegas [19] discutiram essa questão e concluíram que as taxas
foram estatisticamente diferentes. rápidas podem, ao contrário de Barbosa, estar associada com
ritmo acentual. Assim, estudos posteriores com maior número
de falantes e dialetos precisarão ser realizados para investigar
IV. DISCUSSÃO
melhor os efeitos da taxa de elocução no ritmo da fala.
Os resultados dão suporte ao uso da abordagem de Outra questão relevante apontada por nossos resultados e a
osciladores acoplados para explicar a variabilidade rítmica nas ocorrência de coeficientes significativos do intercepto
línguas do mundo. Não apenas o MDR e capaz de representar principalmente na taxa rápida. Esse fato encontra respaldo nos
os ritmos linguísticos levando em consideração todos os estudos de Meireles [17,18,19], os quais mostram um
aspectos importantes para produção do ritmo (em essência a decréscimo do desvio-padrão em taxas rápidas, i.e., uma
6
menor variabilidade duracional e esperada em taxas extremas. Português falado, v. II: níveis de análise lingüística. Campinas: Editora
Como consequência, pode ser mais fácil encontrar equações da Unicamp, 1992.
[22] O’Dell, M., Nieminen, T., “Coupled Oscillator Model of Speech
de regressão linear com parâmetros significativos nas taxas Rhythm”, Proc. XIVth ICPhS, San Francisco, 1075-1078, 1999.
rápidas. [23] Ramus, F., Nespor, M., Mehler, J., “Correlates of linguistic rhythm in
the speech signal”, Cognition, 73:265–292, 1999.
ACKNOWLEDGMENTS (HEADING 5)
Os autores agradecem Plínio Barbosa, Karen Currie e Pablo
Arantes por sugestões e o CNPq por financiar a pesquisa.
REFERENCES
[1] Abaurre-Gnerre, M. B. Processos fonológicos segmentais como índices
de padrões prosódicos diversos nos estilos formal e casual do português
do Brasil. Caderno de Estudos Lingüísticos, 2: 23-34, 1981.
[2] Barbosa, P. A. Syllable-timing in Brazilian Portuguese”: uma crítica a
Roy Major. D.E.L.T.A., 16 (2), 369-402, 2000.
[3] Barbosa, P. A., “Explaining Cross-Linguistic Rhythmic Variability via a
Coupled-Oscillator Model of Rhythm Production”, Proc. Speech
Prosody 2002 Conf. [CD], Aixen- Provence, 163–166, 2002.
[4] Barbosa, P. A., Incursões em torno do ritmo da fala, Campinas, Brazil:
Pontes/Fapesp, 2006.
[5] Barbosa, P. A., “From syntax to acoustic duration: a dynamical model of
speech rhythm production”, Speech Communication, 49:725–742, 2007.
[6] Barbosa, P. A. “Measuring speech rhythm variation in a modelbased
framework”. In.: Proc. Interspeech 2009, Brighton, UK, 1527-1530,
2009.
[7] Barbosa, P. A, Viana, M. C., Trancoso, I.. “Cross-variety Rhythm
Typology in Portuguese”. In.: Proc. Interspeech 2009, Brighton, UK,
1011-1014, 2009.
[8] Bertinetto, P. M., Bertini, C., “Towards a unified predictive model of
Natural Language Rhythm”, Quaderni del Laboratorio di Linguistica
della SNS, 7, 2007/08.
[9] Boersma, P., Weenink, D., “Praat: doing phonetics by computer”
(Version 5.0.35) [Computer program], Online: http://www.praat.org,
accessed in 2008.
[10] Cagliari, L. C. and Abaurre, M. B. M. Elementos para uma investigação
instrumental das relações entre padrões rítmicos e processos fonológicos
no português brasileiro. Caderno de Estudos Lingüísticos, 10: 39-57,
1986.
[11] Cummins, F., Port, R., “Rhythmic constraints on stress timing in
English”, J. Phon., 26:145–171, 1998.
[12] Deterding, D., “Letter to the Editor. The measurement of rhythm: a
comparison of Singapore and British English”, J. Phon., 29:217–230,
2001.
[13] Fraisse, P. Les rythmes. Journal Français d’Oto-Rhino-laryngologie, n.
Supplément numéro 7, p. 23–33, 1968.
[14] Fraisse, P. La Psychologie du Rythme. Paris: Presses Universitaires de
France, 1974.
[15] Kohler, K. J. “Rhythm in speech and language: a new research
paradigm”, Phonetica, 66:29-45, 2009.
[16] Low, E. L., Grabe, E., Nolan, F., “Quantitative characterizations of
speech rhythm: Syllable-timing in Singapore English”, Language and
Speech, 43:377–401, 2000.
[17] Meireles, A. R. Self-organizing rhythms in Brazilian Portuguese: speech
rate as a system perturbation. Germany: VDM Verlag, 2009.
[18] Meireles, A. R. and Barbosa, P. A. Speech rate effects on speech
rhythm. In: Speech Prosody 2008 Conference, 2008, Campinas.
Proceedings of the Speech Prosody 2008 Conference. Campinas: RG.
v.1. p.327 – 330, 2008.
[19] Meireles, A. R., Tozetti, J. P., Borges, R. R. Speech rate and rhythmic
variation in Brazilian Portuguese. In: Speech Prosody 2010 Conference,
2010, Chicago. Proceedings of the Speech Prosody 2010 Conference.
Chicago: RG. v.1. p.1 – 4, 2010.
[20] Mok, P. P. K., Dellwo, V., “Comparing native and nonnative speech
rhythm using acoustic rhythmic measures: Cantonese, Beijing Mandarin
and English”, Proc. Speech Prosody 2008, Campinas, 423-426, 2008.
[21] Moraes, J. A. and Leite, Y. F. Ritmo e velocidade da fala na estratégia
do discurso: uma proposta de trabalho. In: R. Ilari (org.) Gramática do