Chomsky e A Reinvenção Da Linguística

Chomsky: a reinvenção da Linguística
Gabriel de Ávila Othero

Eduardo Kenedy
Organizadores
1
SUMÁRIO
Introdução, organizadores
1. Ciência e gramática gerativa & ciência da gramática gerativa, Cilene
Rodrigues
2. Estruturas Sintáticas e a reinvenção da teoria linguística, Sergio Menuzzi e
3. O jovem Chomsky, sua resenha de 1959 e a derrocada do behaviorismo,
Eduardo Kenedy e Simone Guesser
4. Teoria Padrão e Teoria Padrão Estendida, Maximiliano Guimarães
5. Teoria da Regência e Ligação e a proposta de Princípios e Parâmetros,
Maria Cristina Figueiredo Silva
6. O Programa Minimalista, Danniel Carvalho
7. Os cinco problemas para a teoria linguística:
a. O problema de Humboldt, Marcus Lunguinho e Mariana Terra
Teixeira
b. O problema de Platão, Ruth E. V. Lopes
c. O problema de Descartes, Marcus Maia
d. O problema de Broca, Aniela Improta França
e. O problema de Wallace-Darwin, Vitor A. Nóbrega
8. O futuro da linguística e o legado chomskyano, organizadores
Os organizadores
Os autores
2
INTRODUÇÃO
Ao fim desta segunda década do século XXI, Noam Chomsky é considerado o

mais importante intelectual vivo. Numa pesquisa feita em 2003 pela Arts & Humanities
Citation Index (EUA), seu nome ocupou o sétimo lugar na lista dos pensadores mais
influentes da história humana – atrás somente de Marx, Lenin, Shakespeare, Aristóteles,
Platão e Freud. Sua importância em diversas áreas do conhecimento é notável (Ciências
Políticas, Computação, História, Psicologia, Filosofia, Biologia, entre outras). Como
linguista, sua principal ocupação profissional desde os anos 1950, Chomsky
revolucionou a área ao dar início ao tipo de investigação em linguagem que hoje
conhecemos como Linguística Gerativa – um ramo de estudos extremamente frutífero e
próspero, como o leitor descobrirá nas próximas páginas. O impacto de suas ideias
sobre a linguística dos séculos XX e XXI foi tamanho que Daniel Everett (Bentley
University) – talvez o maior antagonista contemporâneo da Linguística Gerativa –
recentemente assim descreveu a reinvenção promovida por Chomsky: “numa época em
que todos cantavam como Frank Sinatra, Chomsky chegou como Elvis Presley
apresentando o rock n’ roll” (em citação livre).
Levar o leitor a compreender o poder do novo paradigma chomskyano nos
estudos da linguagem é o objetivo fundamental deste livro. Para tanto, mostraremos, nas
páginas que seguem, como Chomsky iniciou a “reinvenção” da Linguística já no início
da segunda metade do século passado, inaugurando uma agenda de pesquisa que se
manteve fecunda ao longo de mais de 60 anos e que ainda hoje permanece em plena
atividade e vitalidade. Daí o título que escolhemos: Chomsky: a reinvenção da
Linguística (em claro diálogo com o livro Saussure: a invenção da Linguística,
publicado pela Contexto em 2013 e que contou com a organização dos colegas José
Luiz Fiorin, Leci Barbisan e Valdir Flores, a quem agradecemos a inspiração).
Optamos, neste livro, por uma progressão linear de capítulos que levasse o leitor
a conhecer a Linguística chomskyana através de um percurso tanto histórico-
cronológico quanto temático. Por isso, cada capítulo aborda um momento importante do
desenvolvimento do pensamento do autor ao longo das seis últimas décadas. Iniciamos
essa jornada com o texto de Cilene Rodrigues (PUC-Rio), Ciência e gramática gerativa
& ciência da gramática gerativa, que nos conta sobre o contexto da época em que a
3
teoria gerativista teve início e por que ela foi considerada uma “reinvenção” nos estudos
sobre linguagem e cognição humanas. Depois, voltamos nossa atenção para a primeira
publicação de impacto de Chomsky: seu livro de 1957 Estruturas sintáticas, num
capítulo em que um de nós (o Gabriel, da UFRGS), juntamente com Sergio Menuzzi
(também da UFRGS), fala sobre a importância da publicação desse livro para o
desenvolvimento da teoria que estava, à época, apenas começando. No capítulo
seguinte, o outro de nós (o Eduardo, da UFF), juntamente com a Simone Guesser (UFRR),
discute a resenha que Chomsky publicou sobre o livro Verbal behavior
(Comportamento verbal), de B. F. Skinner. A resenha solapou de maneira crítica e
definitiva o comportamentalismo norte-americano, redesenhando completamente tanto a
psicologia como a linguística a partir de então.
Na sequência, passamos a estudar as fases do empreendimento gerativista: Max
Guimarães (UFPR) escreve sobre o período que ficou conhecido como a Teoria Padrão e,
na sua sequência, a Teoria Padrão Estendida; Maria Cristina Figueiredo Silva (UFPR)
escreve sobre a Teoria da Regência e Ligação e sobre a proposta de Princípios e
Parâmetros; e Danniel Carvalho (UFBA) assina o capítulo sobre o Programa Minimalista,
iniciado em meados da década de 1990.
Depois desse apanhado histórico, discutiremos, nos capítulos subsequentes, as
cinco grandes questões propostas pela teoria linguística, tal como vislumbradas por
Chomsky: sobre o conhecimento interiorizado a respeito da gramática de uma língua (o
problema de Humboldt, em capítulo assinado por Marcus Lunguinho, da UnB, e por
Mariana Terra Teixeira, doutoranda da PUC-RS); sobre a aquisição da linguagem (o
problema de Platão, em capítulo de Ruth Lopes, da Unicamp); sobre o processamento
psicolinguístico (o problema de Descartes, no capítulo de Marcus Maia, da UFRJ); sobre
a relação entre conhecimento gramatical e os aspectos fisiológicos do cérebro (o
problema de Broca, em capítulo assinado por Aniela Improta França, da UFRJ); e,
finalmente, sobre como a linguagem emergiu na espécie humana (o problema de
Wallace-Darwin, na discussão conduzida por Vitor Nóbrega, recém-doutor pela USP).
Finalmente, nós, organizadores, assinamos um capítulo de fechamento, em que

discutimos o futuro possível da linguística sob o legado chomskyano.
Como se vê, professores e pesquisadores de diversas universidades de diferentes
estados brasileiros, das regiões Sul, Sudeste, Centro-oeste, Norte e Nordeste,
concentraram esforços para, neste livro, apresentar ao leitor a origem, a evolução e os
4
rumos do pensamento científico daquele que certamente é um dos maiores linguistas de
todos os tempos: Avram Noam Chomsky.
Os organizadores
5
CIÊNCIA E GRAMÁTICA GERATIVA & CIÊNCIA DA GRAMÁTICA
GERATIVA
Cilene Rodrigues
A ciência e os 7 erros do senso comum
Frequentemente, ao apresentar as pressuposições e as hipóteses teóricas de seu

programa de pesquisa, o cientista tem de lidar com comentários como “isso é só um
palpite!”, ou “isso é só uma teoria!”. Esse é o primeiro erro.
A expressão “só uma teoria” expressa o senso comum, em que a palavra teoria é,
muitas vezes, tida como sinônimo de opinião ou conjunto de opiniões. No entanto,
como afirmou o biólogo Kenneth R. Miller em entrevista ao The New York Times,
em ciência, a palavra teoria não se aplica de maneira leve, não significando

palpite ou achismo. Uma teoria é um sistema de explicações que ata um
conjunto de fatos. Ela não apenas explica esses fatos, como também prevê o
que podemos encontrar se fizermos novas observações.1
O filósofo da ciência, Karl Popper, por vez, oferece a seguinte definição:
As teorias são redes, lançadas para capturar aquilo que

denominamos “o mundo”: para racionalizá-lo, explicá-lo, dominá-
lo. Nossos esforços são no sentindo de tornar as malhas da rede
cada vez mais estreitas. (1985: 60-61)
A definição dada por Popper enfatiza a contribuição da capacidade humana de

teorização para a sobrevivência e pujança da espécie humana. No entanto, na última
sentença, enfatiza-se também a busca da ciência por um refinamento do nosso
entendimento sobre o mundo. Nessa visão, a ciência não é só produtora de
conhecimento, é também uma eterna questionadora desse conhecimento, ou, como
considera, o astrônomo Carl Sagan (1985 [não aparece nas Referências]), a ciência é um
processo de autocorreção.
6
Conclui-se, portanto, que a mutabilidade é propriedade inerente da ciência. Aqui
está o segundo erro cometido pelo senso comum: julgar teorias científicas como
conjuntos de verdade imutáveis, condenando, como pouco científicos paradigmas
teóricos que apresentam revisões de suas hipóteses.
Popper (1982) contribuiu para a epistemologia da ciência, ao propor o critério de
falseabilidade como solução para o problema da demarcação de teorias científicas, em
oposição a teorias não científicas. Para Popper, as teorias científicas progridem em um
ciclo de dois momentos: no primeiro momento, uma hipótese arriscada sobre um
fenômeno X é formulada; no segundo momento, a hipótese em questão é testada, sendo
a testagem feita com o intuito de refutar a hipótese sobre X, e não de confirmá-la. Não
havendo refutação, a hipótese é mantida e submetida a novas testagens. Isto é, o
segundo momento do ciclo perdura até a hipótese ser refutada, daí a relevância de
métodos replicáveis, passíveis de verificação. Assim que a refutação ocorre, o cientista
volta para o primeiro momento, formulando uma nova hipótese ou reformulando a
hipótese inicial. Portanto, de acordo com o critério de demarcação proposto por Popper,
hipóteses científicas são hipóteses audaciosas, fazendo previsões claras sobre o
fenômeno sob investigação, pois só dessa forma as previsões inicias podem ser testadas
e refutadas. Por conseguinte, não são boas hipóteses científicas aquelas muito tímidas,
que não se arriscam de maneira clara. Crucialmente, hipóteses que não correm o risco
de contestação, por serem compatíveis com todas as observações possíveis, não são
hipóteses científicas. Sendo assim, proposições de caráter permanente, imutável, não
são científicas, pois não podem ser refutadas. Isto é, a busca pela refutação, propriedade
essencial do método científico, por si só justifica o caráter instável de hipóteses
verdadeiramente teóricas.
Lakatos (1970, 1971, 1978), entretanto, observa que uma teoria científica
contém um núcleo e uma heurística, os quais não estão sujeitos ao processo proposto
por Popper. O núcleo consiste em um conjunto de proposições que definem a orientação
teórica do programa de investigação e, portanto, o próprio objeto da investigação. A
heurística, por sua vez, orienta como a investigação deverá ser realizada – heurística
positiva, e como não deverá ser – heurística negativa. Esses formam o componente
rígido da teoria, estando envoltos em hipóteses auxiliares, flexíveis, sujeitas a constante
testagem, como proposto por Popper.
De qualquer modo, o critério de falseabilidade nos informa que é um erro
científico não colocar as hipóteses de uma teoria em testagem. Quando caracterizamos
7
uma teoria como sendo “só uma teoria” (erro 1), estamos nos recusando a fazer o
trabalho de refutação de suas hipóteses. Veja que, nesse caso, não estamos refutando as
hipóteses, estamos nos negando a refutá-las.
Ao falarmos sobre o caráter audacioso de uma teoria, é importante refletirmos
também sobre o que ela se propõe a explicar. Chegamos, portanto, ao terceiro erro do
senso comum: muitas vezes, entende-se que as teorias buscam explicar dados que
podem ser observados naturalmente. No entanto, como argumentam Bogen e
Woodward (1988), no campo da ciência, é preciso diferenciar dado e fenômeno. Vamos
ao exemplo dos autores. Sabemos que o chumbo derrete a 327 graus Celsius. Esse saber
é resultado de vários experimentos. No entanto, por mais controlado que esses
experimentos sejam, pode ser que nenhum deles tenha nos dado 327 graus como a
temperatura exata de derretimento. Ou seja, o que se coleta em uma configuração
experimental como essa são medidas oscilantes de temperatura. Isso porque existem
variáveis externas ao experimento (relacionadas ao background experimental, como
temperatura do ambiente, precisão dos termômetros, controle da fonte de calor), que
interferem nos dados obtidos e que podem não ser completamente eliminadas. De posse
de um entendimento sobre a natureza dessas variáveis (por exemplo, entender que elas
são realmente independentes dos fatores manipulados no experimento), pode-se
proceder verificando a média de distribuição das medidas de temperatura obtidas. As
diversas medidas obtidas são os dados, a média extraída delas é o fenômeno. O que se
busca explicar, no campo da ciência, é o fenômeno, e não os dados. Enquanto os dados
são instáveis, por estarem sujeitos à ação de variáveis externas, o fenômeno é estável. É
por essa razão que a ciência toma o fenômeno como seu objeto de investigação.
A diferença em questão pode ser vista em todos os campos do conhecimento.
Por exemplo, nas neurociências, gravações de tempos de reação a estímulos auditivos
(palavras, por exemplo) em populações clínicas e não clínicas são dados que podem
refletir o fenômeno de efeitos de recência e primazia na memória de curto prazo. O que
os neurocientistas buscam explicar são esses efeitos na memória e não os tempos de
reação em si mesmos (McGhie et al., 1965). Do mesmo modo, entomólogos, ao estudar
navegação espacial em formigas, obtêm como dados as variadas rotas usadas por
diferentes formigas em diferentes situações de forrageamento. Essas rotas refletem
processos de memória e de integração de informações do campo visual que garantem
navegações espaciais eficientes para a espécie. Esses processos são os potenciais
explananda e podem levar a questões bastante complexas, como a existência de mapas
8
cognitivos em insetos (Bennett, 1996 [NÃO CONSTA ESTA DATA NAS REFERÊNCIAS];
Wystrach et al., 2011). Portanto, a relação entre teoria e dado empírico não é direta, mas
indireta, obedecendo a hierarquia abaixo, na qual há um processo de retroalimentação,
já que não há observação empírica, extração de generalizações e elaborações de
hipóteses sem uma teoria.
Observação empírica ⇔ Generalização/Fenômeno ⇔ Hipótese ⇔ Teoria
A observação dessa hierarquia é igualmente importante também para entendermos

por que uma teoria deve ser audaciosa. Quanto maior for o escopo empírico das
generalizações/fenômenos que calçam uma teoria, maior será seu poder explicativo,
porém, da mesma forma, maior será também seu risco de refutação.
Outra conclusão que tiramos dessa discussão é que a teoria trabalha com idealização
de dados. Esse é quarto erro do senso comum: a não aceitação da idealização. Tal erro é
consequência do terceiro erro: entender que uma teoria deve explicar os dados
empíricos como eles são. Ao argumentar que o chumbo derrete a 327 graus Celsius, não
se está defendendo os dados, mas o fenômeno, ou seja, uma idealização feita a partir de
fatos observáveis, que é o que o pesquisador se propõe a explicar.
Note que o fenômeno, na maioria das vezes, pode não ser observável a olho nu. A
física quântica, por exemplo, além de nos informar que coisas invisíveis existem, como
prótons, nêutrons e elétrons, nos informa também sobre fenômenos bastante abstratos,
como interações à distância entre esses elementos invisíveis e ocupação simultânea de
mais de um lugar no espaço por esses elementos (elétrons). Podemos dizer, nesse
sentido, que refugar diante de uma proposição teórica que faz menção a fatos que estão
além da nossa percepção sensorial é o quinto erro do senso comum. O papel da ciência é
descrever o mundo como ele é, e não como nós o percebemos. Como afirma Lakatos, o
desenvolvimento científico ocorre “essencialmente no mundo das ideias, no terceiro
mundo de Platão e de Popper, no mundo do conhecimento articulado que é
independente dos sujeitos que conhecem” (1978: 92).
O sexto erro do senso comum é confundir o objeto de pesquisa com o modelo
formal do objeto interno à teoria (Suppe, 1967, 1974). Da astronomia às neurociências e
às ciências da cognição, é comum o uso de modelos formais para melhor compreensão
dos objetos em investigação. Esses modelos são estruturas lógico-matemáticas criadas
para capturar propriedades fundamentais do objeto real, mas eles não são, nem devem
9
ser, reconstruções do objeto, sendo antes simulações simplificadas, idealizadas. Deve-se
considerar que muitas vezes o objeto não pode ser observado diretamente (buracos
negros e processos mentais, por exemplo) ou é tão complexo que não é possível
manipulá-lo diretamente ou em sua plenitude (certos aspectos do comportamento
humano, por exemplo). Nesse caso, o uso de modelos formais, com recortes no
fenômeno em investigação, faz-se necessário. Por isso, é um erro partir do pressuposto
de que o modelo é uma réplica do próprio objeto e rejeitar uma teoria sobre X porque o
modelo formal proposto para X não é como X, ou não contém todas as propriedades de
X.
O filósofo Godfrey-Smith (2003) sugere que teorias sejam vistas como mapas. A
analogia é bastante instrutiva: o mapa está para o território representado, assim como o
modelo formal está para o objeto modelado. Nem o mapa é o território real, nem o
modelo formal é o objeto existente. Nesse contexto, recuperamos um dos contos mais
interessantes de Jorge Luis Borges, “Del rigor da ciência”:
En aquel Imperio, el Arte de la Cartografía logró tal Perfección que el Mapa

de una sola Provincia ocupaba toda una Ciudad, y el Mapa del Imperio, toda
una Provincia. Con el tiempo, estos Mapas Desmesurados no satisficieron y
los Colegios de Cartógrafos levantaron un Mapa del Imperio, que tenía el
Tamaño del Imperio y coincidía puntualmente con él. Menos Adictas al
Estudio de la Cartografía, las Generaciones Siguientes entendieron que ese
dilatado Mapa era Inútil y no sin Impiedad lo entregaron a las Inclemencias
del Sol y los Inviernos. En los Desiertos del Oeste perduran despedazadas
Ruinas del Mapa, habitadas por Animales y por Mendigos; en todo el País no
hay otra reliquia de las Disciplinas Geográficas.
[É PRECISO TRADUZIR]
O que Jorge Luis Borges capturou sensivelmente em versos é a não utilidade

científica da identificação entre o modelo e a coisa representada.
Por fim, o sétimo erro do senso comum é julgar uma teoria como produtiva ou
não produtiva de acordo com sua aplicabilidade. Muitas vezes, o teórico, ao apresentar
seus pressupostos, depara-se com perguntas como “isso serve para quê?”. É provável
que uma maior aceitação de algumas ciências de base, como a física quântica, advenha
de sua aplicabilidade em áreas importantes para a sobrevivência e a superioridade bélica
da nossa espécie, como atestam desenvolvimentos na área da saúde e na área militar.
Áreas mais recentes do conhecimento, que ainda apresentam pouca aplicabilidade são,
não raramente, negadas como ciência. Não obstante, é necessário reconhecer que a
aplicabilidade não é condição sine qua non para que um conjunto de proposições sobre
um fenômeno X seja uma teoria sobre X. A aplicabilidade é um bônus que as ciências
10
básicas nos fornecem quando podem. Se toda teoria tivesse de ter aplicabilidade para
ganhar status científico, nenhuma a priori o teria, já que aplicabilidade eficiente e
produtiva depende de acúmulo de conhecimento, o que por sua vez requer refinamento
teórico.
Portanto, negar de antemão o caráter científico de uma área do conhecimento,
caracterizando seu arcabouço teórico como não científico, é destruir uma ponte antes de
atravessá-la, causando estagnação científica e, consequentemente, impossibilitando
possíveis desdobramentos importantes para áreas aplicadas. A atitude crítica correta do
ponto de vista científico é, como exposto anteriormente, conceder às hipóteses
levantadas o status de científicas e proceder com o processo de verificação proposto por
Popper.
Na área de estudos da linguagem, a cientificidade da Linguística formal,
especialmente da Gramática Gerativa, é muitas vezes questionada e, não raramente,
ouvimos contra-argumentos como “trata-se apenas de uma teoria” ou ainda “essa
abordagem trabalha com dados idealizados, e não com a linguagem real”.
Primeiramente, é preciso entender que esse tipo de contra-argumento não traz
contribuições para o nosso entendimento sobre a linguagem, tratando-se antes de erros
argumentativos sem valor do ponto vista científico. Para se questionar de maneira
científica a linguística formal é preciso testá-la, mostrando que as hipóteses da teoria
são refutáveis. Obviamente, a testagem adequada requer entendimento das hipóteses em
questão, especialmente de suas previsões, bem como do arcabouço teórico, no qual elas
foram elaboradas.
É a eficiência do processo de testagem que promoveu e tem promovido
mudanças de modelo teórico significativas dentro do Programa de investigação. Assim,
se aplicarmos o critério de falseabilidade proposto por Popper, não poderemos negar o
caráter científico da Gramática Gerativa, introduzida nas ciências da linguagem por
Noam Chomsky, em meados do século XX. A crítica relativa à idealização dos dados
empíricos é igualmente inadequada, visto ser esse um procedimento natural entre teorias
científicas. O que a Gramática Gerativa busca explicar são fenômenos universais ou
específicos de determinadas gramáticas e não os dados empíricos observáveis. Nessa
área de estudos, dados empíricos são dados relativos à aceitabilidade ou
interpretabilidade de expressões linguísticas. Esses dados são altamente instáveis,
estando sujeitos a muitas variáveis externas. Por exemplo, algumas pessoas são mais
lenientes que outras em seus julgamentos de aceitabilidade por motivos pragmáticos,
11
acomodando a fala do outro com mais facilidade. Além disso, fatores relativos a
escolhas lexicais podem também influenciar um julgamento de aceitabilidade. Assim,
uma teoria de caráter formal sobre a linguagem humana não pode ser erguida sobre
dados empíricos, mas antes sobre os fenômenos que esses dados refletem.
O surgimento de um novo paradigma científico nos estudos da linguagem
Em meados do século XX, questões que atualmente são atreladas a funções

mentais, eram vistas como resultantes de tendências puramente comportamentais.
No campo da Linguística, estava em cena, nos Estados Unidos e na Europa, o
Estruturalismo, construído a partir das ideias deixadas por Ferdinand de Saussure, que
entendia o objeto da Linguística como sendo a língua considerada em si mesma e por si
mesma (Saussure, 1916). O Estruturalismo norte-americano, influenciado
marcadamente por Leonard Bloomfield, voltou-se para o estudo descritivo de corpora
de línguas particulares, com foco no desenvolvimento de métodos para sua classificação
e descrição. Acreditando não haver limites para a variação entre as línguas, a criação de
procedimentos indutivos para a descoberta e a classificação dos componentes das
diversas línguas era a norma do momento, e, dado que a variação entre as línguas
concentra-se visivelmente nos componentes da morfologia, da fonologia e da fonética, o
Estruturalismo bloomfieldiano defendia que os estudos linguísticos deveriam avançar de
maneira estanque (isto é, sem misturar as análises), do nível fonético para o nível
fonêmico e depois para o nível morfológico. A sintaxe era, na maioria das vezes, posta
de lado e, quando considerada, era descrita com base apenas em categorias sintáticas e
tipos de construção. A semântica, por sua vez, não era tida objeto investigação da
linguística. Bloomfield (1931: 156), por exemplo, afirma: “o significado não pode ser
definido na nossa ciência [linguística] e não deve entrar nas nossas definições”.
Na Psicologia, não era muito diferente. Prevalecendo a tendência behaviorista,
defendia-se a tese que de os estudos sobre os seres deveriam se concentrar em descrever
rigorosamente o comportamento real dos indivíduos, evitando menção a qualquer lei
mental subjacente ao comportamento (veja o capítulo “O jovem Chomsky, sua resenha
de 1959 e a derrocada do behaviorismo”). Essa predominância do fisicalismo estendia-
se também sobre o campo da Biologia. Chomsky (2007: 10), fazendo uma retrospectiva
dos anos 1950, comenta: “o panorama na Biologia geral era parecido, capturado pela
observação de Gunther Stent (muito depois) de que a variação entre os organismos é
12
livre a ponto de constituir “uma quase infinitude de tipo particulares, a serem resolvidos
caso por caso”.
O Estruturalismo não foi, no entanto, homogêneo, sendo formado por várias
correntes. A corrente chamada de Estruturalismo pós-bloomfieldiano, por exemplo,
teve grande influência no pensamento chomskyano, podendo ser considerada o berço da
Gramática Gerativa. Essa corrente tinha Zellig Harris como um de seus principais
representantes. Bastante influenciado pelos desenvolvimentos na área da matemática e
da lógica, Harris distanciou-se do Estruturalismo bloomfieldiano, defendendo um
método formal indutivo de descoberta de gramáticas, baseado na distribuição dos
elementos na estrutura.
Os principais pressupostos do Estruturalismo de Harris eram: (i) a análise
linguística consiste em construir representações a partir de um número finito de objetos
formais; (ii) as restrições sobre as combinações desses objetos formam a essência de
uma língua; (iii) essas restrições se aplicam à distribuição desses objetos na estrutura.2
Harris também posicionou-se contra a rigidez do método bloomfieldiano e europeu
quanto à relação entre os níveis de descrição, considerando que, partindo do nível
fonêmico, era possível criar um método geral de descoberta para os todos níveis de
descrição.
O orientando mais famoso de Harris foi Noam Chomsky (veja o capítulo
“Estruturas sintáticas e a reinvenção da teoria linguística”). Se Harris levou o
Estruturalismo a seus extremos, criando o pós-Estruturalismo, os extremos do pós-
Estruturalismo foram verificados por Chomsky, o que levou à fundação da Gramática
Gerativa. Enquanto, para Harris, o sistema formal usado pelo linguista estava à mercê
dos dados empíricos de línguas particulares, para Chomsky os sistemas formais
deveriam ser eles mesmos o objeto de estudo do linguista, a quem cabe avaliar se esses
são ou não modelos válidos de gramática naturais. Portanto, para Chomsky, a pesquisa
deve seguir o método hipotético-dedutivo. Ou seja, em um primeiro momento, define-se
um conjunto possível de gramáticas com base em critérios formais (economia
representacional, por exemplo), e, em um segundo momento, verifica-se a adequação
dessas gramáticas vis-à-vis os fenômenos observados em uma dada língua. A posição
chomskyana fica clara em Três modelos para a descrição da linguagem (Chomsky,
1956) e Estruturas sintáticas (Chomsky, 1957), considerada a obra fundadora da
Gramática Gerativa.
13
Em Estruturas sintáticas, Chomsky argumenta que teorias que se comprometem
a formular métodos de análises para descobertas de gramáticas partindo de dados brutos
ou, ainda, que se comprometem a verificar se uma gramática descreve corretamente os
dados empíricos disponíveis, são pontuais e pouco eficientes quando se almeja uma
teoria geral.
Os dois primeiros artigos de Chomsky também valem a pena ser destacados:
“Sistemas de análise sintática” (1953) e “Sintaxe e semântica lógicas: sua relevância
linguística” (1955).
Em “Sistemas de análise sintática”, Chomsky discute uma definição adequada de
categoria sintática, mas adverte que, dado o caráter preditivo da gramática, a análise
sintática é “um sistema de regras que define as sequências possíveis de categorias
sintáticas em uma dada língua, e, portanto, gera as sentenças possíveis ou gramaticais
desta língua” (1953: 243). Essa é a primeira menção à Gramática como um sistema
gerativo.
Em “Sintaxe e semântica lógicas: sua relevância linguística”, Chomsky
argumenta contra tentativas de redução dos mecanismos da gramática a modelos da
lógica simbólica (Bar-Hillel, 1954). A posição de Chomsky é que a sintaxe da lógica
não pode ser comparada com a das línguas humanas, não havendo convergências
robustas o suficiente para tomarmos essa sintaxe como um modelo idealizado das
línguas humanas. Esse contra-argumento é ilustrado com relações de inferência. A partir
de (1a), inferimos (1b). No entanto, não há inferência entre (2a) e (2b), embora a relação
lógica existente em (2a&b) seja a mesma existente entre (1a&b).
(1) a. Toda manteiga derrete a 150 graus.

b. Se esta manteiga aqui for aquecida a 150 graus, ela derrete.
(2) a. Todas os anéis que eu estava usando na festa eram de prata.

b. Se eu estive usando este anel aqui na festa, ele seria de prata.
O mesmo pode ser observado entre (3) e (4), envolvendo o conectivo “e”. Se
(3a) for verdadeiro, (3b) também é. No entanto, o valor de verdade de (4a) não assegura
o valor de verdade de (4b).
14
(3) a. O João é alto e magro.
b. O João é magro.
(4) a. A bandeira do flamengo é vermelha e preta.

b. A bandeira do flamengo é preta.
Repare que essa argumentação é também evidência contra a visão estruturalista

da linguística como uma ciência classificatória. Os pares de sentença anteriores
envolvem o mesmo tipo de construção, no entanto, não são idênticos em significado. É
importante enfatizar que casos de homonímia podem ser replicados com bastante
facilidade. Observe, por exemplo, as sentenças em (5), do inglês. Embora as duas
sentenças sejam construídas a partir das mesmas categorias sintáticas, o significado não
é o mesmo: de acordo com (5a), John é uma pessoa fácil de ser agradada; de acordo
(5b) John é uma pessoa disposta a agradar alguém. Isso indica que as estruturas
sintáticas de (5a) e (5b) são diferentes.
(5) a. John is easy to please

‘O John é/está fácil de agradar’
b. John is eager to please
‘O John é/está disposto a agradar’
John é entendido como o objeto de please em (5a) e como o sujeito em (5b). Se

o linguista se atém apenas a classificar dados como esses, nada poderá dizer sobre essas
diferenças, já que superficialmente temos o mesmo tipo de construção, envolvendo as
mesmas categorias sintáticas (Expressão Nominal + Adjetivo + Oração Infinitiva).
Em resumo, o Chomsky de 1950 questiona cientificamente a visão estruturalista
de que o papel de uma teoria é descobrir (ou validar) uma gramática partir de um
conjunto de dados brutos. A nova pressuposição oferecida – a teoria linguística como
um procedimento de avaliação das possíveis gramáticas que gera as sentenças de uma
língua, inaugura, assim, uma nova maneira de pensar a linguística enquanto ciência. O
papel do linguista não é mais o de classificar os elementos de uma determinada língua
com base em propriedades observáveis, mas compreender que tipo de procedimento
gerativo, isto é, que tipo de gramática pode gerar os fenômenos observados partir dos
dados empíricos selecionados.
15
Outra importante ruptura entre a Gramática Gerativa e o Estruturalismo é a
ênfase no nível sintático. Enquanto para o Estruturalismo as pesquisas deveriam se
concentrar nos níveis fonético, fonêmico e morfológico, a Gramática Gerativa dá à
sintaxe o status de mecanismo principal da gramática. É a sintaxe a responsável por
duas propriedades universais da competência linguística humana: infinitude e
criatividade. O sintaticocentrismo foi a causa da grande discordância entre Semântica
Interpretativa e Semântica Gerativa no final da década de 1960 (MacCawley, 1968). O
privilégio dado à sintaxe, em detrimento da semântica, é uma continuação dentro da
Gerativa do método distribucional, já que propriedades formais foram preservadas como
os elementos construtivos da gramática. Essa visão impossibilitou o desenvolvimento da
gramática como especificação de uma relação entre semântica e estrutura superficial,
como queriam os adeptos da Semântica Gerativa (para uma discussão sobre essa
disputa, ver Huck e Goldsmith, 1995).
É, contudo, incorreto descrever a Gramática Gerativa como antagônica e
totalmente independente do Estruturalismo. O programa de pesquisa chomskyano
manteve algumas das hipóteses auxiliares do Estruturalismo, especialmente do
Estruturalismo distribucional de Harris. Por exemplo, permanecerem na Gramática
Gerativa a ideia de estrutura, formada a partir de um conjunto finito de objetos formais,
e de restrições que regem a distribuição desses objetos na estrutura. A adoção dessas
hipóteses é visível no modelo formal proposto em (1957). Por outro lado, também é
incorreto descrever a Gramática Gerativa como sendo uma continuação do
Estruturalismo. O núcleo rígido do Estruturalismo tinha como pressuposição nuclear a
concepção da linguística como uma ciência taxonômica, cujo objetivo é criar métodos
indutivos de descoberta, sendo que a heurística era o entendimento de que o linguista
deveria concentrar-se nos níveis relacionados à forma fonológica. Portanto, a Gramática
Gerativa negou o Estruturalismo, posicionando-se contra sua pressuposição nuclear e
contra sua heurística. Alguns críticos de Chomsky (e.g. Pullum, 2011) enfatizam que a
teoria proposta por Chomsky (1957) não foi de fato inovadora, dado que muito foi
construído a partir de contribuições do pós-Estruturalismo, especialmente de Harris.
Uma questão bastante discutida é a noção de transformação, que ocupa lugar central no
modelo de gramática do Estruturas sintáticas. O termo transformação já havia sido
usado por Bloomfield e Carnap (ver Tomalin, 2006). Harris, por sua vez, definiu
transformação como uma relação entre sentenças dentro de um corpus: “Dada qualquer
sentença do Inglês com a forma N1 V N2 (e.g. O chefe despediu Jim), podemos obter a
16
sentença com os sintagmas nominais na ordem inversa N2 – N1 (Jim – the boss),
trocando os sufixos do verbo: Jim foi despedido pelo chefe. A justificativa para usar essa
informação gramatical na análise de um texto é que, dado que ela se aplica a qualquer
sentença com a forma N1 V N2, ela também se aplica a qualquer sentença com forma
N1 V N2 [...]” (Harris, 1952: 110 [NÃO CONSTA NAS REFERÊNCIAS]). Portanto, Harris
via transformações como relações entre sentenças, analisadas como sequências de
categorias sintáticas, e considerava que essas relações deveriam integrar o método
distribucional de descoberta da gramática, pois possibilitava a extração de relações
estruturais. Chomsky (1957) também se apropriou do termo transformação, mas como
um componente interno da gramática, que mapeia uma estrutura (não uma sentença) em
outra. Portanto, a concepção de transformação em Chomsky é marcadamente diferente
daquela adotada anteriormente.
O impacto maior do Gerativismo foi, todavia, em 1959, quando Chomsky
publicou sua resenha do livro Comportamento verbal, Skinner (1957) (veja o capítulo
“O jovem Chomsky, sua resenha de 1959 e a derrocada do behaviorismo”). Skinner
tinha como objetivo expandir sua teoria behaviorista para o comportamento verbal
humano, considerando que esse tipo de comportamento poderia ser efetivamente
analisado por meio da manipulação do ambiente físico do falante, via controle de
variáveis como estímulo, resposta e privação. Chomsky contra-argumenta observando
que (i) o comportamento verbal é independente de estímulo (pronunciamos a palavra
casa quando não estamos perto de uma casa e, nem sempre pronunciamos essa palavra
quando estamos perto de uma casa.); (ii) o conjunto de sentenças de uma língua é
infinito, somos capazes de produzir e compreender sentenças que nunca ouvimos antes.
Portanto, não é possível reduzir o comportamento verbal humano a associações
estímulo-resposta aprendidas. Chomsky conclui que uma teoria que se propõem a
explicar o comportamento verbal sem considerar processos mentais relativos a
compreensão, armazenamento e produção de informação é limitada. Acrescenta também
que a caracterização desses processos envolve estruturas inatas, um curso de maturação
geneticamente determinado e experiências passadas. A crítica de Chomsky contribui
fortemente para a derrocada do paradigma behaviorista e dá um novo direcionamento à
linguística formal, colocando-a no rol das ciências cognitivas, como o leitor poderá
conferir a partir dos próximos capítulos.
17
Assim, podemos dizer que, desde 1959, o empreendimento da Gramática
Gerativa caracteriza-se pela busca por respostas para as seguintes perguntas: em que
consiste o nosso conhecimento linguístico? Como esse conhecimento é adquirido?
Até o final da década de 1950, Chomsky voltou-se unicamente para a primeira
pergunta (veja o capítulo “O problema de Humboldt”), mas, a partir da década de 1960,
observa-se uma crescente atenção à segunda pergunta (veja o capítulo “O problema de
Platão”).
Em resumo, é tomando esse contexto histórico-científico como pano de fundo,
que se deve avaliar a Gramática Gerativa como uma virada paradigmática na
investigação científica em Linguística.
Quando se avalia se o Gerativismo representou de fato uma quebra com o
Behaviorismo/Estruturalismo e a inauguração de um novo paradigma científico (ver,
por exemplo, Thorne, 1965; Searle, 1972; Niemeyer, 1996; Borges Neto, 2004),
entende-se que não é trivial avaliar o progresso da ciência como sendo um processo de
substituição, em que uma teoria arcaica é substituída por uma mais progressista e mais
desenvolvida. O que houve no final dos anos 1950 foi uma revolução na agenda de
pesquisa, passando-se a uma nova questão: como a Gramática (entendida aqui como
conhecimento linguístico) interage com aspectos biológicos da espécie. A maneira como
essa nova agenda dialogou com o Estruturalismo e o modo como ela se consolidou
como uma teoria sobre a linguagem humana é o que o sustenta a conclusão de que a
Gramatica Gerativa é um novo paradigma de investigação científica.
É importante também, ao avaliarmos o desenvolvimento da teoria Gerativa,
levarmos em consideração a diferença entre pressuposições nucleares, heurística, e
hipóteses auxiliares na composição de uma teoria. Não raramente ouvimos críticas
como “os gerativistas mudam de teoria toda hora!”. Essa é uma crítica falsa, pois a
teoria permanece. Isto é, as pressuposições nucleares e a heurística da teoria Gerativa
são as mesmas desde 1950-60. No decorrer dos anos, o que tem sofrido mudanças
significativas são as hipóteses auxiliares. Por exemplo, a noção de transformação como
definida em 1957 não sobreviveu aos processos de refutação e ajustes aos modelos de
Gramática internos à Teoria. No modelo de 1957, entendia-se que a gramática continha
um componente em que regras transformacionais (como a transformação de passiva, a
transformação do pulo do afixo etc.) se aplicavam, em uma determinada ordem, a uma
sequência de símbolos, geradas por regras de reescritura, causando uma mudança
estrutural naquela sequência. Essa noção de transformação mostrou-se limitada, pois
18
não capturava generalizações importantes (como aquelas subjacentes a deslocamentos
de constituintes). Além disso, as regras transformacionais não eram estabelecidas de
maneira geral, mas de acordo com a língua específica em análise. Assim, dentro do
modelo da Regência e Ligação (veja o capítulo “Teoria da Regência e Ligação e a
proposta de Princípios e Parâmetros”), a transformação é pensada não como uma regra
específica de uma determinada construção e de um determinado conjunto língua, mas
como uma regra universal da gramática, que opera no mapeamento da estrutura
profunda na estrutura superficial. O modelo de minimalista (veja o capítulo “O
Programa Minimalista”), especialmente na versão mais recente, é um modelo de
transformação generalizada, em que a gramática é concebida como um sistema
computacional dinâmico, contendo apenas a operação composicional Merge, que se
aplica de maneira recursiva, expandindo a estrutura sintática de modo a garantir seu
mapeamento nas interfaces com os sistemas conceitual-intencional e sensório-motor
(veja também o capítulo “O problema de Wallace-Darwin”).
Por que houve tantas mudanças de modelo? Porque a busca por explicações
sobre a natureza do nosso conhecimento (como é e por que é como é) e sobre a
aquisição (como esse conhecimento é adquirido) forçou a revisão de várias hipóteses
levando a modelos cada vez mais minimalistas de gramática.
Essa flexibilidade na adequação do modelo de gramática às questões de base da
teoria é em parte responsável pelo sucesso da Gerativa. Lakatos (1971) argumenta que
uma teoria deve ter tenacidade, não sendo facilmente abandonada frente a
contraexemplos. O que a Gramática Gerativa tem feito ao longo dos anos é rever suas
hipóteses auxiliares (incluídos seus modelos hipotéticos de gramática) para se
aprofundar na compreensão de suas perguntas de base, acomodando um conjunto cada
vez maior de dados, mantendo-se, assim, como um programa de pesquisa ativo.
Os rumos da Gerativa: expansão de domínios de investigação
Uma maneira de medir a produtividade de um programa de pesquisa é

analisando sua capacidade de integração e expansão. A Gramática Gerativa tem, nos
últimos anos, mantido diálogo intenso com a Psicolinguística e a Neurolinguística,
contribuindo para uma melhor compreensão da relação entre língua e cognição de modo
geral, e da aquisição, do processamento e da implementação neuroanatômica da
linguagem. A teoria formal tem se beneficiado dessa integração especialmente no que
19
tange à investigação de aspectos formais da gramática resultantes de restrições
cognitivas e neurológicas (veja os capítulos “O problema de Descartes” e “O problema
de Broca”).
A soma de esforço entre essas três áreas (Teoria Gramatical, Psicolinguística e
Neurolinguística) tem, por sua vez, possibilitado uma maior integração entre a
linguística e as chamadas neurociências em torno de interesses comuns. Por exemplo, a
Psicolinguística, vinculada à Teoria Gramatical, tem dado contribuições importantes aos
estudos sobre déficits específicos da linguagem (cf. Corrêa e Augusto, 2010; Corrêa,
2006). Do mesmo modo, a Linguística teórica e, em especial, a chamada Linguística
Experimental têm participado de maneira relevante nas pesquisas sobre problemas de
linguagem em casos de distúrbios mentais, como a esquizofrenia, buscando
compreender quais níveis da gramática são afetados por esses distúrbios (cf. Hinzen,
2017; Zimmerer et al., 2017; Moro et al., 2015).
Essa integração de áreas acarretará em revisões importantes das hipóteses da
Teoria, já que as interfaces entre a linguagem e outros módulos da cognição deverão ser
mais bem analisadas, e a noção de especificidade de domínio deverá ser revisitada com
o intuito de melhor avaliar quais mecanismos linguísticos são de domínio específico e
quais são de domínio geral (Spelke e Kinzler, 2007; Pinker, 2002; Dabrowska, 2004;
Van der Lely, 2005; Di Sciullo, 2015; Friedrich e Friederici, 2009).
Recentemente, a Gramática Gerativa tem também expandindo seu domínio de
investigação para outras áreas relativas ao comportamento humano, como gestos e
música. Embora muitas vezes a fala humana seja acompanhada de gestos, estes foram
durante muito tempo considerados elementos paralinguísticos, permanecendo fora do
escopo da Teoria. No entanto, há semelhanças importantes entre a fala e os gestos, tais
como: apresentam-se sincronizados temporalmente, são afetados de maneira similar em
afasias, desenvolvem-se de maneira paralela durante o processo de aquisição, são ambos
passíveis segmentação em unidades (McNiell, 1992; Sotaro et al., 1998, Kendon, 2004).
Essas semelhanças têm chamado a atenção dos teóricos que objetivam verificar em que
medida Gramática Gerativa pode ser estendida para a análise desse sistema (Tieu et al.,
2017; Schlenker, 2018).
De maneira similar, investigações sobre na interface linguagem-música buscam
avaliar se restrições que regem formalmente as combinações de unidades na gramática
podem ser elucidativas sobre combinações de unidades na música e na linguagem
(Patel, 2008, 2012; Katz e Pesetsky, 2011; Arbib, 2013; Katz, 2017).
20
Outro campo de pesquisa em expansão é a análise comparativa entre linguagem
e comunicação animal (Fitch & Hauser, 2004; Yip, 2006; Zuberbühler, 2006; Berwick
et al., 2011; Schlenker et al., 2016). Essas pesquisas concentram-se nas seguintes
questões: em que aspectos a linguagem se aproxima e se distancia de outros sistemas
orgânicos de comunicação? É possível investigar esses sistemas a partir do arcabouço
teórico proposto pela Gramática Gerativa?
Em resumo, embora alguns dos ramos de investigação citados sejam muito
recentes, contendo, por vezes, um componente especulativo, sua existência sugere que
há potencial de expansão na teoria proposta pela Gramática Gerativa, no sentido de que
esta pode ser usada para propulsionar investigações além da Linguística. Se essas
pesquisas serão ou não produtivas, ainda não sabemos, mas, como afirmou Karl Popper,
fazer ciência é lançar redes; é correr riscos.
Referências
ARBIB, M. (Org.). Language, music, and the brain: a mysterious relationship. Cambridge: The MIT Press,
2013.
BAR-HILLEL, Y. Logical syntax and semantics. Language 30, pp. 230-237, 1954..
BENNETT, A. T. D. Do animals have cognitive maps? The Journal of Experimental Biology 199, pp. 219-
224, 1999..
BERWICK, R. C. et al. Songs to syntax: the linguistics of birdsongs. Trends in Cognitive Sciences 15(3),
pp. 111-121, 2011. .
BLOOMFIELD, L. Review of Was ist ein Satz?, by John Reis. Language 7, pp. 204-209, 1931.
BOGEN, J.; WOODWARD, J. Saving the phenomena. The Philosophical Review 97(3), 303-352, 1988..
BORGES NETO, J. O empreendimento gerativo. In: MUSSALIN, F.; BENTES, A. C. (Orgs.) Introdução à
linguística: fundamentos epistemológicos. São Paulo: Cortez, 2004, pp. 93-129.
CHOMSKY, N. Systems of syntactic analysis. Journal of Symbolic Logic 18, pp. 242-256, 1953..
______. Logical syntax and semantics: their linguistic relevance. Language 31, pp. 36-45, 1955.
_____. Three models for the description of language. IRE Transactions of Information Theory 2, pp. 113-
124, 1956.
_____. Syntactic structures. The Hague: Mouton, 1957._____. Review of Skinner's Verbal Behavior.
Language 35, pp. 26-58, 1959.
_____. Of minds and language. Biolinguistics 1, pp. 9-27, 2007.
CORREA, L. M. S. Língua e cognição: antes e depois da revolução cognitiva. In: PFEIFFER, C. C.; NUNES,
J. H. (Orgs.). Linguagem, história e conhecimento. Campinas: Pontes, 2006, pp. 103-139.
_____; AUGUSTO, M. R. A. A possible loci for SLI from both linguistic and psycholinguistic perspective.
Lingua 121(3), pp. 476-486, 2010.
21
DABROWSKA, E. Language, mind and brain. Some psychological and neurological constraints on
theories of grammar. Washington, DC: Georgetown University Press, 2004.
DI SCIULLO, A. M. On the domain specificity of the human Language faculty and the effects of principles
of computational efficiency: contrasting language and mathematics. Linguística 11(1), pp. 28-56,
2015.
FITCH, W. T.; HAUSER, M. D. Computational constraints on syntactic processing in a nonhuman primate.
Science 303, pp. 377-380, 2004..
FRIEDRICH, R.; FRIEDERICI, A. D. Mathematical Logic in the Human Brain: Syntax. PLoSONE 4(5), pp.
1-7, 2009.
GODFREY-SMITH, P. Theory and reality. An introduction to the philosophy of science. Chicago: Chicago
University Press, 2003..
GOLDSMITH, J. Review of The legacy of Zellig Harris: Language and information into the 21st century.
Language 81(3), pp. 719-736, 2002.
HINZEN, W. Reference across pathologies: a new linguistic lens on disorders of thought. Theoretical
Linguistics 43, pp. 3-4, 2017..
HUCK, G. J.; GOLDSMITH, J. A. Ideology and linguistic theory. London: Routledge, 1995.
KATZ, J. Harmonic syntax of the 12-bar blues: a corpus study. Music Perception, 35(2), pp. 165-192,
2017.
_____; PESTSKY, D. The identity thesis for language and music. MIT, 2011. Manuscrito.
KENDON, A. Gesture: visible action as utterance. UK: Cambridge University Press, 2004.
LAKATOS, I. Falsification and the methodology of scientific research programmes. In: LAKATOS, I.;
MUSGRAVE, A. (Orgs.). Criticism and the growth of knowledge. Cambridge: Cambridge University
Press, 1970, pp. 91-196.
______. History of science and its rational reconstructions. In: BUCK, R. C.; COHEN, R. S. (Orgs.).
Proceedings of the biennial meeting of the philosophy of Science. Dordrecht, Holanda: D. Reidel
Publishing Company, 1971, pp. 91-108.
_____. The methodology of scientific research programmes. In: WORRAL, J.; CURRIE G. (Orgs.).
Philosophical papers 1. Cambridge: Cambridge University Press, 1978.
MACCAWLEY, J. The role of semantics in a grammar. In: BACH, E.; HARMS, R. T. (Orgs). Universals of
linguistic theory. New York: Holt, Rinehart, 1968, pp. 124-169.
MATHEWS, P. H. Grammatical theory in the United States from Bloomfield to Chomsky. Cambridge:
Cambridge University Press, 1986.
______. Zellig Sabbettai Harris [obituary]. Language 75(1), pp. 112-119, 1999.
MCGHIE, A.; CHAPMAN, J.; LAWSON, J. S. The effect of distraction on schizophrenic performance. II.
Psychomotor ability. British Journal of Psychiatry 111, pp. 383-390, 1965.
MCNIELL, D. Hand and mind: what gestures reveal about thought. Chicago, IL: University of Chicago
Press, 1992.
MORO, A. et al. Detecting syntactic and semantic anomalies in schizophrenia. Neuropsychologia 79,
pp.147-157, 2015.
22
NEVIN, B. E. (Org.). The legacy of Zellig Harris, vol. 2. Amsterdam, Philadelphia: John Benjamins
Publishing Company, 2002.
NEWMEYER, F. J. Generative linguistics: A historical perspective. New York: Routledge, 1996.
PATEL, A. D. Music, language and the brain. Oxford: Oxford University Press2008..
_____. Language, music, and the brain: a resource-sharing framework. In: REBUSCHAT, P. et al. (Eds.).
Language and music as cognitive systems. Oxford: Oxford University Press. 2012, pp. 204-223.
PINKER, S. The Blank Slate. The modern denial of human nature. New York: Penguin, 2002.
POPPER, K. Conjecturas e refutações. Brasília: Editora Universidade de Brasília, 1982.
_____. A lógica da pesquisa científica. São Paulo: Cultrix, 1985.
PULLUM, G. K. On the mathematical foundations of syntactic structures. Journal of logic language and
information 20 (3), pp. 277-296, 2011.
SAUSSURE, F. de. Cours de linguistique générale. Paris: Payot, 1916. [Tradução brasileira: Curso de
linguística geral. São Paulo: Cultrix, 1960.]
SCHLENKER, P. Iconic Pragmatics. Natural Language & Linguistic Theory 36 (3), 877-936, 2018.
______ et al. Formal monkey linguistics. Theoretical linguistics 42(1-2), pp. 1-90, 2016.
SEARLE, J. R. Chomsky’s revolution in linguistics. The New York Review of Books 19, pp. 16-24, 1972.
SKINNER, B. F. Verbal behavior. New York: Appleton-Century-Crofts, 1957.
SPELKE, E. S., KINZLER. K. D. Core knowledge. Developmental Science 10, pp. 89-96, 2007.
SOTARO, K.; INGEBORG, G.; VAN DER HULST, H. Movement phases in signs and co-speech gestures, and
their transcription by human coders. In: WACHSMUTH, I.; FRÖHLICH, M. (Orgs.) Gesture and sign
language in human-computer interaction. London: Springer, 1998. pp. 23-35.
SUPPE, F. The meaning and use of models in mathematics and the exact sciences. Ph.D. dissertation,
University of Michigan, Ann Arbor, 1967.
______. The structure of scientific theories. Urbana: University of Illinois Press, 1974.
TIEU, L. et al. Cospeech gesture projection: Evidence from inferential judgments. Glossa: a Jornal of
general linguistics 2 (1), pp. 1-27, 2017.
THORNE, J. P. Review of P. Postal, Constituent Structure. Journal of Linguistics 1, pp. 73-6, 1965.
TOMALIN, Marcus. Linguistics and the formal sciences: the origins of generative grammar. Cambridge:
Cambridge University Press, 2006..
VAN DER LELY, H. K. Grammatical-SLI and the computational gramatical complexity hypothesis.
Frequences 17, pp. 13-20, 2005.
WYSTRACH, A. et al. Views, Landmarks, and routes: how do desert ants negotiate an obstacle course?
Journal of Comparative Physiology 197, pp. 167-179, 2011.
YIP, M. The search for phonology in other species. Trends in Cognitive Sciences10, pp. 442-445, 2006.
ZIMMERER, V. et al. Comprehension of factive and non-factive embedding in aphasia and its relationship
with lexical, syntactic and conceptual capacities. Journal of Neurolinguistics 49, pp. 29-44, 2017.
ZUBERBÜHLER, K.. Language evolution: The origin of meaning in primates. Current Biology 16, pp. 123-
125, 2006.
23
ESTRUTURAS SINTÁTICAS E A REINVENÇÃO DA TEORIA LINGUÍSTICA

Sergio de Moura Menuzzi
Na edição de 2002 de Estruturas sintáticas, David Lightfoot inicia a

apresentação do livro de Chomsky com as seguintes palavras: “O livro Estruturas
sintáticas, de Noam Chomsky, foi a bola de neve que começou a ‘revolução cognitiva’
moderna”. Para entendermos um pouco sobre a importância que essa “bola de neve”
teve na revolução cognitiva que se seguiu à sua publicação na segunda metade do século
24
XX, temos de entender um pouco sobre o contexto da época em que o Estruturas, o
primeiro livro de Noam Chomsky, foi publicado. Neste capítulo, falaremos um pouco
sobre seu contexto de publicação e sobre a relação entre algumas das ideias centrais
exploradas por Chomsky em Estruturas e os primeiros desenvolvimentos da teoria
gerativa. Para isso, vamos apresentar, resumidamente, alguns dos principais pontos do
Estruturas, tendo como base – obviamente – nosso olhar contemporâneo sobre essa
obra clássica.
O contexto histórico
Como dissemos, Estruturas sintáticas foi o primeiro livro publicado por Noam
Chomsky, então com 28 anos. Ainda assim, este não foi seu primeiro trabalho influente
em linguística. Estruturas foi publicado em 1957, dois anos depois de Chomsky ter
finalizado um trabalho monográfico de fôlego, The Logical Structure of Linguistic
Theory (“A estrutura lógica da teoria linguística”, em tradução livre, publicado apenas
20 anos depois, em 1975, e ainda inédito em português). Nesse trabalho, Chomsky
desenvolve em detalhes muitas das ideias apenas esboçadas em Estruturas. Como
dissemos em outro lugar,3 é “nessas duas obras, Syntactic Structures e The Logical
Structure of Linguistic Theory, que Chomsky lança as bases do que se tornou o
programa de investigação linguística que mais influenciou a Linguística no século XX, o
programa gerativista”. Além dessas duas obras, Chomsky já havia feito um trabalho de
conclusão de curso que também antecipava elementos da Linguística Gerativa, seu
Morphophonemics of Modern Hebrew (“A morfofonêmica do hebraico moderno”, em
tradução livre).
Um fato curioso acerca do Estruturas é que ele não se originou como um
trabalho monográfico de pesquisa propriamente dito, mas a partir de anotações das aulas
de Linguística que Chomsky ministrava à época no MIT. Como Harris (1993 [NÃO
CONSTA NAS REFERÊNCIAS]) observa, não havia ainda um Departamento de Linguística
na universidade, o que permitiu a Chomsky total liberdade para ensinar aquilo que ele
próprio entendia como linguística.
Sua pesquisa [no Laboratório de Pesquisas Eletrônicas do MIT] não era

restringida, o que permitia que Chomsky continuasse pesquisando sua
modelagem abstrata da linguagem. Mas seu compromisso era apenas parcial
e ele tinha de dar aulas para completar sua renda: de alemão, de francês, de
filosofia, de lógica. E de linguística. E como não tinha ninguém lá para dizer
25
como as aulas de linguística deveriam ser ministradas (já que o MIT ainda não
tinha um departamento de linguística), ele ensinava a sua linguística, e as
anotações das aulas para esse curso [...] revisadas e publicadas como
Estruturas sintáticas, constituem uma das obras-primas da linguística.
(Harris, 1993: 39).
O livro teve imediata repercussão, muito graças a uma resenha influente de

Robert B. Lees, publicada na revista Language ainda em 1957 (essa resenha, para
Ligthfoot (2002: vi [NÃO CONSTA ESTA DATA NAS REFERÊCNIAS]), é um dos três textos
centrais que marcaram o início da Linguística Gerativa, juntamente com Estruturas
sintáticas e The Logical Structure of Linguistic Theory.). Segundo Lees (1957: 377-8),
Estruturas é
uma das primeiras tentativas sérias de um linguista para construir [...] uma
teoria abrangente de linguagem que possa ser entendida no mesmo sentido
em que uma teoria química ou biológica é comumente entendida em Química
ou Biologia. Não se trata de uma mera reorganização de dados em um
formato de catálogo bibliotecário, nem outra filosofia especulativa sobre a
natureza do Homem e da Linguagem; é antes uma explicação rigorosa de
nossas intuições sobre a linguagem em termos de um sistema axiomático
explícito, com teoremas derivados desse sistema, resultados explícitos que
podem ser comparados com novos dados e com outras intuições, tudo
baseado plenamente em uma teoria explícita da estrutura interna das línguas.
O trabalho de Chomsky era inovador e apresentava uma Linguística muito

diferente da Linguística estruturalista de base harrisiana e bloomfieldiana, dominante à
época. Contudo, ainda que Estruturas se diferenciasse, em grande parte, de tudo o que
havia sido feito em linguística até então, as influências estruturalistas estavam ali. Como
afirma o próprio Chomsky em carta:
Minha introdução formal no campo da linguística foi em 1947, quando Zellig

Harris me deu um esboço de seu Methods in Structural Linguistics para ler.
Achei fascinante e, após algumas discussões estimulantes com Harris, resolvi
me formar em Linguística na Universidade da Pensilvânia. Eu tinha alguns
conhecimentos sobre Linguística histórica e gramática do hebraico medieval,
com base na obra de meu pai nessas áreas [...]. (apud Barsky, 2004: 70)
Chomsky tinha um sólido background em filologia (especialmente por

influência de seu pai, que trabalhava com a gramática e a história do hebraico) e em
linguística estruturalista, visto que Chomsky foi aluno de Harris e trabalhou com ele de
maneira muito próxima. Além disso, Chomsky precisaria de interlocutores. Para que
suas ideias chegassem até os linguistas da época, seria preciso escrever da maneira que
um estruturalista pudesse compreender. Apesar de o Estruturas estar fortemente
26
condicionado pelo contexto da Linguística estruturalista e de tentar dialogar com ela, já
apresenta as ideias-chave que servem de base para o desenvolvimento posterior da
Linguística Gerativa, como reconhece o próprio Chomsky ainda hoje em textos mais
recentes (cf. Chomsky, 2014, por exemplo). Estruturas foi, de fato, a bola de neve que
deu início à avalanche cognitiva, como afirmou Lightfoot.
O que é uma gramática
No breve prefácio do Estruturas, já encontramos uma advertência importante,

que antecipa o que veremos nos capítulos seguintes:4
Este estudo trata da estrutura sintática tanto em sentido lato (oposto à

semântica) como em sentido estrito (oposto à fonologia e à morfologia). Ele
faz parte de uma tentativa de construção de uma teoria geral, formalizada, da
estrutura linguística, e de exploração dos fundamentos desta teoria. (2015:
11)
Ao contrário do que muitos estruturalistas defendiam, Chomsky não acreditava

que seria preciso primeiro “entender a morfologia e a fonologia” para depois levar a
cabo uma investigação séria sobre os aspectos sintáticos das línguas naturais. Ao
contrário, para Chomsky a investigação em sintaxe poderia trazer insights para os
estudos em morfologia e fonologia das línguas naturais. Por isso, o Estruturas é, como o
próprio título já indica, um livro que discute as estruturas sintáticas do inglês, dando
pouca atenção a aspectos fonológicos, morfológicos ou semânticos. A sintaxe foi, como
se sabe, a área que recebeu, desde o início, prioridade nos estudos gerativistas de base
chomskyana.
O primeiro capítulo não passa de uma brevíssima introdução. É nele que
Chomsky define, justamente, o que entende por sintaxe:
A sintaxe é o estudo dos princípios e dos processos por meio dos quais as
sentenças são construídas em línguas particulares. O estudo sintático de uma
determinada língua tem como objetivo a construção de uma gramática que
pode ser encarada como algum tipo de mecanismo de produção das sentenças
da língua sob análise. (2015: 15)
Repare como Chomsky entende que a gramática de uma língua deve ser
considerada um “tipo de mecanismo de produção de sentenças”. Vemos aí o quanto sua
maneira de entender a linguística difere da Linguística estruturalista. Para os
27
estruturalistas, a Linguística teria como tarefa desenvolver métodos de descrição e
sistematização dos dados de corpora obtidos em trabalho de campo, por exemplo.
Obviamente, os dados de um corpus são finitos; além disso, podem conter enunciados
fragmentados, hesitações etc., que não seriam considerados “bem formados” pelos
falantes da língua. Para Chomsky, a tarefa da Linguística não seria a de analisar e
organizar as sentenças de um corpus ou de qualquer material linguístico supostamente
representativo do que ele veio a chamar, posteriormente, de língua-E, isto é, “língua
externa”; antes, o linguista está atrás de um construto que seja semelhante ao
conhecimento que um falante tem de sua língua – a língua-I, ou “interna”.5
É em Estruturas sintáticas que Chomsky introduz a ideia de que a gramática de
uma língua é concebida como um conjunto de princípios e regras (é um “mecanismo de
produção” de sentenças) que potencialmente pode gerar todas as sentenças de uma
língua e apenas elas. Ora, não há limites para o número de sentenças possíveis em
qualquer língua natural, e a gramática elaborada pelo linguista deve ser capaz de dar
conta desse fato. Além disso, qualquer falante nativo de uma dada língua tem, em
princípio, a capacidade de diferenciar sentenças bem formadas de sequências
malformadas ou agramaticais naquela língua – ainda que essas possam ocorrer e até
mesmo ser relativamente frequentes em certos tipos de corpora de fala ou escrita. Você
mesmo, leitor, com base em sua própria intuição, reconhece que (1) é uma frase bem
formada em português, ao passo que (2) não é:
(1) O Pedro sabe por que o João estava chorando?

(2) *Por que o Pedro sabe o João estava chorando?
Uma gramática deve dar conta de capturar essa intuição. Isto é, uma teoria
linguística também deve ser capaz de lidar com dados negativos: as regras e os
princípios que compõem a gramática de uma língua devem ser abrangentes o suficiente
para gerar todas as sentenças bem formadas de uma língua (como (1)), mas devem, ao
mesmo tempo, ser restritas o suficiente para não gerar qualquer sequência agramatical
(como (2)). Isso é formulado no capítulo 2 do Estruturas:
[o] objetivo fundamental na análise linguística de uma língua L é separar as

sequências gramaticais que são as sentenças de L das sequências
agramaticais que não são sentenças de L, e estudar a estrutura das sequências
gramaticais. A gramática de L será, portanto, um mecanismo que gera todas
as sequências gramaticais de L e nenhuma das sequências agramaticais. Uma
28
maneira de testar a adequação de uma gramática proposta para L é determinar
se as sequências que ela gera são realmente gramaticais ou não, isto é,
aceitáveis a um falante nativo, etc. Poderíamos dar alguns passos na direção
de fornecer um critério comportamental para a gramaticalidade, de tal forma
que este teste possa ser aplicado. Para os propósitos da presente discussão,
contudo, podemos assumir como dado o conhecimento intuitivo das
sentenças gramaticais do inglês, perguntando-nos que tipo de gramática será
capaz de realizar a tarefa de produzir tais sentenças gramaticais de maneira
eficiente e reveladora. (2015: 17)
Surge então um novo “método” de investigação linguística: o julgamento

intuitivo e introspectivo sobre a aceitabilidade e a gramaticalidade de uma sequência de
palavras. Foi esse método que utilizamos quando pedimos a você para julgar os
exemplos (1) e (2). Ao longo do empreendimento gerativista (e com o desenvolvimento
da tecnologia), outras maneiras de avaliar o nível de aceitabilidade e gramaticalidade de
sentenças tornaram-se disponíveis, e antigos métodos foram aprimorados (cf. Maia,
2015), mas o julgamento intuitivo ainda é prática comum em trabalhos de cunho
gerativo. A gramaticalidade de uma sequência “é fruto de uma reação concreta e
observável do falante-ouvinte a um arranjo particular de itens lexicais”. A aceitabilidade
é “uma conclusão a que o linguista chega a partir de juízos de aceitabilidade somados a
outros aspectos teórico-analítico-metodológicos, que o levam a inferir que as regras da
gramática são tais que legitimam certos arranjos e não outros, num plano mais abstrato
que aquele do uso efetivo da língua, que é influenciado por fatores extragramaticais,
como memória, atenção, expectativa etc.” (Guimarães, 2017: 32).
Ainda sobre a noção de gramaticalidade, Chomsky argumenta: “[...] a noção de
‘gramatical’ não pode ser confundida com as noções de ‘dotado de sentido’ ou
‘significativo’ em qualquer sentido semântico” (2015: 19). Chomsky estava separando,
à época, a noção de “gramatical” de qualquer base semântica; daí sua já conhecida frase
“ideias verdes incolores dormem furiosamente”, sintaticamente bem formada, mas
semanticamente anômala. Repare que Chomsky traça uma divisão fundamental aqui:
boa formação sintática não garante que o enunciado seja dotado de sentido. Da mesma
forma, uma sequência de itens lexicais que tenha algum sentido não garante a boa
formação sintática de uma sequência. Esse passo metodológico importante de Chomsky
separa crucialmente sintaxe de semântica: “qualquer procura por uma definição de
‘gramaticalidade’ baseada em noções semânticas será fútil” (2015: 20); voltaremos a
falar sobre a semântica em Estruturas mais a frente.
Nos três capítulos seguintes (capítulos 3, 4 e 5), Chomsky mostra as
inadequações dos recursos de análise, postos à disposição do linguista, que tinham
29
grande aceitação à época. Chomsky argumenta que tais limitações só se tornam claras
quando se “formalizam” tais teorias, isto é, quando se procura explicitar de modo cabal
os elementos e mecanismos que a teoria utiliza para descrever regras linguísticas.
Especificamente, são dois os tipos de mecanismos que Chomsky argumenta
serem demasiadamente limitados para, sozinhos, descreverem a gramática de uma
língua natural: as chamadas cadeias de Markov – também chamadas de “autômatos
finitos” –, mecanismos que caracterizariam os modelos gramaticais baseados na mera
ordem linear de palavras; e as regras sintagmáticas, que caracterizariam os modelos
limitados à descrição da estrutura de constituintes. Segundo Chomsky, tanto essa
argumentação quanto a distinção entre aceitabilidade e gramaticalidade foram
motivadas pelo contexto em que desenvolvia seu trabalho:
Meu trabalho Estruturas sintáticas (Chomsky, 1957) começa com

observações sobre a inadequação, em princípio, dos autômatos finitos,
portanto das fontes markovianas, mas apenas porque esse trabalho era
baseado em notas dos cursos que eu ministrava no MIT, onde a adequação dos
autômatos finitos era amplamente aceita. Por razões parecidas, o Estruturas
sintáticas começa explorando a tarefa de distinguir sentenças gramaticais de
agramaticais, tendo por base a analogia de “boa-formação” que vemos em
sistemas formais, assumida à época como um modelo apropriado para a
linguagem. (Chomsky, 2018 [2007]: 125)
Em Estruturas sintáticas, Chomsky menciona como exemplo de modelo

estruturalista “markoviano” aquele proposto por Hockett em seu Manual of Phonology
(1955), que se baseia na teoria da informação de Shannon (cf. Shannon e Weaver,
1949). Chomsky argumenta que a limitação mais grave das cadeias de Markov é a de
que só são capazes de caracterizar sequências em que um elemento depende
estritamente do elemento imediatamente precedente. Segundo Chomsky, isso é
insuficiente para dar conta de fenômenos triviais nas línguas, como as orações ligadas
com conectores descontínuos do tipo Se... então ou Ou... ou, como vemos nos exemplos
a seguir:
(3) Se o português tem suas origens no latim, então é uma língua românica.
(4) Ou a hipótese biolinguística está correta, ou está equivocada.
Obviamente, a introdução do segundo elemento de um conector descontínuo

depende do primeiro; mas os elementos não são adjacentes na sequência de palavras.
30
Quanto às regras sintagmáticas, Chomsky demonstra que são capazes não apenas
de descrever padrões de ordem palavra por palavra – sendo nesse sentido equivalentes
às cadeias de Markov –, mas também de caracterizar um outro aspecto fundamental das
línguas humanas: o fato de que suas regras são “dependentes de estrutura”, isto é, de
que operam apenas sobre constituintes, sequências específicas de palavras,
identificáveis por meio de sua “categoria sintática”. Por isso, a teoria proposta por
Estruturas assegura um papel central para as regras sintagmáticas na descrição
gramatical. Ainda assim, Chomsky argumenta, essas regras não são suficientes, pois não
capturam outros aspectos importantes do conhecimento gramatical dos falantes de uma
língua, em particular um tipo de intuição fundamental: a de que há uma “relação
gramatical” entre certos tipos de frases, como por exemplo a existente entre frases
declarativas, interrogativas e negativas, ou entre frases na voz ativa e na voz passiva.
Além disso, há uma outra motivação: há regras que dependem da “história derivacional”
de uma categoria (em particular, sua função sintática) e só operaram sobre marcadores
sintagmáticos completos. Para resolver essas limitações, Chomsky propõe um novo tipo
de regra, as regras transformacionais:
[d]esenvolveremos um terceiro modelo, transformacional, para a estrutura

linguística, que é mais poderoso do que o modelo de constituintes imediatos
em certos aspectos importantes, e que dá conta de tais relações de maneira
natural. Quando formulamos a teoria das transformações de maneira
cuidadosa e a aplicamos livremente ao inglês, vemos que ela lança uma luz
sobre uma grande variedade de fenômenos, indo além daqueles fenômenos
para os quais ela foi especificamente concebida. (2015: 12)
Uma transformação é uma regra que toma uma estrutura sentencial (incluindo
uma “sentença nuclear”, a representação básica de uma sentença gerada pelas regras
sintagmáticas) e a altera em aspectos particulares, como, por exemplo, a função
gramatical de um termo (no Apêndice II de Estruturas, Chomsky lista as regras
transformacionais que desenvolve para dar conta de várias construções do inglês).
Veja, por exemplo, a regra da transformação interrogativa (Tint), que forma
sentenças interrogativas simples em inglês: essa regra toma sequências nucleares
correspondentes a sentenças declarativas, tendo “o efeito de intercambiar o primeiro e o
segundo segmentos dessas sequências” (2015: 90). Pegue uma sequência, em inglês,
como They can arrive (‘eles podem chegar’), e a transformação interrogativa (para o
inglês, lembre-se) irá produzir a sequência Can they arrive? (lit. ‘podem eles chegar’),
uma estrutura interrogativa (em inglês). Uma transformação “menos óbvia” – exemplo
31
do tipo de inovação permitido pela nova concepção de gramática – é a regra que ficou
conhecida na literatura como o “pulo do afixo”, uma transformação obrigatória6 que
tinha a seguinte formulação (2015: 165):
Análise estrutural: X – Af – v – Y
(em que Af é um afixo verbal; v é um verbo modal ou principal ou ainda have ou
be)
Mudança estrutural: X1 – X2 – X3 – X4  X1 – X3 – X2 # – X4
(em que # marca os limites das “palavras superficiais” que passarão por regras
morfofonêmicas)
Ou seja, essa transformação permite gerar de modo correto sequências de

auxiliares como vai poder ler, pode ter lido, tinha estado lendo etc., pois ela
posiciona os afixos nas formas verbais na superfície da frase. [...] o efeito da

regra é deslocar um afixo que é inserido como parte de um constituinte
auxiliar para o verbo que segue imediatamente esse auxiliar: por exemplo, o
sufixo -ndo é inserido como parte do auxiliar [estar + -ndo] de aspecto
progressivo, resultando [V + -ndo] depois da operação” (2015: 63-4).
Esse procedimento derivacional envolvendo transformações (opcionais e

obrigatórias) é importante por várias razões, entre as quais destacamos três: (i) a partir
daqui, o modelo de teoria linguística chomskyano passou a ser amplamente conhecido
como “gramática transformacional” ou “gramática gerativo-transformacional”; (ii)
apesar de não estarem explícitas em Estruturas sintáticas, as noções de estrutura
profunda e estrutura de superfície já subjazem ao raciocínio esboçado por Chomsky
(essas noções foram desenvolvidas alguns anos mais tarde, especialmente a partir da
publicação de Aspectos da teoria da sintaxe, de 1965; veja o capítulo “Teoria Padrão e
Teoria Padrão Estendida”, neste volume); e (iii) fica explicitado o modelo de gramática
da primeira fase da teoria gerativa, com a seguinte arquitetura:
32
(5)
Esse modelo foi significativamente revisto ao longo dos anos (veja os capítulos
“Teoria Padrão e Teoria Padrão Estendida”, “Teoria da Regência e Ligação e a proposta
de Princípios e Parâmetros” e “O Programa Minimalista”, também neste volume), mas a
ideia básica proposta em Estruturas – com um “nível de representação” subjacente,
abstrato, e outro nível “de output”, com características próximas às da “sentença
33
pronunciada” – ainda está por trás de vários modelos correntes de teoria gramatical
contemporâneos. A própria noção de “transformação” também sofreu modificações
substanciais; mas a intuição de que um elemento pode ser “movido” de uma posição na
qual tem uma relação linguística para outra posição onde adquire outra relação
linguística, “transformando a estrutura inicial”, é um fato que precisa ser reconhecido e
incorporado, de algum modo, em qualquer teoria da estrutura sintática.
Além disso, o componente transformacional tira o peso das regras sintagmáticas
e captura generalizações gramaticais importantes (tais como as que apontamos
anteriormente):
É importante observar que a gramática é significativamente simplificada

quando adicionamos um nível transformacional, uma vez que agora é
necessário fornecer diretamente a estrutura sintagmática apenas para as
sentenças nucleares – as sequências terminais da gramática [...] são apenas
aquelas que subjazem às sentenças nucleares. Escolhemos as sentenças
nucleares de tal forma que as sequências terminais subjacentes ao núcleo são
facilmente derivadas [...], enquanto todas as outras sentenças podem ser
derivadas dessas sequências terminais através de transformações que podem
ser formuladas de modo simples. (2015: 68-9)7
Isso significa que não precisamos mais nos preocupar com regras sintagmáticas
que gerem todas (e apenas) as sequências gramaticais da língua. Pelo contrário, as
regras sintagmáticas irão formar apenas as sentenças nucleares (na verdade, as
“sequências que subjazem às sentenças nucleares” (2015: 68)). Essas sentenças
nucleares passarão por transformações – obrigatórias e opcionais, como vimos – para
que resultem em sequências gramaticais atestadas na língua. Disso temos que
todas as sentenças da língua ou pertencerão ao núcleo da língua, ou serão

derivadas, por meio da aplicação sucessiva de uma ou mais transformações,
das sequências que subjazem a uma ou mais sentenças nucleares. (2015: 65)
Explorando questões fundacionais
Seguindo o Estruturas, encontramos, no capítulo 6, uma espécie de “parênteses

preparatórios”, em que Chomsky procura aprofundar um pouco a metateoria linguística
– discutindo um dos dois critérios que já havia introduzido (no capítulo 2) para
identificar gramáticas adequadas. Além de satisfazer a certas condições externas de
adequação (por exemplo, dar conta dos juízos de aceitabilidade dos falantes da língua),
uma gramática deve também satisfazer, segundo Chomsky, a uma condição de
34
generalidade, isto é, deve ser construída a partir de uma teoria da estrutura linguística
na qual noções gramaticais como “fonema” ou “sintagma” sejam definidas de modo
geral, isto é, independentemente das propriedades específicas dessa ou daquela língua
particular. Esse critério permite a Chomsky levantar uma questão crucial (2015: 73):
“qual a relação entre a teoria geral e as gramáticas particulares que são dela derivadas?”
Segundo ele, do modo como a maior parte das propostas da época formulava
essa relação, o objetivo de uma teoria da linguagem deveria ser o de fornecer um
procedimento de descoberta: a teoria deveria fornecer “um método prático e mecânico”
que tivesse como input um corpus significativo da língua e como output a gramática
(correta) da língua. Entre os trabalhos nos quais Chomsky identifica essa posição estão
obras de Harris, Hockett, Bernard Bloch, Rulon Wells e... dele próprio, Noam
Chomsky! (Ver a nota 3, p. 75, do Estruturas sintáticas.) Para ele, essa exigência é
demasiadamente forte e dá origem a limitações excessivas à teoria linguística, como a
de que os níveis superiores de estrutura devem ser literalmente construídos a partir de
elementos dos níveis inferiores, ou a de que não deve haver “mistura de níveis”:
Ao tentar desenvolver procedimentos de descoberta de gramáticas, somos

naturalmente levados a considerar morfemas como classes de sequências de
fonemas, isto é, como tendo “conteúdo” fonêmico real, num sentido quase
literal. Isso nos leva a problemas em casos bem conhecidos, como o da forma
verbal “took” /tuk/ [pegou] em inglês, em que é difícil associar, sem
artificialidade, qualquer parte dessa palavra com o morfema de tempo
passado, que aparece como /t/ em “walked” /wɔkt/ [caminhou], como /d/ em
“framed” /freymd/ [modelou], etc. (2015: 82)
A proposta de Chomsky é mais modesta – mas é a que veio a prevalecer a partir

de então: o objetivo de uma teoria linguística deve ser o de fornecer um procedimento
de avaliação: dadas duas gramáticas e um corpus significativo da língua, a teoria deve
fornecer critérios para definir qual das duas gramáticas é “mais adequada” em relação
àquele corpus. Em outras palavras, o critério explorado por Chomsky em Estruturas é o
da “simplicidade”, que, segundo ele, abarca “o conjunto de propriedades formais das
gramáticas” (2015: 76): por exemplo, qual das gramáticas descreve o conjunto de fatos
linguísticos por meio de um menor número de regras, ou por meio de regras mais
simples – que utilizam menos símbolos etc. Eis uma das razões pelas quais Chomsky
enfatiza tanto a importância de “formalizar” as análises gramaticais. Nessa concepção,
não há restrições metodológicas que excluam certas hipóteses a priori: “Pode-se chegar
35
a uma gramática pela intuição, por meio de suposições, de sugestões metodológicas
parciais, por indução a partir da experiência passada, etc.” (2015: 79).
Chomsky finaliza o capítulo com uma “alfinetada” especialmente dirigida aos
estruturalistas, que, baseados no pressuposto de que a teoria linguística deveria fornecer
“procedimentos de descoberta”, defendiam a precedência dos estudos de morfologia e
fonologia sobre as investigações em sintaxe:
[...] acredito que seja completamente insustentável a ideia de que a teoria

sintática deva esperar a solução de problemas da morfologia e da fonologia,
independentemente de que se tenha ou não a preocupação com o problema de
procedimentos de descoberta. Acredito que tal ideia tenha sido alimentada
por uma analogia defeituosa entre a ordem do desenvolvimento da teoria
linguística e a ordem presumida das operações na descoberta da estrutura
gramatical. (2015: 85)
Chomsky retorna às transformações do inglês no capítulo 7, com o objetivo

específico de mostrar como o desenvolvimento deste conjunto de regras permite
simplificar a gramática como um todo, em particular o componente sintagmático:
Nosso objetivo é limitar o núcleo de tal forma que as sequências terminais

subjacentes às sentenças nucleares sejam derivadas por um sistema simples
de estrutura sintagmática e possam fornecer a base a partir da qual todas as
sentenças possam ser derivadas por transformações simples: transformações
obrigatórias no caso do núcleo, e transformações obrigatórias e opcionais no
caso de sentenças não nucleares. (2015: 87)
Chomsky segue o capítulo 7 discutindo uma série impressionante de

transformações do inglês: a que forma orações negativas pela introdução de not; a que
forma orações interrogativas pela inversão entre verbo auxiliar e sujeito; a que introduz
o auxiliar do em certas orações negativas e interrogativas; a que forma orações
interrogativas com pronomes como who e what; formulações alternativas da
transformação passiva etc. Não só a “formalização” – a formulação explícita – dessas e
de outras transformações é discutida em detalhe, como sua interação entre si e com as
regras sintagmáticas e morfofonêmicas. Por exemplo, Chomsky explora em
profundidade as interações entre as regras sintagmáticas que introduzem verbos
auxiliares em inglês, a transformação de “pulo do afixo”, as transformações de negação
e de interrogação, de inserção de do e, ainda, as regras morfofonêmicas. A discussão
sustenta, de modo persuasivo, não apenas aspectos específicos das análises propostas –
como a ideia de que a inserção de do deve ser realizada por uma transformação e não
36
por uma regra sintagmática; sustenta, principalmente, a arquitetura da gramática
proposta em (5).
O capítulo 7 ilustra exemplarmente o espírito do modelo transformacional nesse
primeiro momento da Linguística Gerativa, ao mesmo tempo em que enfatiza certas
ideias e um estilo de argumentação que viriam a ser característicos da abordagem
gerativa – ainda que as transformações específicas ali propostas tenham sido revistas ou
mesmo abandonadas ao longo dos anos. Daí a atualidade do Estruturas, que Carlos
Mioto bem sintetiza ao comentar a tradução brasileira, publicada em 2015 (o
comentário aparece no texto de orelha da tradução):
Acho que o propósito desta tradução é sacudir a poeira porventura acumulada

sobre a obra clássica de Chomsky que emblematicamente registra os
primeiros pontos da pauta do empreendimento gerativista. O acúmulo de
poeira parece ser resultado do fato de a teoria gerativa estar em constante
remodelação. [...] Assim é que de Estruturas Sintáticas foram abandonadas
ideias como as que derivam das sentenças negativas e interrogativas de uma
mesma sentença nuclear mediante transformações (Tneg e Tw
respectivamente); mas não ideias que coincidem com a busca da gramática
melhor, mais simples e mais aparelhada para descrever e explicar fenômenos
afeitos às línguas naturais que subjaz a todo o empreendimento gerativista. A
importância de Estruturas Sintáticas não é apenas histórica.
O capítulo 8 de Estruturas é um capítulo curto, em que Chomsky procura

reforçar a argumentação a favor do nível de representação “estrutura transformacional”,
mas de um novo ângulo – buscando aplicar a mesma lógica encontrada em argumentos
que estabelecem a necessidade de níveis como a fonologia, a morfologia e a estrutura de
constituintes na sintaxe. Chomsky se concentra na “ambiguidade de interpretação” de
certas “sequências terminais”, indicando a “não correspondência” entre suas análises em
diferentes níveis. É o que acontece com as sequências a name (‘um nome’) e an aim
(‘um objetivo’), que só podem ser distinguidas como segmentações morfológicas
alternativas da mesma sequência fonêmica /əneym/ (essas duas sequências não podem
ser distinguidas sintaticamente, já que ambas possuem a estrutura sintagmática [SN Det
+ N]). Chomsky chama esse tipo de problema de homonímia construcional e nele inclui
os casos de ambiguidade estrutural, isto é, em que uma única sequência (morfológica)
de palavras pode ter mais de uma análise sintagmática (por exemplo, old men and
women (‘homens e mulheres velhos’), que pode ser analisada como [[Adj N] and N] ou
como [Adj [N and N]] em inglês).
Segundo Chomsky, as transformações podem explicar casos de “ambiguidade de
interpretação” que não são analisáveis somente por meio da estrutura sintagmática. Por
37
exemplo, uma nominalização como the shooting of the hunters (‘os tiros dos/nos
caçadores’) é ambígua em inglês (os caçadores podem ser aqueles que atiram ou aqueles
que são atingidos por tiros); mas the growling of the lion (‘o rugido do leão’) e the
raising of the flowers (‘o cultivo de flores’) não são ambíguas (o leão só pode ser quem
ruge; e as flores só podem ser aquilo que é cultivado). Chomsky explica esses fatos
postulando uma transformação que converte estruturas sintagmáticas nucleares do tipo
SN1 + V (+ SN2) em uma única e indistinguível estrutura sintagmática derivada Det + N
+ of + SN, em que SN pode ser SN1 ou SN2. Isso porque a nominalização the shooting of
the hunters pode ser derivada de duas sentenças nucleares diferentes, The hunters shoot
someone (‘Os caçadores atiraram em alguém’) ou Someone shoot the hunters (‘Alguém
atirou nos caçadores’). As outras duas nominalizações só podem ser derivadas de uma
única sentença nuclear, The lion roared (‘O leão rugiu’) e Someone raised the flowers
(‘Alguém cultivou as flores’), respectivamente; veja p. 130-131 de Estruturas para
discussão detalhada.
Assim, o capítulo 8 não apenas oferece novos argumentos a favor da necessidade
do nível de representação “estrutura transformacional”, mas acaba levando Chomsky a
uma concepção inovadora do que é “compreender uma sentença”:
O que estamos sugerindo é que aquilo que chamamos de “compreender uma

sentença” deve ser explicado, em parte, em termos da noção de “nível de
representação”. Para compreender uma sentença, então, é necessário,
primeiro, reconstruir sua análise em cada nível linguístico [...] incluindo
níveis superiores como a estrutura sintagmática e [...] a estrutura
transformacional” (2015: 128).
Essa concepção é inovadora, tanto porque não havia sido formulada nesses
termos antes, como também porque abre a porta para uma nova abordagem das questões
relativas à significação das frases – abordagem que emerge do capítulo 9, onde
Chomsky discute a relação entre sintaxe e semântica.
O ponto central do capítulo é defender a ideia de que é possível construir os
diferentes níveis de representação gramatical sem apelo à noção de “significado”.
Chomsky argumenta que, além de obscuras, várias das noções semânticas utilizadas até
então na descrição gramatical eram ou desnecessárias (por exemplo, a noção de
significado na definição de “fonema”), ou insuficientes (por exemplo, a noção de agente
na definição de sujeito). Em particular, no que diz respeito às transformações, Chomsky
reconhece que muitos dos argumentos a favor delas recorrem a termos como
38
“compreender uma sentença”, “ambiguidade de interpretação” ou “mesma interpretação
em algum nível”; mas enfatiza que são todos argumentos que se baseiam em “intuições
sobre formas linguísticas” (2015: 137) – intuições que podem ser analisadas por meio
de relações e operações de natureza formal. Segundo ele, “noções como referência,
significação e sinonímia não desempenharam qualquer papel na discussão” (2015: 150).
De fato, na maior parte das análises transformacionais do Estruturas em que
alguma noção de “significado” poderia ser pertinente, o que a substitui é o apelo às
“sentenças nucleares”. Por exemplo, a sinonímia parcial entre passiva e ativa é expressa
pela análise segundo a qual as sentenças passivas são derivadas de sentenças nucleares
cuja estrutura básica é a mesma das sentenças ativas correspondentes. Além disso, a
sinonímia entre sentenças passivas e ativas é parcial porque limitada a pares como
Maria demitiu João / João foi demitido por Maria – em que os SNs são não
quantificados. Mas, como Chomsky percebeu (2015: 148), quando os SNs são
quantificados, como em Todos nesta sala falam ao menos duas línguas / Ao menos duas
línguas são faladas por todos nesta sala, já não há equivalência necessária: na primeira,
a interpretação preferencial é que cada pessoa na sala fala duas línguas – as línguas não
precisam ser as mesmas; já na segunda, a leitura preferencial é que há duas línguas
específicas que todos na sala falam – as duas línguas são as mesmas. Fatos como esse
levaram Jackendoff (1972) a sustentar que algumas propriedades semânticas das frases
– como o escopo de SNs quantificados – devem ser “lidas” diretamente da estrutura de
superfície das frases, e não da estrutura profunda.
Obviamente, seja lá o que há de comum à “interpretação” dos dois tipos de
sentenças (passiva e ativa), esse elemento comum será expresso por – “representado no
nível de” – suas “sentenças nucleares”. O crucial é que, mesmo representando aspectos
incertos de alguma noção (também incerta) de “significado”, as sentenças nucleares são
parte da sintaxe da língua, são as representações gramaticais geradas pelas regras
sintagmáticas. Portanto, se codificam aspectos do significado, o fazem formalmente –
isto é, em termos das formas da língua (especificamente, das combinações de morfemas
e palavras em sintagmas).
Quais aspectos do significado são codificados pelas “sentenças nucleares”?
Chomsky não oferece resposta explícita em Estruturas. As noções que permitem algum
progresso nesse sentido só começam a ser estudadas de modo mais sistemático a partir
da década de 1960: são noções como a de papel temático, que permitem identificar e
caracterizar um “dependente semântico” de verbos e outras palavras que exigem
39
complementos – “argumentos” do “predicado”, para usar os termos hoje consagrados
em semântica. Tais noções começaram a ser estudadas apenas na década de 1960: Katz
e Postal (1964) e Chomsky (1965) começaram a utilizar de modo sistemático as
chamadas restrições selecionais (certos verbos exigem complementos animados, ou
inanimados, concretos ou abstratos etc.). Logo a seguir, Gruber (1965) dá início ao
estudo sistemático dos papéis temáticos – noções como agente, paciente, recipiente,
destinatário, causador etc. – que buscam caracterizar o modo de participação de um
argumento na situação descrita por um predicado. Os papéis temáticos, especialmente,
já haviam sido utilizados na descrição tradicional, mas não haviam recebido atenção
sistemática; a partir de Gruber e de Jackendoff (1969, 1972), os papéis temáticos se
tornaram tópicos centrais de pesquisa na interface sintaxe-semântica (para uma síntese
recente das noções relevantes, com referências atualizadas, remetemos o leitor a
Cançado e Amaral, 2016).
Retrospectivamente, pode-se dizer que as sentenças nucleares provavelmente
buscavam capturar o fato de que os papéis temáticos de um predicado permanecem
basicamente os mesmos, ainda que esse predicado venha a sofrer modificações por
operações lexicais/gramaticais (passivização, nominalizações) e que essas modificações
afetem a manifestação sintática de alguns dos papéis temáticos.
Ainda que Chomsky não tenha conseguido, em Estruturas, ser mais específico
sobre que aspecto do significado estava sendo codificado pelas “sentenças nucleares”,
ele vislumbrou no recurso uma abordagem geral para certos elementos de significado
das frases: aqueles que são regularmente associados a aspectos gramaticais podem ser
mais bem identificados e estudados uma vez que os aspectos gramaticais, sintáticos,
pertinentes sejam elucidados:
Parece claro, então, que existem correspondências inegáveis, ainda que

apenas imperfeitas, entre características formais e semânticas da linguagem.
O fato de que as correspondências são inexatas sugere que o significado será
relativamente inútil para servir de base para a descrição gramatical. [...]
intuições e generalizações importantes podem ser perdidas se pistas
semânticas forem seguidas perto demais. [...] O fato de que as
correspondências (...) existem, contudo, não pode ser ignorado. [...] Uma vez
determinada a estrutura sintática da língua, podemos estudar a maneira como
é posta em uso no funcionamento real da língua. Uma investigação da função
semântica da estrutura de níveis gramaticais [...] poderia configurar em um
passo razoável em direção a uma teoria das interconexões entre sintaxe e
semântica. (2015: 148-149)
40
Ou seja, a prioridade de investigação é dos aspectos formais das expressões
linguísticas. Eis aí uma das origens – nesse caso, metodológica – do que veio a ser
conhecido como a “centralidade da sintaxe” ou o “sintaticocentrismo” de Chomsky.
Retornando ao papel das “sentenças nucleares” na descrição de aspectos do
significado de uma frase, percebe-se que há, em Estruturas, um claro prenúncio daquilo
que viria a se chamar de “hipótese de Katz e Postal” (sugerida em Katz e Postal, 1964):
a hipótese de que haveria um nível de representação sintático que codificaria todas as
informações gramaticais necessárias à interpretação semântica da frase. Chomsky não
chega a formular explicitamente, em Estruturas, a distinção entre “estrutura profunda” e
“estrutura de superfície”, como dissemos; a hipótese de Katz e Postal é adotada em
Aspectos da teoria da sintaxe (Chomsky, 1965), quando surge o chamado “modelo
padrão” da Gramática Gerativa, mas, como havíamos apontado, já podemos perceber
que as bases para os dois níveis já estava formada:
o processo de “compreender uma sentença” pode ser explicado, em parte,

utilizando-se a noção de nível linguístico. Em particular, para compreender
uma sentença, é necessário conhecer as sentenças nucleares das quais ela se
originou (mais precisamente, as sequências terminais subjacentes a essas
sentenças nucleares) e a estrutura sintagmática de cada uma delas, assim
como a história transformacional do desenvolvimento da sentença a partir das
sentenças nucleares. O problema geral de se analisar o processo de
“compreender uma sentença” é então reduzido, de certo modo, ao problema
de se explicar como as sentenças nucleares são compreendidas, sendo essas
consideradas os “elementos de conteúdo” básicos a partir dos quais as
sentenças comuns da vida real, mais complexas, são formadas por meio de
um desenvolvimento transformacional. (2015: 135-6)
Em resumo, pode-se dizer que Chomsky, em Estruturas, é cético em relação ao

estado de desenvolvimento dos conceitos semânticos à época, bem como às propostas
de fundar a descrição gramatical nesses conceitos; mas de modo algum pode-se acusá-lo
de negligenciar o estudo do significado nem tampouco a relação entre sintaxe e
semântica. Quanto a seu ceticismo, é preciso lembrar o contexto histórico e intelectual
em que Estruturas foi escrito, como apontamos na tradução comentada de 2015
(comentário 77, p. 137-8):
a publicação de Syntactic Structures, em 1957, é o começo de uma revolução

no estudo da linguagem [...] foi escrito num período em que os únicos
componentes linguísticos satisfatoriamente conhecidos eram a fonologia e a
morfologia. Sua contribuição específica era, precisamente, a de demonstrar
que também a sintaxe poderia ser estudada com métodos tão rigorosos quanto
os que os estruturalistas aplicavam aos estudos dos fonemas e dos morfemas.
Portanto, não chega a surpreender que, em Syntactic Structures, Chomsky
vocalize, com respeito à semântica, as preocupações de seu ambiente de
41
formação acadêmica. Neste, havia tanto estruturalistas devotados ao
desenvolvimento de métodos que minimizassem o “apelo ao significado” na
análise linguística, como Zellig Harris, quanto filósofos preocupados com o
estatuto ontológico de entidades mentais, como Quine e Putnam.
Já quanto à clara consciência de que era necessário fazer algum progresso na

abordagem das questões da semântica a fim de tirá-la da situação em que se encontrava,
deixamos que Chomsky o diga por si mesmo:
Ao propor que a estrutura sintática pode fornecer certo insight para

problemas de significado e de compreensão, entramos num terreno perigoso.
Não há nenhum domínio do estudo linguístico que esteja mais sujeito a
confusões e mais necessitado de uma formulação clara e cuidadosa do que
aquele que trata dos pontos de conexão entre sintaxe e semântica. (2015: 136)
O quanto a proposta contida em Estruturas teve sucesso pode ser julgado pelo
desenvolvimento posterior da tese de que é possível compreender melhor aspectos do
significado à medida que se consegue correlacioná-los com níveis de representação
formais: é essa abordagem que está por trás do surgimento da estrutura profunda, em
Chomsky (1965); e que está por trás da compreensão de que certos aspectos de
significado não poderiam ser expressos pela estrutura profunda (cf. Jackendoff, 1972); e
que certos aspectos, que não cabem na estrutura profunda, podem ser lidos diretamente
da estrutura de superfície (cf. Jackendoff, 1972; Reinhart, 1976), e que outros aspectos
exigiriam um novo nível de representação sintático, a forma lógica (cf. May, 1977;
1985). A contribuição de Estruturas para a semântica foi fundamental.
Palavras finais
Com a visão que temos hoje sobre teoria linguística e sintaxe, e conhecendo o
desenvolvimento posterior da abordagem gerativa, percebemos que esse livro,
pequenomas seminal, ainda não demonstrava uma preocupação com a relação entre
conhecimento gramatical e cognição humana. Ou seja, ele não se preocupava com a
realidade psicológica das regras, dos níveis de representação, nem tampouco das
operações de transformação em si. Da mesma forma, aspectos fundamentais da relação
entre a teoria linguística e a aquisição da linguagem foram deixados de lado em
Estruturas – essa relação passaria a se tornar central para o desenvolvimento da teoria
apenas em 1965, com Aspectos da teoria da sintaxe. Em Estruturas, Chomsky fala da
tarefa do linguista (e nunca de uma criança em fase de aquisição) de descobrir os
42
princípios formais subjacentes da gramática de uma dada língua: “a tarefa do linguista é
produzir um determinado tipo de mecanismo (chamado gramática) para gerar todas e
apenas as sentenças de uma língua” (2015: 125).
Como vimos, alguns temas de pesquisa tão caros à investigação gerativista
contemporânea não encontraram seu espaço em Estruturas, o primeiro livro publicado
por Chomsky. Contudo, já encontramos aqui o cerne de muitas das ideias chomskyanas
sobre a linguagem. Germes dessas ideias também são encontrados em The Logical
Structure of Linguistic Theory, e os germes da preocupação de Chomsky com a relação
entre teoria linguística e aquisição da linguagem aparecem na clássica resenha que
Chomsky publicou sobre o famoso livro de Skinner, Verbal Behavior (veja o capítulo
“O jovem Chomsky, sua resenha de 1959 e a derrocada do behaviorismo”, neste
volume). Estruturas, The Logical Structure e a resenha de Verbal Behavior, todos da
década de 1950, são as três obras que desencadeiam a revolução gerativista da
linguística a partir da década de 1960. Em Estruturas, em particular, já encontramos a
preocupação em aproximar a linguística às ciências exatas. E o rigor metodológico de
investigação científica aplicado à linguagem. E a distinção entre níveis linguísticos. E a
importância do estudo da estrutura gramatical da frase em detrimento do estudo da
sequência linear em que os itens lexicais estão dispostos. E a preocupação com
“sentenças nucleares”, com a “história derivacional” das sentenças e com a gramática
mais simples. E o entendimento de que a gramática das línguas segue regras gerativas
de base universal e uniforme. E o insight de que a noção de nível de representação abre
uma porta para a compreensão de vários aspectos do significado. É por isso que
Estruturas sintáticas é, de fato, uma das obras fundamentais da bola de neve que deu
origem à revolução cognitiva nos estudos da linguagem na metade do século passado.
Referências:
BARSKY, R. F. Noam Chomsky: a vida de um dissidente. São Paulo: Conrad, 2004.

CANÇADO, M.; AMARAL, L. Introdução à semântica lexical. Petrópolis: Vozes, 2016.
CHOMSKY, N. Estruturas sintáticas. Trad. G. Othero e S. Menuzzi. Petrópolis: Vozes, 2015 [1957].
______. Aspectos da teoria da sintaxe. Trad. J. A. Meireles e E. P. Raposo. 2. ed. Coimbra: Arménio
Amado, 1978 [1965].
______. O conhecimento da língua: sua natureza, origem e uso. Lisboa: Caminho, 1994.
______. Sobre mentes e linguagem. ReVEL, v. 16, n. 31, 2018 [2007].
43
______. A ciência da linguagem. São Paulo: Unesp, 2014.
GRUBER, J. Studies in Lexical Relations. Tese de doutorado. Cambridge MA: Instituto de Tecnologia de
Massachusetts (MIT), 1965. Republicada como Gruber, Lexical Structures in Syntax and Semantics.
Amsterdam: North-Holland, 1970.
GUIMARÃES, M. Os fundamentos da teoria linguística de Chomsky. Petrópolis: Vozes, 2017.
JACKENDOFF, R. Semantic Interpretation in Generative Grammar. Cambridge MA: MIT Press, 1972.
______. Some rules of syntactic interpretation for English. Tese (Doutorado) – Cambridge MA: Instituto
de Tecnologia de Massachusetts (MIT), 1969.
KATZ, J.; POSTAL, P. An Integrated Theory of Linguistic Descriptions. Cambridge: MIT Press, 1964.
LEES, R. B. Review of Syntactic Structures by Noam Chomsky. Language, v. 33, n. 3, 1957.
LIGHTFOOT, D. Why UG needs a learning theory: triggering verb movement. In: ROBERTS, I.; BATTYE, A.
Clause structure and language change, Oxfordo: OUP, 1995.
______. The development of language: Acquisition, change, and evolution. New Jersey: Wiley-
Blackwell, 1999.
MAIA, M. Sintaxe experimental. In: OTHERO, G. A.; KENEDY, E. Sintaxe, sintaxes: uma introdução. São
Paulo: Contexto, 2015.
MAY (1977, 1985) INSERIR ESTAS DUAS OBRAS ÀS QUAIS AS DATAS SE REFEREM
REINHART, T. The syntactic domain of anaphora. Tese (Doutorado) – Cambridge MA: Instituto de
Tecnologia de Massachusetts (MIT), 1976.
SHANNON, C. E.; WEAVER, W. The mathematical theory of communication. Urbana, 1949.
O JOVEM CHOMSKY, SUA RESENHA DE 1959 E A DERROCADA DO

BEHAVIORISMO
Eduardo Kenedy
Simone Guesser
No ano de 2018, Chomsky completou 90 anos de vida. A Linguística Gerativa,

por ele inaugurada, atingiu, na mesma época, pelo menos longevos 61 anos de
vitalidade acadêmica. Ao longo desse período, o empreendimento chomskyano vem
formulando gradualmente um conjunto de questões acerca da linguagem humana, as
quais orientam o fazer não só da Linguística, mas também da Psicolinguística e da
neurociência da linguagem, entre outras ciências correlatas. Nos dias de hoje, essas
questões podem ser parafraseadas da seguinte maneira.
1. O que é o conhecimento linguístico humano?
44
2. Como esse conhecimento é adquirido espontaneamente na infância?
3. De que maneira tal conhecimento é posto em uso automaticamente pelos
adultos?
4. Quais são os mecanismos cerebrais que regulam esse conhecimento num
indivíduo particular?
5. Como se deu a evolução da capacidade para esse conhecimento na história
da espécie humana?
A primeira dessas perguntas caracteriza o que se pode chamar de “problema de

Humboldt” (veja capítulo homônimo neste livro). Trata-se da necessidade de
caracterização formal – ou seja, explícita e objetiva – do que é a capacidade cognitiva
humana de, a partir de um número limitado de elementos linguísticos (fonemas,
morfemas, itens lexicais), produzir e compreender um número ilimitado de frases em
pelo menos uma língua natural adquirida na infância. A longa e ainda presente busca
gerativista por respostas a essa questão compreende um capítulo à parte na história do
pensamento chomskyano (por exemplo, veja, neste livro, os capítulos “Estruturas
sintáticas e a reinvenção da teoria linguística”, “Teoria Padrão e Teoria Padrão
Estendida”, “Teoria de Regência e Ligação e a proposta de Princípios e Parâmetros” e o
“Programa Minimalista”). A segunda formulação define o “problema de Platão” (veja
capítulo homônimo neste livro) e diz respeito ao fenômeno da aquisição da(s) língua(s)
do ambiente pelo bebê e pela criança: afinal, diante de excertos de usos linguísticos que,
em si, não contêm toda a vasta quantidade de informação necessária para a aquisição da
gramática da(s) língua(s) a que estão expostos, como é possível que bebês e crianças
pequenas, a despeito de seu cérebro ainda em fase inicial de amadurecimento, consigam
construir, ao cabo de cerca de três anos desde o nascimento, seu conhecimento
linguístico? O “problema de Descartes” (veja capítulo homônimo neste livro) é o nome
de batismo da terceira questão chomskyana: de que maneira, em tempo real, o
conhecimento linguístico é integrado a outros domínios da cognição humana (atenção,
concentração, memória, emoção, intencionalidade etc.) para dar origem à performance
linguística, isto é, aos atos individuais concretos de produção e compreensão de
enunciados? A quarta formulação de Chomsky, “o problema de Broca” (veja capítulo
homônimo neste livro), é o ponto de integração entre Linguística e Neurobiologia: de
que maneira o conhecimento linguístico pode ser descrito em termos de neurônios,
sinapses, neurotransmissores? Por fim, mais recentemente o empreendimento gerativista
45
incluiu em sua agenda uma questão evolucionária, o “problema de Wallace-Darwin”
(veja capítulo homônimo neste livro): como se deu a evolução da disposição natural
para a aquisição e o uso do conhecimento linguístico que se vê emergir na espécie
sapiens do gênero homo?
A reunião dessas cinco questões pode ser considerada, ao final da segunda
década do século XXI, uma convergência de interesses científicos que parecem ter
existido ao longo de quase toda a história do pensamento humano, de Platão a Darwin.
Portanto, pode-se ter a impressão de que o mérito do empreendimento gerativista, nos
últimos 60 anos, foi integrar um conjunto de problemas muito mais antigos, de modo a
permitir uma abordagem linguística transdisciplinar que pudesse caracterizar o
conhecimento linguístico de maneira cientificamente completa, da Fisiologia à
Filosofia, da Psicologia à evolução. De fato, a abrangência dos cinco problemas
chomskyanos é tal que não somente gerativistas a eles se dedicam. Abordagens não
gerativistas também assumem uma ou mais dessas questões como norte principal de
suas pesquisas, muito embora lhes formulem respostas alternativas ao pensamento de
Chomsky. No entanto, a existência hoje de um claro e vasto programa de pesquisa
cognitiva acerca da linguagem humana não pode ser simplesmente dada como certa.
Com efeito, o paradigma cognitivista para o estudo das línguas naturais foi fruto de uma
revolução, de uma rebelião explícita contra um poderoso paradigma anticognitivista
que, então, determinava o interesse (e os financiamentos) da ciência e a imaginação dos
cientistas interessados em linguagem. Essa revolução teve início no fim dos anos 1950.
Em 1959, Chomsky era um jovem de 30 anos no início de sua carreira como
professor no Instituto de Tecnologia de Massachussetts (MIT). Seu primeiro livro havia
sido publicado há, então, dois anos, e muitos especialistas em linguagem já haviam
notado que se tratava de uma nova mente com ideias muito diferentes em relação às das
gerações anteriores na linguística. No mesmo ano, Burrhus Frederic Skinner (1904-
1990) era um premiado e experiente psicólogo de 55 anos de idade, que atuava, já há
cerca de 15 anos, como professor da universidade de Harvard. Skinner se notabilizou
por seus estudos experimentais com animais, nos quais utilizou ferramentas que eram
capazes de condicionar pombos e ratos a certos tipos de comportamento – as famosas
Caixas de Skinner. Há dois anos, Skinner havia dado um ambicioso salto em sua
carreira. Ele publicara um livro em que os fundamentos de seu modelo teórico, o
chamado behaviorismo radical, aplicavam-se a um comportamento tipicamente
humano: a linguagem verbal. Nas quase 500 páginas do seu Comportamento verbal
46
(Verbal behavior, 1957), Skinner acreditava estar demonstrando como, em crianças e
adultos, a aquisição e o uso de uma língua são sistemas de comportamento formados
pelos mesmos circuitos de respostas condicionadas que ele havia descoberto em seus
estudos com ratos e pombos. Para o eminente cientista,
os processos e as relações básicas que conferem ao comportamento verbal

suas características especiais são hoje bem compreendidas. [...] Os resultados
[de seus trabalhos experimentais] são surpreendentemente independentes de
restrições específicas de alguma espécie de animal. Trabalhos recentes têm
indicado que os mesmos métodos experimentais [empregados com pombos e
ratos] podem ser estendidos ao comportamento verbal sem grandes
modificações. (1957: 13)
Comportamento verbal é, portanto, o livro em que o talvez mais influente

intelectual vivo à época descreve a abordagem que a ciência psicológica então
hegemônica era capaz de conferir à linguagem humana. Nenhuma das cinco questões
apresentadas mais anteriormente pode ser sequer vislumbrada na obra de Skinner ou nos
estudos behavioristas de uma maneira geral. De que maneira, pois, o paradigma
skinneriano viria a ser a ser suplantado por uma abordagem cognitivista, que permitisse
ao menos a formulação desses cinco problemas? Nas palavras do próprio Chomsky, o
prestígio e a aceitação generalizada dos paradigmas e das ideias behavioristas “não eram
resultado de evidências empíricas ou de alguma lógica argumentativa, mas apenas eram
a consequência da inexistência de uma alternativa científica plausível” (1967: 4) Para
Chomsky, a construção de uma “alternativa plausível” ao behaviorismo poderia
começar por um confrontamento explícito com o paradigma dominante. Foi isso o que
aconteceu em 1959.
“Uma resenha sobre o ‘Comportamento Verbal’, de B. F. Skinner” (“A review
of B. F. Skinner’s Verbal Behavior”, 1959) é o artigo publicado por Chomsky, em 1959,
na edição 35 da revista Language. Trata-se de uma resenha crítica incomum na história
da ciência. O artigo caracterizou-se como uma análise minuciosa e deliberadamente
agressiva oposta não só ao livro de Skinner, mas ao modelo behaviorista de uma
maneira geral. Ao fim de pouco mais de 30 páginas, o jovem Chomsky aponta como a
superação do velho Skinner é a primeira etapa necessária para o desenvolvimento de
uma nova ciência que se proponha a investigar, de fato, o que é a linguagem humana,
como ela é adquirida, de que maneira é posta em uso, como é regulada pelo cérebro e
como pode ser explicada pela evolução. A resenha chomskyana pode ser interpretada
hoje como um manifesto, um estopim e o início de uma revolução – a revolução
47
cognitiva (cf. Gardner, 1985, além do capítulo “Estruturas sintáticas e a reinvenção da
teoria linguística”).
Precursores do modelo de Skinner
Behaviorismo é uma palavra derivada de um radical inglês (behavior, isto é,

“comportamento”) e pode ser traduzida como comportamentalismo. Trata-se de uma
escola rígida na Psicologia que se desenvolveu ao final do século XIX e ao longo das
primeiras décadas do século XX e, ainda hoje, apresenta-se em atividade no fazer das
ciências humanas. A ênfase dessa escola sobre o comportamento, em detrimento da
“mente” – que, afinal, deveria ser o objeto natural da Psicologia –, se justifica por uma
opção epistemológica de matriz positivista. John Watson (1878-1958), psicólogo
considerado o fundador do behaviorismo, em seu artigo “Psicologia: como os
behavioristas a veem” (“Psychology as the behaviorist views it”, 1913), explicitou com
clareza essa postura filosófico-científica. Para o autor, “mente”, “intenção”, “crença”,
“desejo”, “aprendizado” e demais conceitos “mentais” advogados por psicológicos pré-
behavioristas se caracterizariam como entidades abstratas, que dificilmente poderiam
ser estudadas de maneira objetiva por uma ciência empírica madura. Afinal, nenhuma
dessas noções poderia, na visão de Watson, ser manipulada de maneira objetiva, a ponto
de ser controlada como variável numa pesquisa experimental, por exemplo. Uma
Psicologia assentada nessas categorias estaria inexoravelmente presa às tradições
filosófico-metafísicas das quais, precisamente, necessitava se desprender para alçar-se à
condição de ciência.
Watson formalizou a postura de behavioristas que o precederam e asseverou
que, dada a inescrutabilidade da mente – que, para a ciência de então, seria uma espécie
de insondável caixa-preta – só restaria possível analisar empiricamente as variáveis
objetivas que atuam sobre ela, ou seja, os estímulos que ela recebe e as respostas,
decorrentes de estímulos, que ela emite. Um comportamento, segundo Watson,
decorreria de um sistema de condicionamento entre determinados estímulos e
determinadas respostas. É esse conjunto de variáveis concretas e empiricamente
manipuláveis (estímulo, resposta e comportamento) que seria o objeto legítimo da
madura ciência psicológica que despontava naquele início de século.
As origens do pensamento de Watson remontam ao associacionismo veiculado
por psicólogos prestigiados na virada do século XIX para o XX, como Hermann
48
Ebbinghaus (1850-1909) e Edward Lee Thorndike (1874-1949). Mais do que uma
escola, o associacionismo era então uma concepção psicológica bem difundida entre os
estudiosos da época. Segundo tal noção, qualquer aprendizado seria resultante da
associação entre informações. Por exemplo, informações que são associadas por
contiguidade temporal, por semelhança ou por contraste de conteúdos são mais rápida e
solidamente aprendidas em relação a informações que não possuem esses tipos de
associação. Em especial, Ebbinghaus estudou experimentalmente o efeito da repetição
para a formação de associações durante o aprendizado. Esse associacionista demonstrou
que a repetição frequente de certas associações tende a fixar com mais poder qualquer
tipo de aprendizado (ou de comportamento, como diria um behaviorista). Por sua vez,
Thorndike (1874-1949) alimentou fortemente as ideias behavioristas de Watson e de
Skinner ao introduzir na Psicologia o conceito associacionista de reforço (ou
recompensa, satisfação). Em 1905, o autor formulou aquilo que ficou conhecido como a
lei do efeito, segundo a qual dado estímulo tenderá a produzir uma resposta previsível
sobre certo organismo caso esse organismo seja recompensado ao produzir um
comportamento específico.
Na transição do associacionismo ao behaviorismo, foi de particular importância
a produção científica do fisiologista russo Ivan Pavlov (1849-1963), prêmio Nobel de
Medicina em 1904. Pavlov descobriu o que viria a ser conhecido como resposta
condicionada. Em seus estudos sobre processos digestivos em animais, o prêmio Nobel
percebeu que cães à espera de sua alimentação começavam a salivar antes mesmo que
algum alimento lhes fosse apresentado. Pavlov compreendeu que os cães haviam
associado a presença de uma pessoa específica – o funcionário responsável pela
alimentação dos animais – à apresentação de comida. Bastava que o funcionário
estivesse no campo de visão dos cães para que eles começassem a salivar, mesmo sem a
presença visual ou olfativa de comida. Para verificar o efeito desse tipo de associação,
Pavlov decidiu controlar metodicamente as variáveis ambientais de estímulo (algum
evento a ser associado à comida) e as variáveis de resposta (a salivação). Rapidamente,
o autor descobriu que os cães passavam a associar um evento contíguo à apresentação
de alimento à presença da própria comida e, por isso, passavam a salivar. Por exemplo,
se a comida fosse repetidamente apresentada aos cães ao mesmo tempo em que, na
proximidade deles, uma campainha de um metrônomo soasse ou uma determinava
lâmpada piscasse, os animais passavam a salivar somente diante do som do metrônomo
ou do piscar da lâmpada, mesmo sem a presença de comida. Para Pavlov, um estímulo
49
natural (comida) e uma resposta natural (salivar) não condicionados haviam sofrido um
processo de associação no qual um estímulo neutro (a presença do funcionário que traz
comida, o som do metrônomo, o piscar de uma lâmpada etc.) passava a disparar uma
resposta (salivar) que era não natural, condicionada.
Watson adotou as descobertas de Pavlov e os conceitos associacionistas em
diversos de seus estudos experimentais com crianças humanas, dando origem ao
behaviorismo como escola assim autodenominada. Seu experimento mais famoso ficou
conhecido como “O pequeno Albert”. Albert era um bebê que a princípio não
demostrava medo em relação a diversos tipos de objetos presentes em seu ambiente. Por
exemplo, Albert se aproximava de ratos e de coelhos sem expressar apreensão, mesmo
os tendo visto pela primeira vez em sua vida. Num dado momento, Watson passava a
apresentar um som desconfortável (estímulo não condicionado), uma campainha alta e
estridente, todas as vezes em que Albert via um rato ou um coelho (estímulo neutro).
Tal barulho perturbava o pequeno bebê, assustando-o e fazendo-o chorar (resposta não
condicionada). Em pouco tempo, com repetição da campainha na presença de um ser
peludo, o pequeno Albert passou a assustar-se e a chorar diante da mera exposição a
ratos, a coelhos ou a qualquer outro bicho semelhante, mesmo brinquedos. Um estímulo
neutro (ser peludo) havia passado, pois, a provocar uma resposta condicionada (medo,
choro) – e, dessa maneira, um comportamento condicionado havia se formado no bebê
pelo fenômeno da associação.
Skinner tomaria posse das descobertas de Ebbinghaus, Thorndike, Pavlov e
Watson relacionando-as e modificando-as de uma maneira revolucionária. O
behaviorismo pré-skinneriano pode ser corretamente sumarizado como “psicologia
estímulo-resposta”. De fato, o condicionamento descoberto por Pavlov e explorado por
Watson era formado na medida em que a apresentação inicial de um estímulo (não
condicionado > neutro) fosse associada a uma determinada resposta (não condicionada
> condicionada). Skinner teve a ideia de inverter essa cadeia de formação de
comportamentos e iniciar o processo de condicionamento com apresentação de um
evento condicionante (o reforço), que era apresentando a um organismo (um animal de
pequeno porte como um pombo) diante de um dado comportamento, sem a apresentação
prévia de um estímulo específico. Esse novo modelo behaviorista passaria a ser
conhecido como “condicionamento operante”, por oposição ao “condicionamento
clássico” de Pavlov e de Watson. Assim sendo, como o próprio autor advogou, o
50
behaviorismo de Skinner pode ser denominado como “psicologia comportamento-
reforço”, mas não exatamente “psicologia estímulo-resposta”.
O modelo de Skinner
Em sua obra fundamental – O comportamento dos organismos (The behavior of

organisms: an experimental analysis, 1938) –, Skinner estabeleceu os fundamentos de
seu novo behaviorismo. Nesse livro, o autor indicava o caráter puramente reflexo do
condicionamento pavloviano. Skinner ressaltou que, nos experimentos de Pavlov e de
Watson, o organismo não adotava comportamentos de maneira voluntária. Antes,
salivar diante de uma luz piscante ou chorar de medo diante de um coelho seriam
exemplos de reflexos condicionados, involuntariamente desencadeados nos organismos
por meio da associação entre variáveis. Skinner acreditava que iniciar o processo de
condicionamento pelo reforço de Thorndike – e de maneira repetida, como indicava
Ebbinghaus – poderia fazer com que um organismo operasse sobre as variáveis do
ambiente, desencadeando um padrão comportamental voluntário, agora denominado
comportamento condicionado operante.
Para explorar seu novo modelo, Skinner aproveitou suas habilidades de
engenharia e criou dispositivos experimentais que permitiam o controle rígido de
variáveis ambientais, de modo a tornar explícita a maneira pela qual seria possível
condicionar certos animais a dado tipo de comportamento operante. Esses dispositivos,
as Caixas de Skinner, eram verdadeiras gaiolas minúsculas em que animais do porte de
pombos ou ratos eram inseridos. Tais gaiolas possuíam um pequeno tubo, por meio do
qual porções de comida eram injetadas ao alcance do animal. Essas porções seriam
usadas como reforço (reforço positivo) para selecionar certo tipo de comportamento que
o animal eventualmente exibisse e, progressivamente, serviria para moldar
comportamentos mais complexos com base naquele selecionado inicialmente pelo
reforço. Na gaiola havia também uma barra pressionável e lâmpadas pequenas, às vezes
de cores diferentes. Outras versões da Caixa de Skinner podiam conter alterações desses
elementos, como espaços para comandos visuais (letras e números) e assoalhos
eletrificados, capazes de emitir choques, que funcionariam como um reforço negativo
capaz de inibir um comportamento indesejado.
Numa explicação simplificada, é possível afirmar que o condicionamento
operante se iniciava quando uma porção de comida (reforço positivo) era injetada na
51
gaiola assim que o animal demonstrasse um comportamento que se quisesse selecionar
ou, pelo menos, algum comportamento próximo desse. Por exemplo, imagine-se que na
parte dianteira da gaiola se posicionem a barra pressionável e as lâmpadas coloridas,
que servirão como futuros estímulos modeladores de comportamento. É preciso,
inicialmente, que o animal esteja voltado para a frente da Caixa de Skinner, de modo
que possa discriminar esses estímulos e então ser condicionado a partir deles. Nesse
contexto, é natural que o animal, ao ser inserido na gaiola, assuma comportamentos
aleatórios, como ziguezaguear, ficar parado, saltar, mover-se para os lados etc. O
experimentador, ao identificar que o animal se moveu de alguma maneira em direção à
frente da gaiola, pode então, nesse exato momento, injetar uma porção de alimento.
Essa injeção apresenta uma recompensa ao organismo pelo comportamento “virar-se
para a frente”, ainda que parcialmente. Com a repetição desse reforço para esse
comportamento específico, o animal passará a extinguir os comportamentos aleatórios
anteriores e selecionará apenas este operante, o virar-se para a frente. Quando tal
comportamento é condicionado, o processo começa a se complexificar e somente será
reforçado, por exemplo, o seguinte operante: pressionar a barra presente na caixa. O
animal, agora condicionado a voltar-se para o lado da frente da gaiola, eventualmente
pressionará a barra lá presente e, ao fazê-lo, um novo jato de comida será enviado para
ele. Mais uma vez, a repetição do reforço diante desse comportamento específico
selecionará tal ação operante. Mais do que apenas virar-se para a frente, o rato e/ou o
pombo agora foram condicionados a pressionar a barra.
A partir desse ponto, o processo skinneriano terá sequência numa espiral
teoricamente ilimitada de complexidade. Por exemplo, a recompensa só será injetada na
gaiola quando o animal pressionar a barra após o piscar de uma lâmpada verde, ou após
dois piscares da lâmpada verde seguidos de um piscar da lâmpada vermelha, ou tantas
outras possibilidades de combinação das variáveis ambientais que sinalizarão o
comportamento a ser recompensado. Com base nesse sistema, Skinner foi capaz de
condicionar seus animais a comportamentos operantes extraordinariamente complexos,
como dar uma volta de 360 graus em si mesmos ao serem expostos a uma placa que
dizia “dê uma volta”, ou como bicar o número 4, num conjunto de outros números,
quando o sinal 2 + 2 lhes era apresentado. Todo esse processo condicionador operante,
por mais longo e complexo que fosse, seguia a premissa básica: reforçar um
comportamento, que serve de base para outro comportamento, que serve de base para
outro etc.
52
A lógica do modelo, que Skinner acreditava ter validado empiricamente com
pombos e ratos, era a seguinte: um comportamento operante qualquer,
independentemente de sua complexidade, é formado quando o organismo é
recompensado por tê-lo exibido. Para o autor, a ciência behaviorista era capaz de
reduzir noções abstratas como “aprendizado” ou “aquisição” a variáveis objetivas como
“comportamento-reforço”. Dizia ele que “o aprendizado é o estabelecimento de padrões
de comportamento que são vantajosos para um organismo em algum tempo futuro”
(1938: 40). Para Skinner, “aprender” seria, portanto, uma maneira abstrata de se fazer
referência ao processo de condicionamento operante, no qual um indivíduo é
recompensado por adotar certos padrões comportamentais.
Os achados de Skinner foram replicados e confirmados por diferentes
pesquisadores do comportamento animal. Com efeito, a eficácia de seu behaviorismo
radical é até hoje explorada em diversos tipos de adestramento. Recentemente (2017),
uma empresa estadunidense de carros adaptados para controle exclusivamente manual
produziu uma peça publicitária em que pequenos cães faziam uma volta numa pista de
corrida pilotando, eles mesmos, esses carros. No making off da peça, é possível ver o
sistema de comportamento-reforço que levou os animais a, progressivamente, apertar o
botão da ignição, engatar a marcha automática e mover o volante do carro para um lado
num determinado momento.
Em 1957, Skinner de certa forma traiu sua natureza empirista de orientação
experimental e resolveu demonstrar, com argumentos puramente teóricos ou apenas
muito remotamente sustentados em dados obtidos com ratos e pombos, de que maneira
seu modelo poderia ser empregado para descrever um tipo específico de comportamento
humano: a linguagem verbal, na forma das línguas naturais. Para ele, humanos seriam
condicionados a produzir e compreender expressões linguísticas pelas mesmas cadeias
do tipo “comportamento-reforço” que levam ratos a pressionar barras numa gaiola.
“Comportamento é comportamento, em qualquer ponto da escala biológica evolutiva”
(1957: 102), dizia o célebre psicólogo. O condicionamento operante não seria, para
Skinner, significativamente variável conforme a complexidade de um organismo
particular (como o dos “humanos”), afinal tal complexidade (como a da “mente”), se
existente, faria parte da caixa-preta que, assim como seus antecessores, Skinner assumia
ser insondável pela ciência de então.
Um salto mortal
53
Comportamento verbal, já no ano de seu lançamento, foi considerado pelos
correligionários de Skinner um salto por demais ousado. Com efeito, os dados
experimentais colhidos no curso das décadas de pesquisas behavioristas haviam sido
obtidos exclusivamente a partir da análise de sujeitos não humanos. Sequer primatas
superiores, como bonobos ou chimpanzés, haviam sido então estudados
sistematicamente sob a abordagem “comportamento-reforço”. Logo, na ausência de
qualquer evidência empírica específica, simplesmente assumir que o comportamento de
homo sapiens obedeceria rigidamente à lei do efeito, mesmo em se tratando de
habilidades cognitivas superiores inexistentes no resto da natureza (como o domínio de
uma língua), parecia ser o tipo de premissa filosófica – isto é, metafísica, não empírico-
científica – de que a própria epistemologia behaviorista em suas origens positivistas
havia afiançado se afastar. Mais do que isso, tal premissa parecia pecar em petição de
princípio, erro filosófico em que se assume como verdade a priori uma tese que, na
verdade, deveria ser provada. Um erro desse tipo dificilmente poderia ser cometido por
um gênio como Skinner. Foi daí que surgiram as suspeitas ridículas de que Skinner
havia criado sua filha Deborah em uma de suas “caixas”, agora adaptadas para bebês e
crianças humanas. Especulava-se que a certeza skinneriana de que os humanos
adquirem uma língua assim como pombos “aprendem” a “fazer contas” só poderia ser
alimentada por evidências experimentais, afinal Skinner é um behaviorista radical e não
um filósofo. As fofocas sobre esses “experimentos secretos” eram alimentadas pelo
artigo “Um bebê numa caixa”, publicado por Skinner em 1945 na revista Ladies’ Home.
Nesse texto, o autor verdadeiramente descrevia outra invenção sua, o aeroberço
(aircrib) – uma espécie de “chiqueirinho luxuoso”, com regulagem de temperatura e de
umidade que permitia a mobilidade e a independência do bebê num espaço amplo,
higiênico e seguro.
O salto de Skinner em 1957 foi conduzido de maneira independente do que a
Linguística Estruturalista, dominante no cenário científico mundial até então, já havia
descoberto sobre as línguas naturais. Isto é, Skinner não se deteve em aplicar o seu
modelo a aspectos da aquisição, da produção, da compreensão ou da percepção de
fonemas, de traços suprassegmentais, de morfemas ou de classes do léxico. Sua noção
precisa do que seria um “comportamento verbal”, como denunciaria Chomsky em sua
resenha, não chegou a ser formalizada no livro. Em certos momentos, é possível
compreender que Skinner faz referência a aspectos da oralidade do inglês, mas noutros
54
parece estar se referindo a questões ortográficas daquela língua, sem atenção rigorosa à
distinção fala vs. escrita. Na análise da maior parte do livro, não obstante, é seguro
assumir que a noção skinneriana de “comportamento verbal” restringe-se ao emprego
do léxico, na oralidade ou na escrita do inglês.
De uma maneira geral, o modelo skinneriano assume que o ambiente que
circunda um bebê ou um adulto exige um comportamento verbal específico em certos
tipos de contexto, como dizer uma determinada palavra ou uma determinada frase
diante de uma dada situação, ou ainda exibir compreensão de determinado enunciado
linguístico, por exemplo desencadeando o comportamento não verbal veiculado a um
ato de fala presente no contexto imediato. O ambiente linguístico de um indivíduo
apresentaria, à vista disso, os fatores condicionantes de um dado comportamento verbal
operante – por exemplo, dizer “bola” quando se vê uma bola ou enunciar uma sequência
de números quando alguém pergunta “qual seu CPF?”. Os excertos de fala ao redor de
uma pessoa são, assim, os equivalentes funcionais das luzes piscantes ou das instruções
pictóricas no interior de uma Caixa de Skinner, ou seja, são os estímulos que um
organismo (agora, um humano) deve discriminar e aos quais deve reagir de determinada
maneira para que um comportamento operante seja condicionado por um reforço. O que
hoje chamamos de “língua” seria, para Skinner, uma coleção de comportamentos
operantes associados a uma coleção respectiva de estímulos ambientais.
Observamos que um falante possui um repertório verbal, no sentido de que

respostas de várias formas aparecem em seu comportamento de tempos em
tempos em relação a condições identificáveis no ambiente. (1957: 21)
Cada um dos itens desse inventário verbal (presumivelmente cada palavra e cada
frase específicas) seria um comportamento operante selecionado, num dado momento
da história do organismo (o indivíduo humano), pela atuação de algum reforço. O
reforço de um comportamento linguístico, conforme descreve Skinner, é normalmente
alguma variável do ambiente interacional do indivíduo, como a demonstração de
aprovação por outras pessoas ou a obtenção de um objeto (comida, bebida, brinquedo,
ação de outra pessoa). Nesse sentido, quando uma criança diz “oi” e sua mãe sorri ou
diz “muito bem!”, o sorriso materno ou a frase de exaltação são os equivalentes
funcionais da injeção de comida numa Caixa de Skinner, ao mesmo tempo em que dizer
“oi” é o correspondente de “virar para a frente” de um pombo ou um rato. Todavia, na
dinâmica da aquisição e do processamento da linguagem, Skinner admite haver um tipo
55
diferente de reforço. Para o autor, o reforço de um comportamento verbal operante pode
ser autogerado. Isso quer dizer que uma criança pode reforçar a si mesma, por exemplo,
repetindo uma sílaba ou uma palavra porque obtém de si própria alguma espécie de
satisfação por meio dessa repetição. Diz Skinner que um escritor pode reforçar seu
comportamento de escrever um livro ao imaginar a repercussão positiva da obra, seja
simulando leitores satisfeitos com o que leem, seja adiantando em sua fantasia os lucros
a serem auferidos com boas vendas.
Em suma, o modelo skinneriano de 1957 assume que estímulos linguísticos e
seus respectivos ambientes são eventos condicionantes que devem ser notados pelo
organismo humano. Inicialmente, esse organismo emitirá respostas aleatórias diante de
tais estímulos. A maioria dessas respostas será extinta porque não será recompensada
(nem mesmo autorrecompensada). Somente aquelas que forem reforçadas de alguma
maneira possível (inclusive pelo autorreforço) é que se converterão em comportamento
operante e passarão a compor o repertório de respostas verbais que um indivíduo
carregará consigo por sua vida e utilizará nos ambientes específicos em que tais
respostas sejam excitadas.
A crítica de Chomsky
Leitores contemporâneos podem considerar o modelo skinneriano

grosseiramente incapaz de explicar aspectos básicos da aquisição e do uso de uma
língua natural. É preciso, no entanto, evitar esse anacronismo e ter em conta o prestígio
da escola behaviorista durante a maior parte do século XX e, em particular, o poder das
publicações de Skinner sobre as ciências e sobre o imaginário popular nesse período.
No final dos anos 1950, explicar as línguas humanas com base na psicologia
“comportamento-reforço” ou mesmo na psicologia “estímulo-resposta” parecia ser não
apenas o desenvolvimento natural do comportamentalismo, mas, sobretudo, era a única
abordagem que a ciência humana então mais desenvolvida ousava fazer. Tal abordagem
era, inclusive, francamente aceita entre os mais eminentes linguistas estruturalistas
contemporâneos do behaviorismo, como Leonard Bloomfield (1887-1949) e Zellig
Harris (1909-1992). É nesse contexto que a resenha chomskyana se torna um evento
histórico.
Chomsky inicia seu artigo afirmando que o grande erro do modelo de Skinner
não foi propriamente apresentar uma análise funcional de variáveis supostamente
56
visíveis no ambiente e relacionáveis entre si de forma simples e direta (estímulo-
resposta), por meio de reforço (positivo ou negativo), capazes de determinar um
comportamento verbal operante. Para o resenhista, a maior deformidade da abordagem
skinneriana foi assumir, por princípio, que um comportamento tão intrincado como a
linguagem, produzido por um órgão tão complexo como o cérebro humano, pudesse ser
explicado sem que se fizesse qualquer consideração acerca da natureza desse órgão.
Chomsky reconheceu que, àquela época, estudos sobre Neurofisiologia cognitiva
encontravam-se ainda muito incipientes, mas isso não justificava a postura incomum de
atribuir ao cérebro do homo sapiens um papel exclusivamente passivo (em relação às
variáveis ambientais) na produção do comportamento. Para o linguista,
as características de um organismo são em geral o produto complexo de

uma estrutura inata, o curso de maturação interna desse organismo e sua
experiência com o ambiente. Na medida em que evidências
neurofisiológicas não estejam ainda disponíveis, parece óbvio que
inferências sobre a estrutura interna desse organismo devem ser feitas com
base na observação de sua interação com eventos externos. (1959: 3)
Com base nessa linha de argumentação, Chomsky anuncia, ao início de seu

texto, que um estudo cuidadoso do livro de Skinner revelará que suas alegações
principais não são justificadas teórica ou metodologicamente: (i) é possível explicar o
comportamento verbal sem considerar a natureza do órgão que o produz e (ii) em
essência, o comportamento verbal humano não se distingue do comportamento não
verbal manifestado por outros animais. Em decorrência dessa falha na base do
pensamento skinneriano, o resenhista reunirá argumentos para expor a fragilidade da
abordagem behaviorista e advogar em favor da necessidade de desenvolvimento de uma
nova perspectiva de análise linguística. A crítica chomskyana tem início com a
demonstração da imprecisão científica das categorias fundamentais do modelo
comportamentalista: estímulo e resposta.
Chomsky indaga: o que é um estímulo? É toda a sorte de variáveis que atuam
sobre um organismo ou é somente uma fração dessas, às quais o organismo reage? O
que é uma resposta? É qualquer tipo de comportamento manifestado por um organismo
ou somente aquele para o qual é possível identificar um estímulo respectivo? Definir
com exatidão tais conceitos, indica o autor, constitui um verdadeiro dilema para o
behaviorista. Afinal, se ele considerar que tudo no ambiente é estímulo, mesmo aquilo
que não provoca sobre um organismo qualquer resposta visível, então comportamentos
57
não serão previsíveis por alguma regra e, dessa forma, estarão fora do campo da ciência.
Por outro lado, se ele considerar que um comportamento é sempre uma resposta a um
determinado estímulo ambiental, então será possível assumir que regras controlam o
comportamento, porém a noção de “comportamento” perderá seu significado científico,
uma vez que a maior parte do que animais e humanos fazem não poderá ser considerado
como tal. Para compreender a natureza do dilema behaviorista, imagine-se, por
exemplo, uma criança que caminha pela rua de mãos dadas com um adulto pelo centro
de uma cidade altamente movimentada. Uma miríade de fenômenos visuais, auditivos,
olfativos, táteis e comportamentais circunda essa criança. Se todos e cada um desses
fenômenos são em si um estímulo, então o comportamento da criança não será passível
de explicação científica, dado que ela responderá possivelmente a alguns desses
“estímulos”, mas nunca a todos eles. Por outro lado, se o comportamento que essa
criança exibir só puder ser considerado como tal caso a ele seja relacionada uma causa
ambiental visível, então a maior parte das práticas dessa criança não será um
“comportamento”, pois muito do que ela fará dependerá de variáveis não ambientais
como atenção, volição e aleatoriedade.
Para Chomsky, tal dilema behaviorista não é resolvido por Skinner de nenhuma
maneira. A definição explícita das variáveis fundamentais do behaviorismo não é feita
em nenhum momento de “Comportamento verbal”, de modo que, para Chomsky, o
emprego de tais termos não assume nenhum significado formal no livro. “Estímulo”,
“respostas” e “comportamento” seriam termos empregados de maneira metafórica por
Skinner, cujos valores científicos seriam meramente ilusórios. O arsenal descritivo
skinneriano – isto é, todo o vocabulário importado de seus estudos experimentais com
animais de pequeno porte – seria incapaz de descrever qualquer aspecto do
comportamento verbal humano, justamente porque a extensão precisa de tais termos
jamais foi definida.
O vazio ou mesmo o absurdo das noções skinnerianas quando aplicadas à
linguagem é flagrado por Chomsky em diversas ilustrações. Por exemplo, imagine-se
que um indivíduo esteja presente num ambiente em que comece a ser tocada a “Sinfonia
nº. 40”. Para Skinner, é muito provável que, diante desse exato estímulo, esse indivíduo
pronuncie a palavra “Mozart”. Ou suponha-se um indivíduo que contemple um quadro
de Van Gogh. Segundo Skinner, essa pessoa provavelmente dirá algo como “Holanda”.
(Esses são exemplos de “estímulo-resposta” realmente utilizados por Skinner no livro).
Chomsky argumenta: não é possível prever de alguma maneira cientificamente útil o
58
que alguém dirá diante de tais “estímulos” ou de quaisquer outros. De fato, é possível
dizer “Holanda” diante de um autorretrato de Van Gogh, mas é igualmente possível
dizer qualquer outra coisa, num conjunto infinito de possibilidades (“que pintura
bonita”, “que feio”, “está torto na parede”, “não sabia que você gostava de arte”,
“combina com a sua sala”...). Skinner estava consciente de que não há uma única
resposta verbal plausível diante de um estímulo específico, contudo ele acreditava que,
seja qual for a resposta real produzida pelo organismo diante de um estímulo tal, ela
necessariamente será derivada de algum aspecto existente no estímulo tomado em si
mesmo. Por exemplo, diante de uma “cadeira vermelha”, um falante poderá dizer
“vermelho”, ou “cadeira” ou mesmo “velha” ou “nova”. No caso, para Skinner, uma
resposta como “vermelho” seria disparada pela “vermelhidão” presente no estímulo, ao
passo que a produção de “cadeira” seria causada pela “cadeirice” interna do objeto,
enquanto “velha” ou “nova” seriam comportamentos provocados pela “idade” inerente
ao objeto-estímulo. Para Chomsky, essa multiplicidade de respostas é uma confissão
skinneriana involuntária de que, mais do que o ambiente, é o organismo que gera um
comportamento por suas próprias motivações. Considerando os exemplos citados por
Skinner, dado que todos os talvez infinitos aspectos de uma música, de um quadro ou de
uma cadeira vermelha jamais podem ser ao mesmo tempo causadores de um
comportamento particular, é justamente o organismo que, por si, discriminará um traço
desse objeto e a ele reagirá. Afinal, o que determinaria a escolha pelo traço
“vermelhidão”, “cadeirice” ou “idade” dentre todos os outros elegíveis num
determinado estímulo? Ao que parece, no modelo de Skinner essa eleição não
decorreria de uma variável ambiental, mas, antes, de algum processo interno ao
organismo – o que caracteriza um flagrante contrassenso behaviorista. Com efeito,
Chomsky realça o vazio da psicologia “estímulo-resposta” ao indicar que, no caso do
comportamento verbal, o behaviorista precisará primeiramente observar um
comportamento, interpretado como resposta (por exemplo, “vermelho”), para então ser
possível deduzir que tipo de estímulo a teria provocado (por exemplo, “vermelhidão”).
Ou seja, “não é possível prever que resposta verbal um estímulo desencadeará porque
simplesmente não se sabe o que é um estímulo até que um organismo se manifeste de
alguma maneira” (Chomsky, 1959: 14).
Mais do que a insignificância das noções “estímulo” e “resposta” em situações
reais de comportamento verbal, Chomsky destaca a concepção muito rudimentar que
Skinner aparenta possuir acerca do que seja uma língua natural. Na grande maioria das
59
ilustrações de “respostas” ou de “operantes” presentes em Comportamento verbal, o que
o organismo produz linguisticamente é apenas um item lexical. Uma língua, entretanto,
é muito mais do que um inventário de palavras, como muitos estruturalistas pré-
skinnerianos já o sabiam. Atento a isso, Chomsky anuncia em sua resenha aquela que
passaria a ser uma das principais noções da gramática gerativa: a produtividade. O
linguista enfatizou que as línguas humanas são sistemas que, com base numa quantidade
finita de itens, como morfemas e palavras, é capaz de gerar, para a produção e para a
compreensão linguísticas, um número infinito de expressões, como as frases (o
“problema de Humboldt”). Para Chomsky, essa noção, também denominada
criatividade ou ineditismo, é talvez a propriedade que definitivamente separa as línguas
humanas de todos os outros sistemas de comunicação existentes. Ela está ao centro do
que torna uma língua um sistema gerativo. Na argumentação chomskyana, tal noção é
por definição incompatível com um circuito de formação de comportamentos operantes
baseado em recompensa para respostas, afinal uma língua não é uma longa lista de
frases selecionadas por reforços porque tal lista, por mais extensa que fosse, não poderia
ser infinita, não poderia ser criativa. Com efeito, no mundo real, crianças e adultos
compreendem a todo momento frases que nunca ouviram antes em sua história, assim
como produzem a todo instante frases inéditas, nunca antes proferidas em seu ambiente
– ou na verdade em qualquer ambiente. Chomsky indaga: de que maneira cada um
desses comportamentos específicos poderia ter sido selecionado num dado momento no
curso da história de um indivíduo particular?
Apesar de sua impossibilidade autoevidente (quando se considera a
produtividade das línguas), a seleção prévia de um comportamento verbal, via reforço,
está na base do modelo skinneriano. Para Skinner, uma dada resposta verbal (como uma
palavra ou uma frase), quando proferida numa situação adequada ou quando
interpretada de forma apropriada, será premiada pelo ambiente ou pelo próprio
organismo. Segundo o behaviorista, receber elogio ou alimento por conta de um
comportamento verbal particular é uma espécie de reforço análogo à injeção de comida
na Caixa de Skinner. A inovação skinneriana para estudo da linguagem foi, como já
visto, o autorreforço. Segundo essa noção, uma criança que sente prazer ao repetir um
balbucio ou um cientista que publica um artigo para criticar uma teoria rival praticam
ambos o autorreforço. Chomsky aponta a nulidade absoluta dessa noção. Ela seria
apenas a versão pseudocientífica de noções do senso comum como “desejar”, “querer”
ou “gostar”. De fato, como argumenta o linguista, asseverar que “A autorreforça B” é
60
equivalente a dizer que “o organismo deseja ou gosta de B”. Diferentemente do reforço
dos experimentos skinnerianos com pombos e ratos, o autorreforço é invisível no
ambiente e deve ser imaginado pelo analista comportamental. Para Chomsky, essa
noção não possui valor científico.
Ao que parece, a afirmação de Skinner segundo a qual todo comportamento

verbal é adquirido e mantido pelo reforço é simplesmente vazia, em razão de
seu conceito de ‘reforço’ não possuir qualquer conteúdo objetivo. (1959: 23)
Se todas as noções fundamentais do modelo de Skinner (estímulo, resposta,

reforço) são, como Chomsky defende, vazias de significado, nada ou quase nada pode
resultar como útil das análises linguísticas do behaviorismo. Chomsky explora isso ao
extremo ao indagar-se sobre as interpretações behavioristas acerca de comportamentos
humanos cotidianos. Por exemplo, ele se pergunta se, no caso de um indivíduo que
atravessa a rua desavisadamente e de súbito é alertado por alguém com a frase “Cuidado
com o carro!”, em consequência do que dá um salto para frente, esse salto seria um
reforço para a frase proferida pela outra pessoa? Uma arma apontada para a cabeça de
um indivíduo para obrigá-lo a dizer uma palavra específica, como “Mozart” ou
“Holanda”, possuiria o mesmo status de estímulo que uma música ou uma pintura?
Uma pessoa que seja assaltada e ouça a frase “passe a carteira ou perderá a vida” deverá
ter sido previamente reforçada para reagir a esse comportamento de uma maneira ou da
outra? A ridicularização do modelo de Skinner foi uma estratégia retórica fartamente
empregada por Chomsky em sua resenha com o objetivo de expor a esterilidade da
abordagem behaviorista. Para o resenhista, a aplicação literal do modelo de
Comportamento verbal a fatos da linguagem humana só faria sentido no “nível mais
grosseiro e superficial de análise linguística” (1959: 2).
A (segunda) revolução cognitiva
A conclusão de Chomsky indicava que linguistas, psicólogos e neurocientistas

precisavam abrir a “caixa-preta” estrategicamente ignorada por Skinner e pelos
behavioristas em geral. Ele argumentou que explicar o “comportamento verbal”
considerando exclusivamente variáveis ambientais é um erro insuperável, afinal um
ambiente repleto de estímulos sequer existe se não houver nele um organismo capaz de
percebê-los e analisá-los a ponto de com eles produzir linguagem. Essa mudança de
61
foco, do exterior para o interior do “organismo”, é sumarizada por Chomsky com a
apresentação de sua hipótese de que uma língua qualquer seja um mecanismo gerativo
capaz de construir frases com base em itens lexicais e regras computacionais. A função
do linguista seria justamente estudar as propriedades dessas regras computacionais. São
elas que determinariam de que maneira expressões linguísticas podem ser produzidas e
compreendidas a despeito do fato de serem inéditas e independentes de outras
expressões em termos de semelhança formal, semântica ou estatística. Para Chomsky,
as generalizações desse novo tipo de abordagem linguística são de interesse para a
psicologia cognitiva e para a neurociência, na medida em que atribuem à cognição
humana e a seu órgão basal papel decisivo na aquisição e no usa da linguagem.
A proposta chomskyana seria interpretada como uma “novidade”, como uma
“revolução” somente quando comparada ao behaviorismo e a seu domínio nas ciências
humanas por cerca de seis décadas. Na verdade, as ideias de Chomsky remontavam a
conceitos anteriores a Skinner, Watson, Pavlov, Ebbinghaus ou Thorndike. Elas
recuperavam conceitos introduzidos na filosofia e na ciência por Platão, Descartes,
Humboldt, Broca, Darwin e Wallace. É por essa razão que a revolução cognitiva
inaugurada desde a resenha de chomskyana se caracteriza como uma segunda
revolução, que recupera o curso da história das ciências da mente interrompido pelo
hiato das décadas de domínio behaviorista no mundo filosófico e científico. A primeira
revolução cognitiva já estava em curso desde o Iluminismo, mas fora descontinuada
bruscamente quando pesquisadores como Wilhelm Wundt (1832-1920) foram
obscurecidos pelas tendências positivistas que deram à luz o behaviorismo.
As consequências revolucionárias da crítica chomskyana ao modelo de Skinner
foram imediatas. Rapidamente, novas pesquisas acerca do “comportamento verbal”
começaram a ocupar os principais jornais e revistas de produção científica no mundo
acadêmico (Miller et al., 1960; Chomsky, 1962; Katz e Postal, 1964; Fodor, 1965;
Lenneberg, 1967). Skinner jamais responderia à crítica de Chomsky (ao menos não
diretamente, considerando partes de seu Sobre o behaviorismo, publicado em 1974, que
parecem alusão à resenha de 1959). O behaviorismo radical foi velozmente perdendo
sua influência e precisou se reinventar desde os anos 1960. Poucos behavioristas
contemporâneos aceitam ser nomeados como tal e quase nenhum deles advoga uma
interpretação literal de Comportamento verbal. É possível dizer que, a partir dos anos
1970, as cinco questões proposta por Chomsky já haviam substituído completamente a
agenda behaviorista radical na história das ciências da linguagem. Se em 1957 Chomsky
62
reinventava a linguística, em 1959 ele contribuía decisivamente na reinvenção das
ciências da mente.
Referências
CHOMSKY, N. A review of B. F. Skinner’s Verbal Behavior. Language 35, pp. 26-58, 1959.
______. Explanatory Models in Linguistics. in Logic, Methodology and Philosophy of Science, ed. E.
Nagel, P. Suppes, and A. Tarski. Stanford; Calif.: Stanford University Press, 1962.
______. A review of B. F. Skinner’s Verbal Behavior. In: JAKOBOVITS, Leon A.; MIRON, Murray S.
(Eds.). Readings in the Psychology of Language, Prentice-Hall, 1967, pp. 142-143.
FODOR, J. Could Meaning Be an ‘rm’. Journal of Verbal Learning and Verbal Behavior, 4, pp. 73-81,
1965.
GARDNER, H. The mind's new science: a history of the cognitive revolution. New York : Basic Books,
Inc., 1985.
KATZ, J.; POSTAL, P. An Integrated Theory of Linguistic Description. Cambridge, Mass: MIT Press, 1964.
LENNEBERG, L. Biological Foundations of Language. New York: Wiley & Sons, 1967.
MILLER, G.; GALANTER, E.; PRIBRAM K. H., Plans and the Structure of Behavior. New York: Holt,
Rhinehart and Winston, Inc., 1960.
PAVLOV, I. Conditioned Reflexes: An Investigation of the Physiological Activity of the Cerebral Cortex.
Translated and Edited by G. V. Anrep. London: Oxford University Press, 1927.
SKINNER, B. F. The Behavior of Organisms: An Experimental Analysis. Cambridge, Massachusetts: B.F.
Skinner Foundation, 1938.
______. Baby in a box: The mechanical baby-tender. The Ladies Home Journal, 62, pp. 30-31, 135-136,
138, 1945.
______. Verbal Behavior. Acton, MA: Copley Publishing Group, 1957.

______. About Behaviorism. New York: Vintage Books, 1974.THORNDIKE, E. L. The elements of
psychology. New York: A. G. Seiler, 1905.
WATSON, J. Psychology as the behaviorist views it. Psychological Review, 20(2), pp. 158-177, 1913.
63
TEORIA PADRÃO E TEORIA PADRÃO ESTENDIDA
Maximiliano Guimarães
A parte da história que me cabe contar8 foi uma época de ouro em que se atingiu
um aprimoramento significativo – tanto no aparato conceitual como na cobertura
empírica – da versão então vigente da Gramática Gerativo-Transformacional (GGT): o
chamado ‘modelo LSLT’, nomeado em referência ao tratado seminal The Logical
Structure of Linguistic Theory (Chomsky, 1955), cuja vulgata foi o livro Syntactic
Structures (Chomsky, 1957), responsável pela difusão da GGT e sua inserção no cânone
das teorias formais de gramática.
A despeito do protagonismo de Chomsky no desenvolvimento da Teoria Padrão
(TP), o período foi marcado pela intensa produção de seus colaboradores e também dos
críticos. Isso levou Chomsky a propor reformulações sucessivas da TP em termos da
Teoria Padrão Estendida (TPE), da qual emergiria depois a Teoria de Regência &
Ligação (TRL), tema do próximo capítulo (“Teoria da Regência e Ligação e a proposta
de Princípios e Parâmetros”).
Por melhores que tenham sido as propostas do modelo anterior, tratava-se de um
sistema calcado numa base empírica ainda pequena (comparativamente ao que viria),
portanto ainda pouco testado. Faltavam, sobretudo, comparações entre línguas diversas.
O formalismo matemático, embora tivesse ferramentas sofisticadas e eficientes, era
64
também pesado e ad hoc por conter muitas regras aplicáveis apenas a construções
específicas. O que se inaugurou com a TP foi a busca por um sistema em que a maior
parte das regras e princípios ficasse a cargo da teoria geral da gramática e uma menor
parte a cargo de idiossincrasias de gramáticas de línguas particulares. Esse objetivo já
estava claramente presente em Chomsky (1955) como indicado no próprio título da
obra, e só começou a se materializar plenamente na TRL, radicalizando-se no Programa
Minimalista (PM) deflagrado em Chomsky (1995). Mas foi majoritariamente na fase
TP(E) que isso foi gestado e maturado. Também foi na fase TP(E) que a GGT amadureceu
como uma teoria completa da gramática, abarcando fonologia, morfologia, sintaxe e
semântica.9
Toma-se Aspects of the Theory of Syntax (Chomsky, 1965) como marco inicial
da TP. Mas o embrião da TP já se observava ao menos desde Chomsky (1961), cujos
mecanismos propostos de inserção de itens lexicais na estrutura sintática anteciparam o
que Chomsky (1965, cap. 2) viria a propor, e que foi um dos ingredientes-chave para a
primeira implementação técnica do conceito de Estrutura Profunda (EP), bem como para
um tratamento formal dos graus de gramaticalidade. Nesse contexto, a obra-chave da
fundação da TP foi Chomsky (1964), que promoveu uma série de avanços logo
consolidados em Chomsky (1965). Destaco dois: (i) a explicitação dos níveis de
adequação (cujo embrião vem de Chomsky (1951)); e (ii) generalizações empíricas e
conjecturas sobre a (im)permeabilidade de certos domínios sintáticos para o
estabelecimento de dependências de longa distância: enfim, aquilo que posteriormente
viria a se conceber em termos de ilha, barreira, categoria de regência, fases etc. Na
outra ponta da história, temos Chomsky (1975, 1980) marcando a consolidação da TPE,
após o desenvolvimento de um aparato técnico apropriado para lidar com as questões

enfrentadas pela TP original. Destacam-se aí a noção de vestígio (Chomsky, 1973), as já
mencionadas condições de (im)permeabilidade de certas configurações sintáticas e o
nível de representação de Forma Lógica (FL): três dos ingredientes-chave para a
posterior formulação do modelo TRL.
Também foi com o advento da TP(E) que a GGT firmou em definitivo o
compromisso com o objetivo de dar conta da realidade psicológica da linguagem,
inserindo a Linguística no seio das ciências cognitivas. Logo, o objetivo da teoria
gramatical não é apenas formular um modelo que preveja corretamente a existência, a
estrutura formal e o significado de todos (e apenas) os arranjos de itens de vocabulário
reconhecíveis pelos falantes como próprios da língua (i.e., as sentenças). Objetiva-se
65
também que esse modelo seja compatível com as informações mais confiáveis de que
dispomos acerca de como o cérebro humano funciona (em termos de memória e
processamento), de como o conhecimento nele representado se forma no curso do
amadurecimento cognitivo da criança e, em última instância, de quais são as
propriedades neurofisiológicas efetivas do cérebro e como elas se desenvolveram na
evolução da espécie. Em comparação, o modelo LSLT era demasiado ‘matematizante’,
tomando a língua como algo exterior ao ser humano: um desequilíbrio que a TP(E) veio a
reparar.10
A partir da conceituação dos níveis de adequação (Chomsky, 1964), pôde-se
desenvolver um programa de investigação ‘em camadas’, correspondendo às cinco
perguntas fundamentais tratadas em capítulos subsequentes deste livro (cf. Chomsky e
Lasnik, 1993 [N993IKMSKY UENTES DESTE LIV; Guimarães, 2017: 113), tal que as
camadas superiores dizem respeito à ontologia da linguagem nas esferas psicológica,
neurobiológica e evolutiva. Entre as obras-chave da TP(E) que alavancaram o estudo da
linguagem qua objeto natural – com enfoque em questões de aquisição de linguagem e
em defesa de respostas segundo a tese do inatismo gramatical – estão: Chomsky (1966,
1968, 1971, 1975, 1980), além das contribuições de Noam Chomsky e Jerry Fodor para
o volume organizado por Piattelli-Palmarini (1980) a partir do debate público entre Jean
Piaget e Noam Chomsky ocorrido em 1975.
A Estrutura Profunda (EP) como o locus da recursividade e da interpretação
Entre tantas inovações significativas da TP, uma das mais notáveis e importantes
é a introdução do conceito de EP. Antes, no modelo LSLT (veja o capítulo “Estruturas
sintáticas e a reinvenção da teoria linguística”), compreendia-se a geração de sentenças
em termos de um sistema derivacional no qual regras sintagmáticas constroem um
primeiro Marcador Sintagmático (MS) – grosso modo, uma estrutura sintagmática da
ordem de grandeza de uma sentença nuclear (kernel sentence), que é a unidade
sentencial mais básica, formada apenas por meios sintagmáticos, sem qualquer tipo de
subordinação, não exibindo (ainda) nenhum efeito de aplicação de regras
transformacionais. Um MS inicial – simplificadamente representável por um diagrama
arbóreo – pode ser afetado por regras transformacionais que o modificam, dando origem
a um Marcador Transformacional (MT): uma estrutura sintática mais complexa, formada
pela combinação dos MSs manipulados (o MS inicial e outros dele derivados em série).
66
Naquele sistema, haveria dois tipos de transformações: as singulares e as generalizadas.
Transformações singulares alteram a estrutura interna de um MS. A seguir, ilustro isso
com uma apresentação ultrassimplificada dos efeitos da transformação de passivização,
que converteria (1a) em (1b).11
(1a) [S [o^gerente] demitiu [o^funcionário^desrespeitoso]]

(1b) [S [o^funcionário^desrespeitoso] foi demitido pel[o^gerente]]
Transformações generalizadas tomariam duas sentenças independentes e

comporiam uma nova sentença por meio do encaixamento de uma das sentenças
originais no interior da outra. A seguir, observamos os efeitos de duas sucessivas
transformações de subordinação, que gerariam (3) a partir das sentenças nucleares
independentes em (2). Encaixa-se (2a) em (2b) na posição de adjunto nominal marcada
pelo símbolo postiço ∆. Além disso, encaixa-se (2b) em (2c) na posição do objeto direto
aquilo, substituindo-o.
(2a) [S [o gerente] recompensou [os clientes]]

(2b) [S [o funcionário] desrespeitou [os clientes ∆ ]]
(2c) [S [Ana] disse aquilo]
(3) [S Ana disse [S que o gerente recompensou os clientes [S QUE o funcionário

desrespeitou]]]
A geração de (3) envolveria também algumas transformações singulares. Entre

elas, destacam-se (i) a transformação de conversão do SN [os clientes] em (2a) no
pronome pessoal ELE com a subsequente conversão deste no pronome relativo QUE; e
(ii) a transformação de deslocamento de QUE para o início da oração. Ao fim, (2a) seria
convertido em [S [o gerente] recompensou [SN os clientes [S QUE o funcionário
desrespeitou]]] (cf. Chomsky, 1955: 528-533, 618-622; Chomsky, 1957: 69).
A rigor, o que se vê em (2) não são sentenças nucleares, posto serem estruturas
já resultantes de transformações relativas à morfologia verbal e à concordância verbo-
sujeito (cf. nota 3). Crucialmente, no modelo LSLT, não há ordenamento intrínseco entre
as transformações singulares e as generalizadas. Tanto sentenças nucleares como
sentenças já internamente transformadas podem ser encaixadas umas às outras via
67
transformações generalizadas. Igualmente, transformações singulares poderiam ser
aplicadas tanto a sentenças nucleares como a sentenças já decorrentes de transformações
(singulares ou generalizadas). Tanto as transformações singulares como as
generalizadas poderiam em princípio ser obrigatórias ou opcionais segundo a lógica
geral da teoria. Além disso, todas as transformações poderiam ser especificadas ou não
quanto ao ordenamento necessário ou contingencial de suas aplicações. A arquitetura
geral do sistema derivacional do modelo LSLT pode ser resumida como em (4), adaptado
de Frank (2002: 3).12
(4)
itens regras
lexicais sintagmáticas
sentenças
nucleares
transformações transformações
singulares generalizadas
sentenças
derivadas
Nesse sistema, em princípio, transformações podiam se intercalar de diversas

formas. Sentenças nucleares formadas por meios sintagmáticos puros eram, por
definição, condição preexistente para a aplicação de transformações. No entanto,
sentenças nucleares não correspondiam a um nível de representação que codificasse
propriedades relevantes da sentença enquanto objeto unificado; portanto não gozavam
de nenhum estatuto semântico especial. Não seriam essas as unidades que fariam
interface com o componente semântico, por exemplo, já que elas são incapazes de
representar a integralidade do significado composicional de expressões com uma
proposição contida em outra. Toda a recursividade sentencial era tida como dependente
das transformações generalizadas, já que o pacote de regras sintagmáticas seria algo
como na amostra em (5), sem quaisquer meios de gerar recursividade.
(5a) S  SN^SV (5b) SV  V^SN (5c) SN  (D)^N^(SA) (5d) SA  A
68
Isso não era apenas uma possibilidade teórica entre muitas, mas uma solução
técnica bastante plausível para questões empíricas bem robustas. Na literatura técnica
dos últimos 60 anos, há muitos paradigmas intrincados que ilustram essa questão, que
ora apenas tangencio. Partamos dos dados em (6).
(6a) { [o aluno]1 disse { que [o professor]2 criticou a [si próprio]2/*1/*3 }}

(6b) { [o aluno]1 disse { que [o professor]2 criticou [ele]1/3/*2 }}
Aqueles mais familiarizados com discussões mais recentes reconhecem aí

exemplos típicos de efeitos de dois dos três princípios da Teoria de Ligação (TL), que
veio a ser mais apropriadamente formulada na década de 1980, na fase TRL da teoria
(veja o capítulo “Teoria da Regência e Ligação e a proposta de Princípios e
Parâmetros”) e cujos detalhes finos vêm sendo desenvolvidos até hoje. Entretanto, foi
na TP que tais padrões começaram a ser estudados, e muito se avançou naquela época,
ainda que certas lacunas só viessem a ser devidamente preenchidas depois. Em (6a), o
objeto da oração subordinada (si próprio) é um SN dêitico do tipo anafórico, que nesse
dado só pode remeter à mesma entidade referida pelo sujeito da oração subordinada (o
professor), jamais a qualquer SN externo a ela (como o sujeito da oração matriz: o aluno
ou algo saliente no discurso), tal como sinalizado pelos índices numéricos.13 Essas
generalizações empíricas surgiram na fase TP(E) e foram depois formalizadas em termos
do Princípio A da TL (Chomsky 1981: cap. 3). Em (6b) temos o exato oposto. O objeto
da oração subordinada é um dêitico de outro tipo. É um pronome, que não pode remeter
a um SN dentro do domínio sentencial mais imediato, podendo remeter a um SN fora
dele, como sinalizado pelos índices. Posteriormente, isso veio a ser formalizado em
termos do Princípio B da TL (Chomsky, 1981).
A comparação entre anáforas (Princípio A) e pronomes (Princípio B) é
inevitável e muito reveladora, dada sua flagrante distribuição complementar. Mas ela é
anacrônica num capítulo sobre a TP(E), pois, diferentemente das relações anafóricas,
muito estudadas já na TP(E), os padrões referentes aos pronomes só viriam a ser
apropriadamente descritos e analisados na TRL.14 Permito-me essa incongruência
histórica a fim de ilustrar meu ponto principal. Para além das regras específicas que
obrigam ou proíbem a correferência entre SNs (operantes em (6a) e (6b)
respectivamente), há na gramática algum tipo de princípio geral que define as orações
69
(ao menos as não reduzidas de infinitivo, gerúndio e particípio) como domínios
delimitadores do alcance das referidas regras de (anti)correferência: um requerimento
muito sólido e pervasivo que se impõe a mais de um mecanismo gramatical. Logo,
estaríamos diante de um princípio geral da gramática, presumivelmente codificado num
estrato superior dela, na própria arquitetura do sistema como um todo. A questão é saber
como se daria essa codificação.
Digamos que o modelo LSLT em (4) estivesse correto, com a recursividade
sentencial decorrente de transformações generalizadas, e os princípios reguladores de
anáforas e pronomes sendo mecanismos transformacionais que respectivamente
obrigam e proíbem a vinculação entre o elemento alvo e outro SN devidamente
identificado no contexto estrutural. Suponha, ainda, que esse mecanismo de
obrigação/proibição de vinculação (uma transformação singular) esteja intrinsecamente
ordenado antes de qualquer transformação generalizada que encaixe uma sentença na
outra. A consequência seria que os referentes das anáforas e dos pronomes seriam
sempre estabelecidos no domínio local da sentença nuclear, que, no ponto relevante da
derivação, estaria segregada do resto, figurando como oração única. Anáforas seriam
necessariamente vinculadas a um SN naquele domínio, e pronomes seriam proibidos de
se vincular naquele domínio, tendo de buscar seu referente fora (ou no discurso, ou
numa outra sentença em paralelo). Vê-se, portanto, que havia plausibilidade no modelo
LSLT quanto à recursividade ficar a cargo de transformações generalizadas.
Contudo, na obra seminal da TP, Chomsky (1965: 132-133) revê todas essas
posições criticamente e propõe uma reformulação massiva.
Primeiramente, tem-se demonstrado que muitas das transformações

singulares opcionais de Chomsky (1955, 1957, 1962) devem ser reconcebidas
como obrigatórias, cuja aplicabilidade a uma dada sequência é determinada
pela presença/ausência de um certo símbolo na sequência. [...] Em segundo
lugar, nota-se que a teoria de Marcadores Transformacionais [MTs] permite
uma vasta latitude de possibilidades no que concerne ao ordenamento [de
aplicação] das transformações. Logo, sob essa ótica, a gramática deve conter
regras que geram os [MTs] possíveis, especificando as condições de boa
formação que esses objetos devem satisfazer [...]. Essas regras podem
estabelecer o ordenamento das transformações em relação umas às outras, e
podem determinar certas transformações como obrigatórias, ou obrigatórias
relativamente a certos contextos, via requerimentos de que elas apareçam em
certas posições específicas nos MTs. Porém, apenas algumas das
possibilidades permitidas por essa teoria geral tem sido atestada em dados
linguísticos concretos. Em particular, não se sabe de casos de ordenamento
entre transformações generalizadas de encaixamento, embora tal tipo de
ordenamento seja permitido pela teoria de [MTs]. Ademais, não há nenhum
caso convincente de transformação singular que deve ser aplicada à oração
matriz antes de uma outra oração ser inserida nela, ainda que isso também
70
seja uma possibilidade teórica. Por outro lado, há vários casos de
ordenamento entre transformações singulares, e muitos exemplos de
transformações singulares que devem ser aplicadas a uma oração subordinada
antes de ela ser efetivamente encaixada, ou que devem ser aplicadas a uma
oração matriz após a oração subordinada se encaixar nela. [...] Não há razão
para se impor um ordenamento extrínseco às transformações generalizadas.
Em suma, transformações generalizadas não existiriam, pois seu papel de

encaixar sentenças umas nas outras recursivamente seria executado de maneira melhor
pelas próprias regras sintagmáticas, previamente às transformações. Coloca-se então
para a teoria a tarefa de redesenhar o sistema global do melhor modo possível, para
capturar os efeitos benéficos de se ter orações subordinadas como domínios
‘segregados’ e ‘trancados’ a elementos externos, como vimos anteriormente.
Resumindo, o sistema inaugurado em Chomsky (1964) e elaborado ao longo do período
TPE consistia em definir que, após pronta a EP, as transformações se aplicavam a ela em
ciclos que reconheciam os vários domínios de encaixamento na EP, começando pelos
mais encaixados e terminando pelos menos encaixados.
De volta ao nosso exemplo de referência em (3), repetido adiante como (7), ele
teria todos os seus encaixamentos gerados no chamado componente de base,
previamente a toda e qualquer transformação.
(7) [S Ana disse [S que o gerente recompensou os clientes [S QUE o funcionário

desrespeitou]]]
Em (8), temos uma amostra do pacote de regras sintagmáticas relevantes para

analisar o exemplo em pauta. Destaco as regras (8a’), (8b’) e (8c’).
(8a) S  SN^SV (8b) SV  V^SN (8c) SN  (D)^N^(SA) (8d) SA  A

(8a’) S’  Comp^S (8b’) SV  V^S’ (8c’) SN  (D)^N^(S’)
Conforme a arquitetura geral do modelo TP, aplicam-se todas essas regras

previamente a qualquer transformação, culminando no construto esboçado em (7), que
vem a ser a EP da sentença analisada (cf. nota 3 sobre simplificações expositivas). Em
(9), temos uma versão mais simples de (7), com uma subordinação a menos.
(9) [S Ana disse [S que o gerente recompensou os clientes insatisfeitos]]]
71
Em (10), temos um esboço da derivação da EP em (9), pela sucessão de
aplicações das regras em (8), que expandem passo a passo a sequência de símbolos
fazendo com que, ao final, haja sentenças menores como partes constituintes de
sentenças maiores.15 Por ora, abstraio os detalhes das transformações singulares, cujos
efeitos acabam sendo representados em (10), o que é uma inconsistência aceitável para
os propósitos desta breve exposição inicial.
(10) S » SN^SV » N^SV » N^V^S’ » N^V^Comp^S » N^V^Comp^SN^SV »

N^V^Comp^D^N^SV » N^V^Comp^D^N ^V^SN » N^V^Comp^D^N^V^D^N^SA »
N^V^Comp^D^N ^V^D^NÂ
Para além disso, há, obviamente, as aplicações das regras de inserção lexical,
que convertem cada um dos símbolos da última sequência de (10) em itens lexicais
específicos. Exauridos todos esses procedimentos, tem-se a sequência terminal em (11)
como o último passo da derivação da EP.16
(11) Ana^disse^queô^gerente^recompensouôs^clientesînsatisfeitos
Como já alertado, o que vemos em (11) é uma simplificação didática. Agora,

convém detalhar ao menos um pouco mais certas peculiaridades da EP. Evidentemente,
ela é mais abstrata do que a forma como a sentença se apresenta nos enunciados
efetivos, no que concerne aos exatos itens lexicais presentes e à sua exata ordem de
pronúncia. As transformações (todas elas singulares) se encarregam de fazer os devidos
ajustes necessários para satisfazer os requerimentos dos elementos de natureza afixal,
entre outras demandas de reestruturação, que, como explícito na passagem de Chomsky
(1965) citada, estariam em última instância codificadas em itens lexicais abstratos,
majoritariamente.
Em (12), vê-se novamente o exemplo em (9), dessa vez através de um diagrama
arbóreo que reflete mais fielmente a EP.
72
(12)
Em suma, as regras sintagmáticas do subcomponente de base constroem

derivacionalmente um MS (tal como (12)) que define a EP, de onde seria extraída toda a
interpretação semântica, a ser executada por um subcomponente semântico
especializado. Ademais, a EP é submetida a operações sintáticas adicionais de
transformações singulares que culminam na Estrutura Superficial (ES), de onde seriam
extraídas todas as informações relevantes para a construção da representação fonológica
da sentença pelo subcomponente morfofonológico, que eventualmente modifica ou
insere elementos funcionais como flexões, pronomes, auxiliares etc.
Assim, a organização geral da gramática segundo a TP é resumível como em
(13):
(13) léxico  regras de base  EP  transformações  ES

 
[representação semântica] [representação fonológica]
De acordo com a visão de Katz e Postal (1964), que constitui uma das bases para
o modelo de Chomsky (1965) em (13), transformações não afetam a interpretação
semântica, exceto na medida em que inter-relacionam MSs interpretáveis
independentemente de modo fixo. Essa associação estreita entre a EP e a interpretação
semântica, na concepção da TP, acabou sendo muito mal compreendida, a ponto de,
73
posteriormente, Chomsky (1975: 82), num texto clássico da TPE, ter de desfazer os mal-
entendidos explicitamente, como na passagem que se segue.
Infelizmente, o termo “estrutura profunda” tem se demonstrado fonte de confusão. Ele

levou muitos a suporem que as estruturas profundas e suas propriedades é que seriam
genuinamente “profundas” num sentido não técnico do termo, enquanto o resto seria
“superficial”, sem importância, variável entre línguas etc. Esse nunca foi o intuito. A
teoria fonológica inclui princípios linguísticos que são profundos, universais,
inesperados, reveladores etc.; e creio que o mesmo é verdade sobre a teoria das
estruturas superficiais e outros elementos da gramática. Na ocasião, o termo “estrutura
profunda” jamais foi usado com o propósito de significar “gramática” ou “gramática
universal” ou “propriedades abstratas das regras” ou qualquer outro uso confuso. Penso
que ninguém deveria se confundir ao ponto de acreditar que as propriedades dos
marcadores sintagmáticos iniciais necessariamente exauririam o que pode ser rotulado
de “profundo”, e que assunções sobre tais estruturas constituiriam a tese fundamental da
Gramática Transformacional, sem a qual a teoria entraria em colapso.
Os rastros deixados pelas transformações na Estrutura Superficial (ES) e a

rediscussão acerca do locus da interpretação semântica
Começo agora a demonstrar o funcionamento geral do modelo em (13) com base

na então assumida transformação de passivização (cf. Chomsky 1957: 43 e 112)
esboçada em (14), que, no modelo LSLT, seria aplicada antes do salto do afixo (cf.
capítulo “Estruturas sintáticas e a reinvenção da teoria linguística”) responsável
(juntamente com uma regra de concordância aludida na nota 3) por determinar a forma
final dos verbos.
(14) estrutura alvo: NPα – Aux – V – NPβ

modificação: χ1 – χ2 – χ3 – χ4  χ4 – χ2 – SER^-do – χ3 – por^χ1
Retornando ao mesmo dado exposto em (1), teríamos em (15) a parte relevante

de uma EP que seria o ponto de partida comum para a derivação de ambas as sentenças
(ativa e passiva) em (15). A transformação em (14) supostamente preservaria as
relações semânticas básicas acerca de quem é o agente e o paciente da ação, o tempo da
ação etc.
(15) o^gerente – [passado] – demit- – o^funcionário^desrespeitoso
(16a) [S [o^gerente] demitiu [o^funcionário^desrespeitoso]]

(16b) [S [o^funcionário^desrespeitoso] foi demitido pel[o^gerente]]
74
É evidente o protagonismo da sintaxe nesse modelo de gramática. As posições
sintáticas ocupadas por o^gerente e o^funcionário^desrespeitoso em (16a) e (16b) são
distintas, mas em ambos os casos o^gerente é agente e o^funcionário^desrespeitoso é
paciente. Essas funções semânticas (que na TRL seriam chamadas de papéis temáticos)
estariam determinadas na EP comum em (15). Em (16b), há, entre a EP e a ES, uma troca
de posições, que, segundo o modelo, afetaria apenas a fonologia, mantendo a semântica
intacta. A ‘recuperação’ do significado da estrutura transformada (16b) por parte de
quem vai interpretar só é possível por intermédio da sintaxe (i.e., pela ‘aplicação
reversa’ da transformação em (14)).
O esboço anterior, embora válido enquanto resumo simplificado de como o
modelo TP funciona, não é 100% fiel a como a passivização era concebida naquele
modelo. Escolhi essa transformação específica para ilustrar o ponto geral por se tratar de
uma regra de compreensão relativamente simples e porque ela é tomada como
referência em vários estudos da fase de transição entre o modelo LSLT e a TP, bem como
entre a TP e a TPE. A rigor, segundo Chomsky (1965: cap. 3), as EPs de sentenças ativas
e passivas correlatas não seriam idênticas. As sentenças passivas já teriam esse caráter
codificado na EP através de um sintagma extra adjunto ao SV, e que traz a preposição
(i.e., por) juntamente com um morfema abstrato de voz passiva. É exatamente a
presença (ou ausência) desse elemento adicional que deflagra (ou não) a aplicação
obrigatória da transformação de passivização, cujos detalhes técnicos não cabem aqui,
mas que não alteram a essência básica de (14). Em (17a) e (17b), temos as
representações arbóreas correspondentes, respectivamente, à EP e à ES da sentença
passiva em (16b).
(17a)
75
(17b)
De qualquer modo, assim como nas análises pré-TP, temos os dois SNs gerados
nos mesmos lugares tanto na voz ativa como na passiva, e tais lugares determinam o
estatuto semântico de agente ou paciente; sendo as noções de sujeito, objeto e adjunto
relativas às posições que eles ocupam na ES. Assim, uma parte importante do conteúdo
proposicional da sentença seria determinada na EP e, conforme esquematizado em (13),
não seria alterada na superfície após eventuais rearranjos morfofonológicos e
morfossintáticos que podem alterar desde detalhes mínimos de morfologia até aspectos
mais significativos de ordem de constituintes e prosódia.
76
Nos primeiros estudos que culminaram na TP, adotava-se a versão forte da
hipótese esquematizada em (13), segundo a qual nenhuma transformação afetaria o
significado da sentença. No limite, isso equivaleria a dizer que sentenças correlatas de
um par ativa/passiva teriam o mesmo significado. Entretanto, ao se admitir que elas
diferem, desde a EP, pela ausência/presença de um constituinte [por+passiva] adjunto ao
SV, abre-se uma porta para que se conceba alguma diferença de significado a ser
codificada exatamente nesse elemento extra. Veremos a seguir uma diferença
interpretativa importante entre sentenças ativas e passivas. A questão é se o melhor
caminho seria mesmo codificá-la na EP e responsabilizar o elemento [por+passiva] por
ela.
Um problema enfrentado por essa análise específica das sentenças passivas (com
impacto em toda a concepção de gramática sintetizada em (13)) dizia respeito a
contrastes de significado entre pares ativa-passiva de sentenças análogas como em (18)
e (19), contrastes esses que ultrapassam o que porventura possa ser atribuído à mera
presença ou ausência do marcador de passivização na EP.17
(18a) Muitas pessoas leem poucos livros.

(18b) Poucos livros são lidos por muitas pessoas.
(19a) Muitas flechas não atingiram o alvo.

(19b) O alvo não foi atingido por muitas flechas.
Embora esse tipo de contraste já tivesse sido timidamente apontado por

Chomsky (1957: 100-101) sem oferecer nenhuma solução para o problema, foi Klima
(1964), já imbuído de um “espírito pós-LSLT”, quem fez o primeiro estudo detalhado do
fenômeno, concomitantemente à fundação do modelo TP por Chomsky. Estudos mais
apurados, com questionamentos mais profundos e conjuntos de dados mais desafiadores
vieram de Lakoff (1970) e Jackendoff (1972), como parte de uma série de críticas ao
modelo TP como um todo. O que se segue é baseado nesses dois últimos trabalhos.
Os exemplos (18a) e (18b) não são sinônimos. Em (18a), muitas pessoas se
refere a um numeroso conjunto de pessoas, tal que cada uma leu poucos livros, não
estando especificados quais, nem se são ou não os mesmos para cada leitor. Em (18b),
poucos livros se refere a um pequeno conjunto de livros, tal que cada um foi lido por
muitas pessoas. Logo, todas as pessoas leram os mesmos livros da pequena coleção, o
77
que não é necessariamente verdadeiro em (18a). Em (19a), há um numeroso conjunto de
flechas, nenhuma das quais atingiu o alvo; mas isso não implica que o alvo não possa
ter sido atingido por (muitas) flechas de um outro conjunto. Em (19b), o alvo não foi
atingido por muitas flechas, mas apenas por poucas, ou por nenhuma. Apenas (19b)
pode ser sinônima de o alvo foi atingido por poucas flechas.
Klima (1964: 272) via isso como evidência de que transformações afetariam o
significado, opondo-se ao que defendiam Katz e Postal (1964), cuja visão de interface
sintaxe-semântica serviu de base para Chomsky (1965). Lakoff (1970) propôs que
sentenças ativas e passivas teriam EPs distintas, para muito além do elemento
[por+passiva] hipotetizado por Chomsky. Além de negação e quantificação, outros
fenômenos – e.g., foco e pressuposição – apresentavam desafios para a concepção de
gramática em (13), ao ponto de ela se revelar insustentável. Em suma, os interlocutores
mais críticos de Chomsky haviam demonstrado que a EP, tal como concebida por ele,
não poderia codificar em si todos os aspectos semânticos relevantes da sentença. A
partir das virtudes e problemas dessas contrapropostas, Chomsky (1970) reformula o
esquema em (13) nos termos de (20), que foi o primeiro esboço da TPE que começava a
surgir ali.
(20) léxico  regras de base  EP  transformações  ES  [representação

fonológica]
 
[representação semântica]
Parte substancial da evidência para isso veio do trabalho de Jackendoff (1972:

332-333), que apontou que, para além das sentenças passivas, as transformações de
movimento em geral alteram relações de escopo, como se observa em (21) e (22), cujas
interpretações correspondem a (23) e (24), respectivamente.
(21) [S [Muitas pessoas]x [SV leram [poucos livros]y ]]

(22) [S’ Foram [poucos livros]y que [S [muitas pessoas]x [SV leram ty ]]]
(23) Para muito x tal que x é pessoa, há pouco y tal que y é livro e x lê y.
(24) Para pouco y tal que y é livro, há muito x tal que x é pessoa e x lê y.
Os sintagmas mais próximos à margem inicial são também menos

profundamente encaixados na estrutura global, ocupando posições em que eles definem
78
o escopo interpretativo de tudo o que é mais profundamente encaixado. Assim, em (21)
os membros do conjunto de livros são definidos a partir dos membros do conjunto de
leitores. Em (22), ocorre o contrário.
Boa parte dessa reformulação se solidificou e se enriqueceu a partir de Chomsky
(1973), com a proposta de que toda ES cuja derivação envolve transformações de
movimento contém vestígios nos lugares em que os elementos movidos estavam em EP.
Vestígios são sintagmas foneticamente nulos decorrentes da remoção, via movimento,
de algum constituinte. A identidade categorial do vestígio é igual à do constituinte
movido e ambos os elementos compartilham um mesmo índice referencial, tal que um
‘aponta’ para o outro. Indica-se um vestígio pela notação t (do inglês trace = vestígio).
Desse modo, a ES acaba codificando em si aspectos relevantes da EP. Em (22), por
exemplo, o vestígio do sintagma movido (vinculado a ele por um índice) recupera
(graças exatamente à indexação) a informação contida na EP de que o sintagma movido
denota ‘a coisa lida’. No limite, pode-se até dispensar uma interface do componente
semântico com a EP, radicalizando mais ainda a arquitetura da gramática em (13),
deslocando a interpretação totalmente para a superfície, como veremos adiante.
Essa foi uma solução sintaticocêntrica de Chomsky para o desafio colocado por
Jackendoff (1972), acatando sua visão de que o componente semântico interpreta tanto a
EP como a ES e as traduz numa representação que codifica unificadamente a estrutura
argumental básica (i.e., noções como agente ou paciente) e relações de escopo, como as
que se alteram com a passivização (cf. 18-19) e a focalização (cf. 21-22) – isso se opõe
à visão de Lakoff e outros de que a sintaxe estaria de certo modo ‘subordinada’ à
semântica, tal que aquela deriva desta. Rumo ao final da fase TPE, Chomsky (1975)
levou um passo além a ideia da extração do significado a partir de níveis sintáticos mais
tardios, com a postulação de um terceiro nível de representação: a Forma Lógica (FL),
gerada a partir da ES, após a derivação se ‘bifurcar’ e a informação da ES ser mapeada
pelo componente fonológico, como no esquema em (25).
(25)
léxico  regras de base  EP  transformações  ES  transformações  FL

  
[representação fonológica] [representação semântica]
Para ilustrar esse ponto, consideremos o dado em (26) e suas interpretações em

(27).
79
(26) Todo homem ama uma mulher.
(27a) Para todo x tal que x é homem, é verdade que há um y tal que y é mulher, e x ama
y.
(27b) Há um y tal que y é mulher, e é verdade que, para todo x tal que x é homem, x
ama y.
A diferença crucial entre elas é que apenas em (27b) a mulher amada por cada
um de todos os homens é necessariamente a mesma. A obtenção dessas interpretações
em termos puramente sintáticos decorre de duas formas de se aplicar, entre EP e ES, a
transformação de alçamento de quantificador (cf. May, 1977) aos SNs quantificados: um
requerimento oriundo da própria natureza dos quantificadores, que só são interpretáveis
se houver variáveis ligadas a eles (i.e. os elementos abstratos x e y), sendo as variáveis
propriedades intrínsecas dos vestígios de movimento. Na FL da sintaxe, (27a) e (27b)
seriam como (28a) e (28b), respectivamente. Em ambos os casos, os dois SNs se movem
de dentro de S e se adjungem no topo da estrutura, diferindo na amplitude de escopo de
cada SN movido.
(28a)
(28b)
80
Essas estruturas não refletem diretamente a ordem de pronúncia dos vocábulos
(i.e., todo^homemâmaûma^mulher). Isso condiz com a ideia de que tais movimentos
ocorrem entre SS e LF, portanto, num estágio derivacional posterior ao ponto em que
estruturas sintáticas são representáveis no plano fonológico.
Da TPE à TRL (e além)
A tese de doutorado não publicada de May (1977) – orientada por Chomsky –

marca o início da visão de gramática em que ‘a semântica é toda feita pela própria
sintaxe’ (que viria a ser radicalizada a partir de Hornstein, 1984). Entretanto, a ideia de
FL, articulada como um nível de representação interno à gramática que codifica relações
de significado, remete a Chomsky (1975: 104-105), em suas reflexões em torno das
consequências e evidências da noção de vestígio (Chomsky, 1973), cujo objetivo foi
conferir uma implementação técnica mais adequada às noções de EP e ES propostas em
Chomsky (1965). Uma versão mais madura de May (1977) se consolidou como Logical
Form: its structure and derivation (May, 1985), uma das principais publicações que
definiram os cânones da TRL, a fase imediatamente subsequente da GGT. Nas análises
contemporâneas, construídas no âmbito do PM (Chomsky, 1995, et seq.), assume-se
quase consensualmente que não existe nem EP nem ES, sendo a FL o único nível de
estruturação sintática, logo o único capaz de codificar informação semanticamente
relevante. Isso que parece aos desavisados como uma revolução recente foi na verdade
uma longa evolução gestada majoritariamente na fase TP(E) da GGT, em que a interface
sintaxe-semântica foi gradativamente sendo ‘empurrada’ para níveis mais tardios da
derivação sintática.
Enfim, foi na fase TP(E) que nasceu uma parte significativa das ideias centrais do
modelo de Princípios e Parâmetros, primeiramente, fruto da busca de uma arquitetura de
gramática conceitualmente mais elegante, em que regras específicas se seguem de
princípios gerais; e, posteriormente, pela ampliação do alcance empírico da teoria e de
uma revisão substancial da contribuição de cada módulo da gramática no todo, o que
viria a culminar na concepção de gramática (radicalmente) modular da TRL, e no seu
81
enxugamento promovido no PM – temas dos dois capítulos que se seguem
imediatamente a este.
Referências
CHOMSKY, N. Morphophonemics of modern Hebrew. Dissertação de mestrado: University of

Pennsylvania, 1951.
______. The logical structure of linguistic theory. QUAL CIDADE? Harvard University, 1955.
______. Three models for the description of language. IRE Transactions on information theory, 2 (33),
pp. 113-124, 1956.
______. Syntactic structures. The Hague: Mouton, 1957.
______. Some methodological remarks on generative grammar. Word, 17, pp. 219-239, 1961.
______. Current issues in linguistic theory. The Hague: Mouton, 1964.
______. Aspects of the theory of syntax. Cambridge: The MIT Press, 1965.
______. Cartesian linguistics: a chapter in the history of rationalist thought. New York: Harper & Row,
1966.
______. Language and mind. New York: Harcourt Brace Janovich, 1968.
______. Deep structure, surface structure and semantic interpretation. In: JAKOBSON, R.; KAWAMOTO, S.
(eds.). Studies in general and oriental linguistics presented to Shiro Hattori on the occasion of his
sixtieth birthday. Tokyo: TEC Co. Ltd., 1970.
______. Problems of knowledge and freedom. New York: Pantheon, 1971.
______. Conditions on transformations. In:. ANDERSON, S.; KIPARSKI, P. (eds.). A festschrift for Morris
Halle. New York: Holt, Rinehart and Winston, pp. 232-286, 1973.
______. Reflections on language. New York: Pantheon, 1975.
______. Rules and representations. New York: Columbia University Press, 1980.
______. Lectures on government and binding. Dordrecht: Foris, 1981.
______. Knowledge of language: its nature, origin and use. New York: Praeger, 1981.
______. The minimalist program. Cambridge: The MIT Press, 1995.
______. New horizons in the study of language and mind. Cambridge: Cambridge University Press,
2000.
FRANK, R. Phrase structure composition and syntactic dependencies. Cambridge: The MIT Press, 2002.
HORNSTEIN, N. Logic as grammar. Cambridge: The MIT Press, 1984.
JACKENDOFF, R. Semantic interpretation in generative grammar. Cambridge: The MIT Press, 1972.
KATZ, J.; POSTAL, P. An integrated theory of linguistic descriptions. Cambridge: The MIT Press, 1964.
KLIMA, E. Negation in English. In: J. Fodor & J. Katz (eds.) Readings in the philosophy of language.
Englewood Cliffs: Prentice-Hall, pp. 246-323, 1964.
LAKOFF, G. Irregularity in syntax. New York: Holt, Rinehat and Winston, 1970.
LASNIK, H. Remarks on coreference. Linguistic analysis, 2: 1-22, 1976.
MAY, R. The Grammar of quantification. Tese (Doutorado) - MIT, 1977.
82
______. Logical form: its structure and derivation. Cambridge: The MIT Press, 1985.
PIATTELLI-PALMARINI, M. (ed.) Language and learning: the debate between Jean Piaget and Noam
Chomsky. Cambridge: The MIT Press, 1980.
RIZZI, L. The concept of explanatory adequacy. In: ROBERTS, I. (ed.) The Oxford handbook of Universal
Grammar. Oxford: Oxford University Press, pp. 97-113.
TEORIA DA REGÊNCIA E LIGAÇÃO E A PROPOSTA DE PRINCÍPIOS E

PARÂMETROS18
Maria Cristina Figueiredo Silva
Costuma-se datar o advento da Teoria de Regência e Ligação (doravante TRL)
com a publicação do livro Lectures on Government and Binding (LGB), lançado em 1981
pela Foris. Mas esse texto é fruto de uma conferência dada por Noam Chomsky no
83
GLOW de 1979 e de um workshop que teve lugar no mesmo evento, em Pisa, na Itália,
refinado posteriormente nos cursos dados no MIT em 1979-1980.
Todos sabemos que datações são artifícios didáticos. Usamos esse expediente
para precisar inícios e finais das diferentes correntes na história da arte, por exemplo;
mas é claro que as novas ideias são gestadas enquanto as antigas ainda estão vigorosas,
e é preciso alguma persistência para encontrar as raízes da mudança no meio do
entusiasmo dos achados teóricos que ainda estão brotando no seio do modelo que vai
mudar... Mas elas estão lá. Certos passos dados já na antessala da Teoria Padrão
Estendida (TPE) começam a sugerir os grandes saltos que serão realidade no espaço de
uma década. Por exemplo, em “Remarks on Nominalizations”, publicado em 1970,
Chomsky já anuncia uma versão mais tímida da Teoria X-barra (tímida porque num
primeiro momento só diz respeito às categorias lexicais), mas não resta dúvida de que a
Teoria X-barra constitui o primeiro passo para a gramática modular que será marca do
modelo instaurado em LGB, dez anos depois.
Além disso, a teoria esboçada em LGB também sofre ajustes consideráveis
durante os anos 1980, a começar por Some Concepts and Consequences of the
Government and Binding Theory, publicado em 1982, que faz exatamente o que seu
nome diz: explora as consequências do modelo desenhado no livro de 1981. É neste
texto que aparece o pronominal nulo pro, e também um argumento belíssimo em defesa
dessa teoria, que revela um fenômeno até então despercebido nos estudos
linguísticos: as lacunas parasitas – o poder heurístico da teoria aparece assim com toda a
sua força. Outros desdobramentos e novas belezas também estão nos livros de Chomsky
publicados durante a década de 1980, Knowledge of Language19 e Barriers, além de
muitos outros contributos de outros pesquisadores engajados no quadro gerativista.
Este capítulo não tem como objetivo primeiro fazer uma história precisa da
TRL, nem mesmo dar um panorama abrangente dela – há livros que fazem isso bastante
bem, como é o caso do já clássico Sintaxe gerativa do português: da teoria padrão à
teoria da regência e ligação, de Lúcia Lobato; antes, o que este texto quer fazer é
mostrar a beleza exuberante de um modelo capaz de mostrar fenômenos novos e
interligar velhos fatos, qualidades reconhecidas mesmo pelos inimigos mais ferozes da
teoria chomskyana. Assim, talvez o presente texto seja uma versão um tanto
romanceada dessa teoria, porque numa larga medida ignorará os detalhes técnicos das
discussões em benefício de explicitar as ideias guia do modelo, sua elegância e seu
poder de predição.
84
Por isso, o presente capítulo se organiza do seguinte modo: primeiramente,
discutiremos como o sistema de regras da TPE passou ao sistema de princípios (e
parâmetros) da TRL. A seguir, examinaremos com algum detalhe certas belezas
indiscutíveis do modelo: a noção de parâmetro, dando especial atenção ao Parâmetro do
Sujeito Nulo, uma das discussões centrais de LGB; a hipótese inacusativa, de Burzio
(1986); e a simetria (quase perfeita) entre movimento e ligação. Por fim, vamos pincelar
rapidamente uma questão que não parecia muito importante na passagem da TPE para a
TRL, mas que acabou se revelando importantíssima na passagem da TRL para o
Programa Minimalista (PM) e para alternativas ao PM: a discussão sobre a visão
representacional versus a visão derivacional da gramática.
Um alerta final: este capítulo supõe que seu leitor tenha o conhecimento básico
da TRL, isto é, o leitor deve conhecer seus módulos ou subteorias e o funcionamento
geral do modelo (veja os capítulos “Estruturas sintáticas e a reinvenção da teoria
linguística” e “Teoria Padrão e Teoria Padrão Estendida”, neste volume), um domínio
mínimo do conteúdo presente em qualquer um dos inúmeros manuais de sintaxe já
escritos para esta teoria – em português, o leitor pode consultar Mioto et al. (2013).
De um sistema de regras a um sistema de Princípios (que é modular)
A TP, mesmo na sua versão estendida, era uma teoria de regras. Eram elas que
estruturavam o modelo, por assim dizer, tanto no componente categorial quanto no
componente transformacional. Embora a adequação descritiva fosse o objetivo a ser
perseguido e tenha efetivamente sido alcançado nesse momento, o poder explanatório
das regras era limitadíssimo. Por exemplo, as regras do componente categorial podiam
se adequar a qualquer formato da sentença encontrada, mas podiam também ter a forma
de uma sentença nunca encontrada – dito de outro modo, não havia nada no formalismo
do modelo que impedisse a criação de regras que não correspondessem jamais a
qualquer construção das línguas humanas. Além disso, como se mostra com clareza já
em “Remarks”, não existe sintagma verbal sem um verbo em seu interior, nem sintagma
adjetival que não contenha um adjetivo. Acrescente-se ainda um problema interno à
teoria: há uma certa redundância nas informações fornecidas pelo léxico e pelo
componente categorial, pois já no léxico um verbo transitivo traria a informação de que
ele deve ser seguido por um sintagma nominal, digamos, informação essa que seria
85
novamente explicitada na regra de reescritura do sintagma verbal desse verbo.
Evidentemente, Chomsky e seus seguidores estavam completamente conscientes desses
problemas já naquele momento (cf. Chomsky e Lasnik, 1999 [1995]: 65).
Assim, o surgimento da Teoria X-barra, no início dos anos 1970, é talvez o
primeiro sinal de uma nova maneira de pensar a teoria da gramática: uma maneira mais
restritiva, em que o próprio formalismo já impede a construção de estruturas que não
estarão presentes em nenhuma língua. Essa é a primeira grande contribuição da Teoria
X-barra, supondo um formato único para todas as categorias (lexicais num primeiro
momento, se estendendo às categorias funcionais durante os anos 1980), que responde
por propriedades fundamentais das construções sintáticas humanas. O esquema básico
dessa teoria se vê em (1) – e pode ser lido do seguinte modo: um núcleo X pode se
combinar com um complemento, fornecendo uma categoria intermediária, X’ (leia-se
“X-barra”, que dá nome à teoria), que por sua vez pode se combinar com um
especificador, fornecendo a projeção máxima deste núcleo, o constituinte XP.
(1) a. XP
Spec X’
X Compl
Observe-se, contudo, que essa formulação é excessivamente forte, porque supõe

que todas as línguas organizam todos os seus constituintes da mesma forma, o que
evidentemente não é verdadeiro: quando comparamos o português com o japonês, por
exemplo, vemos que a ordem relativa do núcleo e seu complemento é espelhada nessas
línguas – no sintagma verbal, vemos que o português escolhe a ordem verbo-objeto,
mas o japonês escolhe a ordem objeto-verbo, como mostram os exemplos em (2),
adaptados de Mioto et al. (2013: 53):
(2) a. [VP a Maria comprar doce]

b. [VP Maria okashi kau]
Maria doce comprar
Começa a se construir assim a ideia de que há uma parte importante das línguas
humanas que é universal (os princípios, como a organização estrutural dos sintagmas
previsto no esquema X-barra), mas ali dentro mesmo há algo que é particular a cada
86
língua (os parâmetros, como essa diferença de ordem entre o núcleo e o seu
complemento, que podem variar, de língua para língua). Voltaremos a essa discussão na
próxima seção.
A mudança de concepção do que é o léxico revela um esforço na mesma
direção: na TPE, o léxico era um repositório de verbetes lexicais, que continha os traços
de subcategorização estrita e os traços selecionais dos itens, entre outras informações,
além de ser responsável pela inserção dos itens lexicais no marcador frasal. Contudo, os
traços de subcategorização serão deduzidos da estrutura argumental do item,
representada na Teoria X-barra. Por outro lado, as restrições selecionais vão adquirir um
caráter mais gramatical, agora representadas pelos papéis semânticos (ou papéis
temáticos) que esses itens exibem (quando exibem). Assim, o léxico fica sendo
responsável apenas pela especificação da categoria gramatical do item, pelos papéis
temáticos de seus argumentos e por informações idiossincráticas (fonológicas,
morfológicas, sintáticas e semânticas). Uma entrada lexical típica tem agora a forma de
(3) a seguir – extraída de Mioto et al. (2013: 130):
(3) Entrada lexical do verbo chutar

Chutar: categoria [-N, +V]
no. de argumentos [ __, __]
c-seleção [DP, DP]
s-seleção [Agente, Tema/Paciente]
Note que essa mudança clama por uma teoria específica de regulação da
distribuição dos papéis semânticos de um item lexical.
Onde talvez fique mais claro o esforço teórico no sentido de minimizar o
conjunto de artefatos teóricos disponíveis para a descrição gramatical é no componente
transformacional. As sucessivas simplificações deste componente a partir da metade dos
anos 1970 permitem que a TRL agora trabalhe com uma única regra transformacional:
Mova α (leia-se “mova-alpha”) – que pode bem se traduzir por: mova qualquer coisa
para qualquer lugar. Mas como, com uma regra de formulação tão irrestrita, será
possível obter os efeitos restritos que, bem ou mal, a existência de diferentes regras
garantia nos modelos anteriores?
87
A resposta está no conjunto de módulos que passa a constituir a TRL e que foi se
estruturando ao longo dos anos 1970, caminhando ao lado das simplificações nas
transformações. Assim, uma instanciação qualquer da operação Mova α passará pelo
crivo desses diversos módulos e, se não ferir nenhum deles, será gramatical. Quais
seriam esses módulos então? Num primeiro momento, a Teoria X-barra e a Teoria
Temática, a Teoria do Caso, a Teoria da Ligação, a Teoria da Regência, a Teoria das
Fronteiras e a Teoria do Controle.
Um exemplo é a tentativa de mover o objeto da sentença encaixada para uma
posição na sentença matriz, que fornece um resultado bizarro em (4a) – exemplo
adaptado de Lobato (1986: 411) – embora não se note qualquer efeito em (4b):
(4) a. * Maria parece João beijar t

b. Quem a Maria viu o João beijar t ?
No modelo padrão, a impossibilidade de (4a) era devida à Condição sobre o

sujeito especificado: como o movimento do objeto a Maria passava por sobre o sujeito
encaixado o João para ir ocupar a posição de sujeito matriz, a sentença era excluída por
essa condição sobre o movimento-A. Note-se que essa Condição não tinha nada a dizer
sobre o movimento A-barra, em que o objeto quem também passa por sobre o sujeito
encaixado o João (além do sujeito matriz a Maria). Na TRL, a agramaticalidade de (4a)
é devida à Teoria do Caso (já que João é um sintagma nominal com realização fonética
que está sem Caso abstrato) e também à Teoria da Ligação (pois o vestígio do
movimento, que se comporta como uma anáfora, está livre na sua categoria de regência,
a sentença encaixada, violando o Princípio A); por seu turno, (4b) não tem problemas
nem com a Teoria do Caso (todos os nominais têm Caso), nem com a Teoria da Ligação
(já que o vestígio do movimento se comporta aqui como uma variável, e estar livre é
exatamente o que esperaríamos).
Mova α é uma maneira de conceber a operação de movimento que é muito
diferente daquilo que se fazia antes. Quando o modelo trabalhava com uma série de
transformações distintas (a transformação passiva, a interrogativa, a relativa, ...), cabia a
cada uma delas especificar as condições em que poderia ou deveria ser realizada (para
não mencionar o problema adicional de decidir a ordem relativa delas!). Na TRL, as
diferentes construções sintáticas são agora vistas como epifenômenos. Na verdade, os
enunciados das línguas são agora vistos como especificações particulares dos
88
parâmetros – na formulação de Chomsky e Lasnik (1999: 65 [1995]), “não existem
construções como [...] oração interrogativa ou relativa [...]. Existem apenas princípios
gerais que entram em interacção para formar esses artefactos descritivos”.
Belezas indiscutíveis do modelo: A noção de parâmetro e o Parâmetro do Sujeito

Nulo20
Chomsky (1981) não é um livro que se leia de capa a contracapa. Ao contrário, é

um texto de consulta, digamos assim. E um dos temas mais consultados desse livro, pela
importância que tem na formulação mesma do modelo TRL, é o parâmetro PRO-drop,
como é conhecido o parâmetro do sujeito nulo desde então. E o tema é tão famoso
porque é talvez o melhor exemplo do grande salto que o modelo de TRL dá com respeito
à TPE do final dos anos 1970. A mudança mais espetacular é aquela que já
mencionamos: a substituição de um sistema de regras para tratar os fenômenos das
línguas por um sistema de princípios e parâmetros, de tal modo que uma parte
considerável das línguas seria fundamentalmente sempre a mesma – os princípios –
enquanto a outra parte seria variável dentro de limites bem estabelecidos – os
parâmetros, basicamente, um conjunto restrito de opções binárias abertas à escolha das
línguas em pontos específicos da gramática. A noção de parâmetro permite derivar um
conjunto de características visíveis nas línguas diretamente da fixação de um único
valor para uma propriedade formulada de maneira suficientemente abstrata.
O Parâmetro PRO-drop tem suas origens nos estudos de Permultter (1971),
possivelmente o primeiro a relacionar sistematicamente duas propriedades: a presença
de sujeitos nulos à possibilidade de extração do sujeito de uma oração encaixada que
exibe um complementizador – uma propriedade conhecida como that-t effect,
exemplificada em (5a); (5b) mostra que o português é imune a esse efeito:
(5) a. * Who do you think that t left?

b. Quem você acredita que saiu?
Taraldsen (1980) formula uma hipótese explicativa para a correlação

mencionada: só é possível extrair o sujeito wh encaixado se a língua exibir flexão “rica”
sobre o verbo, já que é ela a responsável pela vinculação da categoria vazia que ficará
na posição de sujeito quando da extração.
89
Também em Kayne (1980) se encontra uma generalização interessante: nota-se
que línguas que admitem sujeitos nulos admitem igualmente a inversão livre do sujeito,
ou seja, o sujeito pode aparecer à direita do verbo, resultando na ordem VS(O), embora
nessa mesma língua a ordem canônica seja SVO; por outro lado, línguas que não
admitem sujeitos nulos tampouco admitem essa ordem de palavras. O conjunto de
propriedades características das línguas então chamadas PRO-drop são apresentadas em
Chomsky (1981: 240):
(6) a. sujeito nulo;

b. inversão livre do sujeito em orações matrizes;
c. movimento WH- “longo” do sujeito;
d. pronome lembrete nulo em sentenças encaixadas;
f. violação aparente do filtro “that-t”.
Em LGB, era PRO a categoria vazia que ocupava a posição sujeito nas línguas de
sujeito nulo, o que exigia algum malabarismo teórico: se a Regra R (responsável por
explicar a presença das marcas morfológicas de flexão sobre o verbo) se aplicasse em
estrutura-S, a flexão não regeria a posição sujeito e PRO seria admitido nessa posição –é
o caso de línguas como o italiano ou o espanhol; por outro lado, se aplicada em forma
fonética, essa posição seria regida na sintaxe e, portanto, o Teorema de PRO21
determinaria a agramaticalidade do sujeito nulo – caso de línguas como o francês ou o

inglês.
A partir de Chomsky (1982), no entanto, com a sistematização do quadro das
categorias vazias incluindo um pronome nulo pro, é possível uma explicação mais
natural para as propriedades elencadas acima: a posição sujeito de línguas como o
italiano é regida pela flexão dita “rica”: este é agora o parâmetro pro-drop. Conserva-se
nesse novo quadro a intuição de LGB e de Rizzi (1982) de que é a inversão do sujeito a
propriedade determinante do parâmetro em questão. A formulação do parâmetro
enquanto tal, na sua versão clássica, está em Rizzi (1982): trata-se de uma propriedade
do núcleo flexional I (INFL na época), que pode ser [+pronominal] e, em sendo
[+pronominal], também pode ser [+referencial]. Será licenciado o sujeito nulo se a
língua possuir flexão [+pronominal] para reger pro em posição sujeito – presente tanto
no caso da omissão tout court do sujeito, quanto no caso da inversão do sujeito, assim
90
tornando possível a extração que, por hipótese, se dá sempre a partir da posição
invertida.
O Parâmetro do Sujeito Nulo é o sonho de parâmetro da TRL: de uma única
propriedade abstrata alojada em um núcleo funcional, uma série de construções
aparentemente não relacionadas vem à tona como um feixe, todas presentes ou todas
ausentes numa dada língua. O fato de haver reflexo dessa propriedade abstrata na
morfologia visível de flexão da língua permite uma abordagem simples e direta do
problema da aquisição de linguagem, até então de difícil formulação: a aquisição da
linguagem é o processo pelo qual os valores dos diferentes parâmetros são fixados pela
criança com base em dados acessíveis a elas na fala adulta ao seu redor. À parte todas as
questões que se colocam para uma tal abordagem (por que a fixação não é imediata?
Qual é exatamente o dado que desencadeia a fixação?), não há dúvida de que a TRL
abriu um campo de pesquisa inédito, com uma hipótese explicativa do que é comum às
línguas e do que varia, uma hipótese que ultrapassaria mesmo a formulação da TRL e
passaria a ser um modo mais geral de entender o funcionamento da linguagem – a
Teoria de Princípios e Parâmetros.
É preciso dizer que a pesquisa durante os anos 1980 foi mostrando que, tal como
formulado, o Parâmetro do Sujeito Nulo não poderia dar conta de todos os casos de
sujeito nulo encontrados nas línguas do mundo. Em particular, ficou claro que havia
sujeitos nulos que são eram casos de pronominais nulos (como Topic-drop no alemão,
cf. Cardinaletti, 1990). Por outro lado, notou-se a existência de pronominais nulos em
posições sem qualquer relação direta com a flexão verbal, como o caso do objeto nulo
do português brasileiro (PB). Rizzi (1986 [esta data não consta nas Referências])
apresenta um refinamento da teoria de pro para contemplar argumentos nulos de um
modo geral, o que significa tratar pro como todas as outras categorias vazias: é preciso
primeiramente licenciar sua presença na estrutura, e então garantir-lhe a interpretação
adequada.
Nessa nova visão, o que é parametrizável é o conjunto de licenciadores de pro
(isto é, o núcleo que lhe atribui Caso): a flexão pode ser o licenciador numa dada língua,
o verbo pode sê-lo em outra etc. A identificação de pro é uma questão independente:
pro herdará os valores dos traços-phi do seu núcleo licenciador; se o núcleo em questão
não tiver traços-phi, a interpretação de pro será default, que em muitos casos é a
interpretação arbitrária (como no caso do objeto nulo do italiano ou do sujeito nulo em
línguas de pro-drop parcial, como o PB) ou a interpretação referencial inanimada (como
91
no caso do objeto nulo do PB). Assim, o Parâmetro do Sujeito Nulo ao final dos anos
1980 recebe uma formulação bastante diferente da original, agora visto como um
subcaso de uma teoria de argumentos nulos.
Esse parâmetro (e a ideia de parâmetros de modo geral) recebeu críticas variadas
de muitos pesquisadores, em particular porque certas correlações entre as propriedades
elencadas não se sustentam quando são examinadas línguas de famílias variadas (cf.,
por exemplo, Gilligan, 1987, citado por Roberts e Holmberg, 2010, que faz o
levantamento dessas propriedades em mais de cem línguas). Contudo, como bem
observam Roberts e Holmberg (2010), deve-se ter cuidado na análise desses resultados
porque é preciso controlar mais da sintaxe das línguas do que simplesmente as
propriedades individuais elencadas, já que outros fatores podem estar interferindo na
presença ou ausência de alguma propriedade. Observam ainda os mesmos autores que
abandonar a noção de parâmetro e retornar à noção de regra para explicar a variação
entre as línguas nos coloca novamente no estágio da adequação descritiva, em que
resolvemos problemas particulares dessa ou daquela língua, mas não fazemos qualquer
predição sobre a coocorrência de propriedades, que é o estágio da adequação explicativa
a que a ideia de parâmetro nos permitiu adentrar. E o fato mesmo de existirem algumas
propriedades que se correlacionam na formulação do Parâmetro do Sujeito Nulo mostra
que essa abordagem está no caminho certo, embora o caminho possa ser mais longo do
que inicialmente se pensava...
Belezas indiscutíveis do modelo: A hipótese inacusativa
A hipótese inacusativa23 tem suas raízes no trabalho de Perlmutter (1971) e,

portanto, fora dos quadros da TRL; contudo, a formulação mais bem acabada dessa
intuição aparece no trabalho de Burzio (1986). E, ainda que a ideia de base seja muito
simples, seus desdobramentos são espetaculares, em particular porque ela se combina
dentro do modelo com uma série de outras hipóteses, fazendo uso pleno do aspecto
modular da Teoria.
O formato da Teoria X-barra permite que, se um verbo tem um único argumento,
ele tanto pode ser o argumento externo – o AE (e ocupar a posição de especificador da
projeção verbal como em (7a)) – quanto o argumento interno – o AI (ocupando a
posição de complemento do núcleo verbal, como vemos em (7b)):
92
(7) a. VP b. VP
Spec V’ V’
V V Compl
Nessa perspectiva, os verbos ditos intransitivos (na terminologia tradicional) não

formam mais uma classe única e uniforme, mas compõem duas classes absolutamente
distintas: a dos verbos inergativos, exemplificada por trabalhar ou telefonar em
português, que se caracteriza por ter como único argumento o AE (o que quer dizer que
este único argumento se comporta como os sujeitos dos verbos transitivos); e a classe
dos verbos inacusativos, exemplificada por chegar ou crescer em português, que exibe
um único AI (o que significa que seu comportamento se assemelha ao dos objetos dos
verbos transitivos).
A análise de uma construção do português basta para mostrar a pertinência dessa
hipótese, mesmo em línguas sem marcas morfológicas visíveis de inacusatividade;
tomemos as sentenças em (8) – adaptadas de Mioto e Figueiredo Silva (2007: 258):
(8) a. Acabada a limpeza, a Maria foi embora.

b. *Acabada a Maria, a limpeza foi paga.
c. Chegada a hora, todos foram embora.
d. *Telefonada a Maria, João foi embora.
Notemos primeiramente que a construção de particípio absoluto é bem formada

com um verbo transitivo, como acabar em (8a), e que o sintagma com o qual o
particípio concorda é o complemento do verbo. Tentar colocar o AE na construção torna
a sentença agramatical, como vemos em (8b). Observemos agora que a sentença (8c),
construída com o particípio de chegar, é perfeita, mas (8d), que exibe o particípio de
telefonar, é agramatical. Esses fatos se explicam imediatamente se chegar tiver um
único AI, mas telefonar tiver apenas um AE, já que apenas verbos que possuem AIs
podem figurar em uma construção como a de particípio absoluto.

Evidências mais contundentes para a hipótese inacusativa, no entanto, são
visíveis em uma língua como o italiano, pois há pelo menos duas diferenças sintáticas
indiscutíveis para a separação dessas duas classes no seio dos verbos monoargumentais:
uma diz respeito à seleção do auxiliar para formar o pretérito perfeito (que é um tempo
composto nessa língua) e a outra concerne a distribuição do pronome partitivo ne.
93
Em italiano, o passado composto de verbos transitivos se faz com o auxiliar
avere (haver), como se vê em (9a), enquanto a voz passiva faz uso do verbo essere (ser),
como mostrado em (9b). Contudo, o passado composto dos verbos ditos intransitivos se
organiza em dois grupos: um usa o auxiliar essere, como em (9c), e outro usa o auxiliar
avere, como em (9d) – inverter essa seleção leva as sentenças à agramaticalidade:
(9) a. Mario ha bacciato Anna

Mário tem beijado Ana
‘Mário beijou Ana”
b. Anna sarà bacciata da Mario
Ana será beijada por Mário
c. Anna è arrivata.
Ana é chegada
‘Ana chegou’
d. Mario ha lavorato.
Mário tem trabalhado
‘Mário trabalhou’
A tirar pelo que indicam esses exemplos, o movimento do AI nessa língua parece
exigir o auxiliar essere, sendo a construção ativa ou passiva, enquanto o movimento do
AE do verbo sempre exige o auxiliar avere.
A distribuição do pronome partitivo ne do italiano revela uma assimetria de
distribuição que vai na mesma direção: ne, traduzível grosseiramente por
dele(s)/dela(s), pode pronominalizar o objeto direto de um verbo transitivo, mas não seu
objeto indireto, como se vê no contraste entre (10b) e (10d); crucialmente, a
pronominalização com ne não pode se fazer sobre o AE– o sujeito – do verbo transitivo,
mesmo quando o sujeito aparece ao lado direto do verbo, como mostra a
impossibilidade de (10f) e (10g) – exemplos adaptados de Mioto e Figueiredo Silva
(2007: 261-2):
(10) a. Mario inviterà [molte ragazze]

Mario convidará muitas meninas
b. (Di ragazze) Mario ne inviterà [molte _]
(De meninas) Mario delas convidará muitas _
94
‘Meninas, o Mário convidará muitas (delas)’
c. Mario ha parlato [a [molte ragazze]]
Mario tem falado a muitas meninas
‘Mario falou com muitas meninas’
d. *(Di ragazze) Mario ne ha parlato [a [molte _]]
(Di meninas) Mario delas tem falado a muitas _
e. [Tante ragazze] hanno invitato Mario
Muitas meninas têm convidado Mario
‘Muitas meninas convidaram o Mário’
f. *(Di ragazze) [tante _] ne hanno invitato Mario
(De meninas) muitas delas têm convidado Mario
g. *(Di ragazze) ne hanno invitato Gianni [tante _]
(De meninas) delas têm convidado Gianni muitas
Novamente, se a pronominalização por ne pode se fazer apenas da posição do AI

nominal do verbo, a hipótese inacusativa prevê que seja possível o uso desse expediente
sintático com os verbos inacusativos, mas não com inergativos. E isso se confirma,
como se vê no contraste entre (11) e (12) – exemplos extraídos de Mioto e Figueiredo
Silva (2007: 262-3):
(11) a. Tanti ragazzi sono arrivati

Muitos meninos são chegados
‘Muitos meninos chegaram’
b. Sono arrivati tanti ragazzi
São chegados muitos meninos
‘Chegaram muitos meninos’
c. Ne sono arrivati tanti
Deles são chegados muitos
‘Muitos deles chegaram’
(12) a. Tanti ragazzi hanno lavorato

Muitos meninos têm trabalhado
‘Muitos meninos trabalharam’
b. Hanno lavorato tanti ragazzi
95
Têm trabalhado muitos meninos
c. *Ne hanno lavorato tanti
Deles têm trabalhado muitos
Como bem notam os autores, admitir a existência de verbos que possuem apenas
o AI demanda uma revisão profunda na classificação tradicional dos verbos, em
particular porque o tipo categorial do complemento não precisa ser sempre nominal,
como nos exemplos examinados acima; assim, não é apenas a classe dos verbos
intransitivos que vê parte de seus membros migrarem para uma nova classe, mas
também os ditos verbos de ligação e os auxiliares são membros dessa nova classe, a
classe dos inacusativos. Esse é um dos resultados mais interessantes dessa hipótese,
com efeitos disseminados por toda a análise gramatical dentro dos quadros da TRL.
E o nome escolhido para essa classe tem uma razão interna à Teoria: esses
verbos, embora possam selecionar um AI nominal, não tem Caso Acusativo (abstrato)
para fornecer a ele (uma exigência do módulo da Teoria do Caso24), o que implica o seu
movimento para uma posição onde possa receber algum outro Caso – a posição de
sujeito da sentença, onde recebe o Caso Nominativo (a partir do núcleo I). Daqui resulta
uma generalização surpreendente, conhecida como Generalização de Burzio, formulada
originalmente como uma condição bidirecional vinculando a atribuição de Caso para o
AI à seleção de um AE: só tem Acusativo para atribuir ao AI o verbo que seleciona um
AE. Independentemente da correção desta formulação bicondicional, o fato mesmo de se
apresentar uma ligação não trivial entre interpretação de um argumento e o
licenciamento sintático de outro já é um resultado espetacular, não imaginado por
versões anteriores deste ou de outros modelos sintáticos com este grau de precisão em
suas predições.
Belezas indiscutíveis do modelo: a simetria (quase perfeita) entre movimento e

ligação
Durante os anos 1970, Chomsky trabalhou firmemente para estabelecer

condições que limitariam o poder das transformações bloqueando o deslocamento em
circunstâncias precisas; desse esforço resultaram a Condição sobre o Sujeito
Especificado e a Condição sobre a Sentença com Tempo, entre outras. Contudo, à
medida que o trabalho progrediu, ficou claro que essas condições tinham ação mais
96
ampla do que a pensada originalmente, bloqueando igualmente a relação entre uma
anáfora e seu antecedente, por exemplo, uma relação que não se faz por movimento.
A percepção da época, segundo Lobato (1986: 357), é a de que existe um
paralelismo formal entre, de um lado, a relação que se estabelece entre o vestígio e o
elemento movido, e, de outro, entre o reflexivo ou o recíproco (e também PRO) e seu
antecedente. A noção de c-comando, proposta por Reinhart (1976), é a relação que
subjaz a todas essas estruturas (quando são bem formadas) e pode ser formulada como
se segue – definição clássica traduzida por Lobato (1986: 358):
(13) C-comando: α c-comanda β se e somente se:

(i) nem α nem β dominam um ao outro;
(ii) a primeira categoria ramificante dominando α domina β.
O entendimento construído na época é que os anafóricos (recíprocos, reflexivos

e PRO de controle obrigatório) sempre são c-comandados pelos seus antecedentes (os
sintagmas nominais que lhes conferem seu valor referencial), do mesmo modo que os
vestígios sempre são c-comandados pelo sintagma deslocado, tanto no caso do
deslocamento de NP, quanto no caso do deslocamento WH, como mostram os exemplos
em (14) a seguir, onde os índices nos dois primeiros exemplos indicam os antecedentes
do recíproco e de PRO e nos dois últimos, indicam a categoria movida:
(14) a. [Os meninos]i feriram [um ao outro i

b. [O Pedro]i tentou [PRO sair]i
c. [O Pedro]i parece [ti gostar da Maria]
d. [Quem]i o Pedro pensa que a Maria convidou ti ?
Observe que é fundamental para que essa generalização possa ser formulada que
todo movimento deixe um vestígio no lugar de origem do sintagma, uma ideia que se
consolidou durante os anos 1970.
Na TRL essa compreensão se refina, porque a Teoria da Ligação, que impõe
domínios de localidade nos quais certas relações devem, podem ou não podem se
estabelecer, agora trabalha com uma tipologia de sintagmas nominais lexicalmente
realizados, definidos pelos traços [+/- anafórico] e [+/- pronominal], que também é
97
usada para determinar uma tipologia dos elementos nominais nulos, como se vê adiante
em (15) – adaptada de Mioto et al. (2013: 233):
(15) Propriedades Sintagmas nominais plenos Categorias vazias

[+ anafórico, - pronominal] Anáforas Vestígio (t)
[- anafórico, + pronominal] Pronomes pro
[- anafórico, - pronominal] Expressões-R Variável (vbl)
[+ anafórico, + pronominal] * PRO
De interesse particular para a nossa discussão aqui são as categorias vazias que
exibem o traço [-pronominal], que são aquelas geradas por movimento: o vestígio
responde tanto pelo movimento de núcleo quanto pelo movimento-A, enquanto a
variável responde pelo movimento A-barra. E é possível mostrar que tanto o movimento
de núcleos quanto o movimento-A (aquele que vemos nas passivas ou nas construções
de alçamento) devem respeitar o Princípio A da Teoria da Ligação, enquanto o
movimento A-barra (exemplificado pelas construções interrogativas) está sujeito ao
Princípio C.
Evidentemente, o movimento deve respeitar princípios adicionais, como a
Subjacência25 ou o Princípio das Categorias Vazias (ou ECP),26 introduzindo aqui
alguma assimetria na relação entre movimento e ligação. E é natural que assim seja: as
categorias vazias devem ter o seu conteúdo recuperado de alguma forma; espera-se que
as condições (de legitimação formal e de interpretabilidade plena) que pesam sobre elas
sejam mais rígidas, como parece ser o caso – enquanto a teoria da ligação trabalha com
a noção de regência, que aparece, por exemplo, na definição de categoria de regência, o
ECP trabalha com a noção de regência apropriada, bem mais estrita. Contudo, essa
diferença irreconciliável entre movimento e ligação não tira a beleza da intuição inicial.
E finalmente chegamos ao nome do modelo: Teoria de Regência e Ligação. A
razão pela qual a teoria da ligação integra crucialmente este modelo é mais clara: a
discussão sobre anáforas e o Princípio A fazem parte de todo o desenvolvimento do
quadro nos anos 1970, como o capítulo precedente mostra com maestria. A razão pela
qual a noção de regência é crucial fica mais clara agora, quando vemos que é ela que
98
amarra os diversos módulos da gramática. Uma definição relativamente não controversa
da noção aparece em (16) a seguir – extraída de Mioto et al. (2013: 250):
(16) Regência: α rege β se e somente se:

(i) α = X0 (ou seja, α é um núcleo lexical N, V, P, A ou é o núcleo funcional I;
(ii) α m-comanda β e β não está protegido de α por uma barreira.
Os Casos são atribuídos sob regência; a Teoria da Ligação faz uso crucial dessa a
noção para a definição de categoria de regência; o ECP usa a noção mais estrita de
regência apropriada; PRO não pode ser regido. Assim, o conceito é pervasivo neste
modelo e por isso mesmo não é demais que a noção já conste no nome do modelo.
À guisa de conclusão: a visão representacional versus a visão derivacional
Durante boa parte do desenvolvimento da teoria gerativo-transformacional, as

visões derivacional e representacional dos processos sintáticos eram, por assim dizer,
intercambiáveis, no sentido de que sempre seria possível traduzir uma explicação
derivacional em uma explicação representacional e vice-versa.
A título de ilustração, tomemos a identificação de uma categoria vazia. Como
nota Lobato (1986: 479), a visão derivacional exige que examinemos a passagem da
estrutura-D para a estrutura-S para determinar se a categoria vazia foi ou não gerada por
movimento; em caso afirmativo, é preciso ainda ver qual é a posição para onde o
sintagma foi movido – se para uma posição A, trata-se de um vestígio; se para uma
posição A-barra, trata-se de uma variável. Por outro lado, é perfeitamente possível
também determinar o estatuto de uma categoria vazia olhando simplesmente para a
posição em que ela se encontra num dado nível de representação, procurando
determinar se essa é uma posição que recebe Caso abstrato e papel temático, se se trata
de uma posição regida etc. Em qualquer dos casos, contudo, parece claro que a TRL
precisa de princípios que amarrem os módulos e os níveis de representação entre si.

Esse é um dos papéis que o Princípio de Projeção27 cumpre, por exemplo; sem essa
garantia de relacionamento adequado entre os níveis de representação, nem mesmo a
visão derivacional poderia prosperar com algum sucesso.
Por outro lado, mais para o final dos anos 1980 foi se formando um
entendimento de que talvez essas duas visões não fossem completamente sinônimas ou
99
imediatamente traduzíveis uma na outra. Por exemplo, Chomsky e Lasnik (1999: 87), a
um certo ponto da sua discussão sobre categorias vazias, argumentam que uma tal
categoria, que só possua traços categoriais (NP, V, ...) mas não traços-phi, não seria
interpretável e, portanto, ela poderia aparecer na derivação apenas com o estatuto de
uma posição a ser preenchida ou então ela deveria ser eliminada da representação final
em LF – é de particular interesse aqui o tratamento a ser dado aos expletivos como there
do inglês.
Numa teoria que prevê diferentes níveis de representação, não é um problema
pensar que um certo conjunto de propriedades pode ser averiguado em um nível e que
outro conjunto de propriedades seja satisfeito em um nível diferente. Contudo, à medida
que os níveis de representação começam a ser percebidos como supérfluos, a questão de
averiguar propriedades neste ou naquele nível também deve ser revista e, nesse caso,
uma abordagem derivacional, na qual as propriedades são averiguadas durante a
derivação mesma, começa a ser adotada como claramente superior. Mas aí já estamos
entrando em uma nova fase do modelo, que será tratada em um outro capítulo (veja “O
Programa Minimalista”, neste volume)...
Referências
BURZIO, L. Italian Syntax. Amsterdam: Kluwer Academic Publishers, 1986.

CARDINALETTI, A. Subject/Object Asymmetries in German Null-Topic Constructions and the Status of
SpecCP. In: MASCARÓ, J.; NESPOR, M. (eds.). Grammar in Progress. Dordrecht: Foris, 1990, pp. 75-
84.
CHOMSKY, N. Lectures on Government and Binding. Dordrecht: Foris, 1981.
______. Some Concepts and Consequences of the Theory of Government and Binding. Cambridge, Mass.:
MIT Press, 1982.
______. Knowledge of Language: its nature, origin and use. New York: Praeger, 1986a.
______. Barriers. Cambridge, Mass.: MIT Press, 1986b.
______; LASNIK, H. A Teoria dos Princípios e Parâmetros. In: CHOMSKY, N. O Programa Minimalista.
Trad., apresentação e notas à tradução de Eduardo Raposo. Lisboa: Caminho, 1999 [1995].
FIGUEIREDO SILVA, M. C. O estado da arte dos estudos sobre posições de sujeito, sujeitos nulos e
concordância morfológica. Revista LinguíStica, número especial, 2017. Disponível em
<https://revistas.ufrj.br/index.php/rl/article/view/13510>. Acesso em ??????.
GILLIGAN, G. A cross linguistic approach to the pro-drop parameter. PhD dissertation: University of
Southern California, 1987.
KAYNE, R. Extensions of Binding and Case-Marking. Linguistic Inquiry 11, pp. 75-96, 1980.
100
LOBATO, L. Sintaxe gerativa do português: da Teoria Padrão à Teoria da Regência e Ligação. Belo
Horizonte: Vigília, 1986.
MIOTO, C.; FIGUEIREDO SILVA, M. C. Uma contribuição para a aquisição de segunda língua: auxiliares e
pronomes partitivos em italiano e francês. DELTA vol. 23, especial, pp. 243-281, 2007.
_____; _____; LOPES, R. Novo Manual de Sintaxe. São Paulo: Contexto, 2013.
PERLMUTTER, D. Deep and surface constraints in syntax. New York: Holt, Rinehart and Winston, 1971.
REINHART. T. The Syntactic Domain of Anaphora. Tese de doutorado. Cambridge, Mass.: MIT, 1976.
RIZZI, L. Issues in Italian Syntax. Dordrecht: Foris, 1982.
ROBERTS, I.; HOLMBERG, A. Introduction: Parameters in Minimalist Theory. In: BIBERAUER, T. et al.
(eds). Parametric Variation: Null subjects in Minimalist Theory. Cambridge: Cambridge University
Press, 2010, pp. 1-57.
TARALDSEN, K. T. On the Nominative Island Constraint, Vacuous Application and the That-Trace Filter.
Indiana University Linguistics Circle. Bloomington: Indiana, 1980.
O PROGRAMA MINIMALISTA
Danniel Carvalho
O Programa Minimalista (PM) pode ser caracterizado a partir de uma série de

perspectivas que lhe conferem um caráter interdisciplinar interessante e potencialmente
abrangente. Pode ser considerado simplesmente como uma abordagem linguística
envolvendo uma revisão substancial de muitas das suposições técnicas e propostas
101
teóricas que foram desenvolvidas dentro do paradigma chomskyano antes do início dos
anos 1990. Também pode ser visto como uma extensão e reconstrução da abordagem
biolinguística da linguagem, que foi iniciada por Chomsky (1955, 1965) e Lenneberg
(1967): uma abordagem que vê língua como uma capacidade biológica cujas origens
decorrem da evolução. Além disso, a partir de perspectivas ontológicas e
metodológicas, o PM adota uma abordagem “naturalista” da linguagem como um “órgão
mental” do cérebro, uma abordagem baseada na suposição de que a mente é parte do
mundo natural e, como tal, deveria ser estudada da mesma maneira que qualquer outro
aspecto da natureza (Chomsky, 2000a). Essas perspectivas estão intimamente
relacionadas na medida em que a revisão substancial das hipóteses e teorias pré-
minimalistas28 são comprometidas com o objetivo de alcançar uma explicação baseada
em princípios de fenômenos linguísticos, uma explicação que se destina a ir além da
esfera de influência da dotação genética para princípios gerais que se relacionam não
apenas com a linguagem, mas com a cognição em geral ou com o mundo natural como
um todo. O critério para essa explicação é definido pela tese central do PM, a chamada
Tese Minimalista Forte (TMF), que sugere que a linguagem humana é “bem projetada”
para satisfazer certas condições de legibilidade para sua interação com outros sistemas
cognitivos (cf. Chomsky, 2001: 2).
Uma das principais características do PM é a especulação de que a faculdade da
linguagem (FL) é simples, opera com base em capacidades que são amplamente
identificáveis em outros aspectos da cognição humana e até em outras espécies, e (em
grande parte) não é determinada por aspectos exclusivos do genoma humano (cf.
Pennisi e Falzone, 2016). Essa ênfase é vista por muitos como um afastamento
considerável da visão pré-minimalista sobre a natureza da linguagem, cuja posição
prevalecente era a da linguagem como um sistema complexo, substancialmente
determinado pela dotação genética e fundamentalmente autônomo de outros domínios
cognitivos. Essa mudança para o minimalismo, entretanto, não é tão dramática quanto
alguns acreditam que seja (cf. Pinker e Jackendoff, 2005).
Grosso modo, a versão pré-minimalista da FL caracterizava-se como (i) inata, (ii)
rica ou complexa, (iii) geneticamente determinada, (iv) cognitivamente autônoma e (v)
específica da espécie humana. A presente discussão lida com esses cinco atributos e
procura identificar seu lugar no contexto do PM. Ainda, o trabalho busca questionar o
lugar da Gramática Universal (GU) nas diferentes leituras da TMF. A seção a seguir
revisa sucintamente as principais modificações sofridas pela empreitada gerativista em
102
sua passagem do modelo de Regência e Ligação para o PM, além de fazer uma breve
discussão sobre as principais operações envolvidas na computação da linguagem no
modelo minimalista, a fim de apresentar as bases técnicas do modelo que são essenciais
para nossa discussão.29
A arquitetura da linguagem: do modelo Regência e Ligação ao Programa

Minimalista
Como discutido no capítulo “Teoria Padrão e Teoria Padrão Estendida” deste

volume, a Teoria de Regência e Ligação (TRL) assume que a arquitetura da linguagem é
composta por um léxico e quatro níveis de representação sintática. O léxico fornece os
blocos de construção para a estrutura da sentença, sendo o repositório de itens e traços
lexicais. Os quatro sintáticos os níveis são: (i) estrutura-D, (ii) estrutura-S, (iii) forma
lógica (LF) e (iv) forma fonética (PF). Os dois primeiros níveis são internos ao sistema
computacional. O sistema é regulado por vários princípios e módulos, incluindo o
Princípio da Projeção, Teoria do Caso, Teoria-θ, Teoria X-barra etc.
A partir de uma perspectiva minimalista, tendo em mente que a faculdade da
linguagem interage com (pelo menos) dois sistemas cognitivos (cf. Figura 1), os únicos
níveis necessários são aqueles envolvidos nessas interações, a saber: PF e LF. Por outro
lado, não se pode ter a mesma justificativa para a estrutura-D e a estrutura-S. Esses
níveis de representação são artifícios teóricos e podem ser dispensáveis em princípio.
Agora, já que os níveis de representação são amplamente definidos em termos dos
princípios que os sustentam, há claramente mais em jogo na arquitetura minimalista da
linguagem do que apenas uma redução do número de níveis postulados. Isso indica que
o programa minimalista está comprometido com a eliminação desses dois níveis sem
perda de cobertura empírica ou poder explicativo. Como observa Hornstein (1995: 63),
este compromisso envolve uma realocação de explicações enquadradas em termos de
pelo menos alguns dos princípios da TRL da estrutura-D e da estrutura-S para os dois
níveis restantes (ou seja, PF e LF). Um exemplo é a Teoria de Ligação, que se aplica
apenas a estrutura-S em algumas variantes da TRL (cf. Chomsky, 1982). Com a
estrutura-S eliminada do sistema, Chomsky (1995a) procurou mostrar que alguns dos
fenômenos explicados pela Teoria de Ligação podem ser compreendido por condições
de LF.
103
Como será visto mais diante, as explanantia do minimalismo incluem condições
de interface e computação ótima. Supondo que essas condições esgotam o repertório
explicativo do minimalista, Chomsky (2000b: 112-13) propõe que a FL “não fornece
maquinaria além do necessário para satisfazer requisitos mínimos de legibilidade e
funciona da maneira mais simples possível”. Em outras palavras, todas as condições no
sistema de linguagem são condições orientadas para alcançar a otimização pretendida.
Se generalizarmos as condições de legibilidade, podemos esperar que o sistema
computacional da linguagem opere apenas com itens lexicais cujas características são
legíveis nas interfaces, ou seja, podemos antecipar que a condição de interpretabilidade
sugerida por Chomsky (2000b: 113) será satisfeita.
Supondo que as representações de interface são funções determinadas dos itens
lexicais dos quais elas derivam, é possível sugerir uma outra condição, a condição de
inclusividade, que requer que nenhum novo traço seja introduzido em uma computação
já iniciada, mapeando um conjunto de seleções lexicais para essas representações. As
consequências desta última condição para a TRL são consideráveis: por exemplo,
envolve a eliminação da Teoria X-barra com todas as suas referências a categorias
frasais e níveis barras (Chomsky, 2000b: 114).
Dadas as suposições acima sobre o desenho da linguagem, e em contraste com o
modelo de gramática da TRL, PM assume o modelo na Figura 1, em que a operação do
sistema computacional é governada por princípios como interpretabilidade (na medida
em que pode ser mantida) e inclusividade:
Figura 1: Níveis de representação sintática e os sistemas interpretativos
LÉXICO
NUMERAÇÃO (N): N = {(n, l)}
SISTEMA COMPUTACIONAL (CHL) {MERGE, MOVE, AGREE}
104
Spell-Out
Forma Fonética Forma Lógica

(Interface sensório-motora) (Interface conceitual-intencional)
O léxico é considerado um componente indispensável da FL. Ele fornece os

elementos mais atômicos da computação: traços.32 Esses traços são representações
sensoriais (traços fonológicos) e conceituais (traços semânticos) e formam os itens
lexicais constituídos a partir deles. Esses traços podem ser interpretáveis ou não
interpretáveis nas interfaces (condição de interpretabilidade). As características
interpretáveis compreendem dois conjuntos óbvios, características fonéticas e
semânticas que são legíveis nas interfaces sensório-motora e conceitual-intencional,
respectivamente. Alguns traços formais, sintáticos, podem também ser interpretáveis,
mas são majoritariamente não interpretáveis, ou seja, são ilegíveis em qualquer uma das
interfaces, mas são necessários para realizar operações computacionais. Um exemplo do
primeiro caso são os traços de concordância, ou traços-ϕ (pessoa, número e gênero)33
de nominais, sendo os mesmos traços de elementos verbais consideradas como não
interpretáveis.
A literatura diverge quanto a forma como os itens lexicais deixam o léxico e
entram no sistema computacional da linguagem humana (CHL), mas é suficiente para o
propósito deste trabalho assumir que o CHL tem acesso ao léxico através de uma série de
escolhas lexicais ou uma numeração (N): N = {(n, l)}, em que l é um item lexical e n é
um número inteiro indicando o número de instâncias de l que foram selecionadas do
léxico. Assim, dada uma numeração N de itens lexicais (LIs), o sistema computacional
CHL mapeia N para um par que compreende uma forma fonética e uma forma lógica,
cada uma legível na interface apropriada resultando em derivações convergentes.
O sistema computacional contém algumas operações que serão consideradas
brevemente a seguir. Aqui ainda se faz necessário mencionar a operação Spell-Out, que
deve se aplicar em algum lugar na computação e ter o efeito de secionar efetivamente os
traços naqueles que são interpretáveis nas duas interfaces. Spell-Out é frequentemente
descrito como uma operação que remove traços foneticamente interpretáveis, deixando
105
os traços semanticamente interpretáveis (incluindo aquelas que são formais) para a
interface LF.
As operações computacionais
Não há consenso na literatura gerativista sobre o número de operações

indispensáveis para CHL. Serão consideradas aqui três operações computacionais:
Merge, Move e Agree. De uma perspectiva minimalista, o status ontológico do Merge é
justificado apenas por fundamentos conceituais. Assim, uma vez que é indispensável em
qualquer sistema semelhante à linguagem, Merge “vem de graça” (Chomsky 2008, p.
137). Merge combina dois objetos sintáticos α e β para formar um objeto sintático
complexo K. Isso é ilustrado na Figura 2, com a ressalva de que o diagrama arbóreo é
meramente convencional e não tem significado teórico em uma perspectiva minimalista
(diferentemente da estrutura X-barra na TRL):
Figura 2: Operação Merge
Merge (α,β) → K = {α, β}
K = {α, β}
α β
Chomsky (1995a: 243) defende que o valor de K deve refletir o fato de que
“elementos verbais e nominais são interpretados diferentemente em LF e se comportam
diferentemente no componente fonológico”. Consequentemente, o autor sugere que o
valor de K deve incluir pelo menos uma etiqueta indicando o tipo ao qual K pertence.
Entretanto, dada a condição de inclusividade referida anteriormente, Chomsky (1995a:
244) acrescenta que o rótulo de K “deve ser construído a partir dos dois constituintes α e
β” e considerações lógicas o leva a concluir que o rótulo de K “é ou α ou β; um ou outro
projeta e é o núcleo de K”. Portanto, o valor de Merge (α, β) é K, o qual poderá ser
representado pelos conjuntos {α, {α, β}} ou {β, {α, β}} (cf. Chomsky, 2013).
106
A segunda operação computacional a ser considerada é Move, uma operação que
desloca um item lexical de uma posição estrutural para outra. Essa operação sintática é
esquematizada na Figura 3, na qual um constituinte α é movido de posição interna a K
para a posição do especificador de L:
Figura 3: Move α
L
2
α L
2
δ K
2
... α …
Movimento é uma propriedade onipresente nas línguas naturais. Ao contrário de

Merge, no entanto, a operação Move não desfrutou de estabilidade ontológica dentro do
minimalismo. Inicialmente, Move foi considerado por Chomsky (1995a) como uma
“imperfeição” por causa de sua ausência em outros sistemas simbólicos específicos.
Além disso, era visto como uma propriedade híbrida, que envolveria características de
Merge e Agree, e isso forneceu a base para o argumento de que essas últimas operações
precedem Move, exceto quando o movimento é inevitável. Chomsky (2000b: 101-102)
considera que
[c]laramente Move é mais complexa que seus subcomponentes Merge e

Agree, ou mesmo a combinação dos dois […]. Boas condições de desenho
nos levariam a esperar que operações mais simples são preferíveis às mais
complexas, de modo que Merge e Agree (ou sua combinação) previne Move,
que é um ultimo recurso, escolhido quando nada mais é possível.
Entretanto, o mesmo Chomsky (2000b) fornece argumentos de que (a) Move

(como uma operação que expressa a propriedade de deslocamento em línguas naturais)
107
é motivada por condições de interface, e (b) traços não interpretáveis (considerados
outra fonte de imperfeição) são o mecanismo que permite a operação Move.
A última operação sintática a ser considerada aqui é Agree. Essa relação é um
análogo abstrato de padrões morfológicos de concordância e compreende uma relação
assimétrica entre uma sonda e seu alvo c-comandado, uma terminologia introduzida em
Chomsky (2000b, 2001, 2004a). Em um certo ponto de uma dada derivação, um
constituinte do núcleo (por exemplo, os núcleos funcionais v, T ou C) funciona como
uma sonda que inicia uma busca por um alvo (um DP) dentro de seu domínio de c-
comando. Enquanto o núcleo (ou sonda) entra na derivação com traços-ϕ não valorados
(por exemplo, traços de pessoa e número não interpretáveis), o DP entra na derivação
com seus traços já valorados. Agree aplica-se ao par sonda-alvo sob uma noção abstrata
de identidade de traços-φ com a consequência de que os valores dos traços-φ do alvo
são copiados na sonda. O alvo DP, por sua vez, tem um traço de caso nominativo não
valorado se a sonda for T (ou C) e acusativo se for v. Essas várias suboperações juntas
constituem a operação Agree – essa é uma versão simplificada da operação Agree para
fins de ilustração. A literatura recente aponta uma série de possibilidades de se conceber
a operação Agree, tais como Béjar (2003), Rezac (2003), Wurmbrand (2011).
Quanto à ontologia da operação Agree, Chomsky (2000b: 101) especula que seja
uma consequência da necessidade de satisfazer as condições da arquitetura da
linguagem humana. Um possível argumento a favor dessa especulação consiste, pelo
menos em parte, em reconhecer que a operação Agree constitui uma condição
necessária ao movimento e faz parte da implementação desse processo. Supondo, então,
que movimento possa ser vinculado a requisitos de interface como sugerido por
Chomsky (2008), então Agree também pode ser visto como constituintes das
explanantias fundamentais do PM.
O Programa Minimalista e a natureza da gramática universal
O PM procura reduzir a complexidade da GU, deslocando a carga de explicação

dos aspectos centrais da linguagem de restrições genéticas para princípios gerais que
não são específicos da língua. Isso pode ser considerado uma mudança na ênfase do
nativismo genético para o nativismo não genético, com o pressuposto de que o que é
inato na linguagem, em oposição ao que é aprendido, é uma manifestação de nossos
genes ou uma consequência de leis não biológicas (cf. Al-Mutairi, 2014).
108
Uma linha de raciocínio que tem sido constante ao longo do trabalho pré-
minimalista de Chomsky é a seguinte: podendo-se demonstrar que uma propriedade P
não pode ser derivada da experiência linguística através de procedimentos indutivos
padrão, então P deve ser inato (em oposição a “aprendido”). Essa é essencialmente a
essência do argumento da pobreza de estímulo. Além de postular uma estrutura inata
para a faculdade de linguagem, Chomsky procurou mostrar que essa estrutura deve ser
rica ou complexa. Essa é outra maneira de afirmar que o argumento da pobreza de
estímulo se aplica amplamente. Assim, Chomsky sustenta que, no momento em que o
conhecimento linguístico alcançado pela criança em idade muito jovem é considerada
uma hipótese forte, somos “levado[s] à conclusão de que a estrutura intrínseca é rica
(pelo argumento da pobreza de estímulo)” (Chomsky, 1980a: 41). [O TRECHO
ASSINALADO NÃO ESTÁ CLARO]
Observe-se, entretanto, que o argumento da pobreza de estímulo é essencialmente

negativo. A atribuição do inatismo é justificada, pois a aprendizagem, no sentido de
indução a partir da experiência, não pode ser a única responsável pela aparente
complexidade da estrutura linguística. Ou seja, o argumento é neutro sobre se a
estrutura inata é ou não geneticamente determinada. Como consequência dessa
neutralidade, o argumento sobrevive à transição para o minimalismo. De fato, se o que é
inato não precisa ser geneticamente inato, então o argumento da pobreza de estímulo é
consistente com a ênfase minimalista em um nativismo não-genético. Antes que essa
ênfase se tornasse oficial, no entanto, o apelo de Chomsky à dotação genética para
explicar a discrepância entre o que é inato e o que é aprendido parece apropriado em um
período em que as evidências disponíveis o direcionaram para o fator genético. Também
parece perfeitamente sintonizado com uma abordagem que enfatiza a natureza biológica
da linguagem. Assim, para Chomsky (1980a: 66), “o argumento da pobreza do estímulo
não nos deixa alternativa razoável senão supor que as propriedades [da língua] são de
algum modo determinadas na gramática universal, como parte do genótipo”. E ainda:
[s]e, por exemplo, encontrarmos evidências extensivas de que os princípios

subjacentes a uma determinada restrição linguística pertencem à gramática
universal e estão disponíveis para o aprendiz da língua sem experiência
relevante, então seria racional supor que esses mecanismos são
geneticamente determinados e procurar uma proposta adicional em termos de
desenvolvimento biológico. (Chomsky, 1980a: 209)
De fato, nesse sentido, Chomsky (1975a: 29) refere-se ao que ele chama de
“necessidade biológica”, um conceito que ele assimila em sua definição de “gramática
109
universal”. É bom ter em mente, entretanto, que enquanto o argumento da pobreza de
estímulo (mesmo quando formulado em termos de “necessidade biológica”, deixando
assim de lado a possibilidade não-genética) destina-se a excluir o meio ambiente como a
fonte primária da qual deriva a complexidade da estrutura linguística, não exclui a
possibilidade de que grande parte dessa complexidade não seja linguisticamente
autônoma nem ausente em espécies não humanas. Em outras palavras, a atribuição de
dotação genética, ao mesmo tempo em que confina a experiência linguística a um papel
secundário com relação à aquisição, não implica o fato de as propriedades assim
consideradas não existam em outros sistemas cognitivos nem que sejam específicas para
os seres humanos. No caso de espécies não humanas, não seria logicamente absurdo
sugerir que a linguagem tenha uma base genética rica e que, ao mesmo tempo,
virtualmente todas as propriedades da linguagem possam ser identificadas em algum
domínio não humano. Quanto às faculdades cognitivas humanas, pode-se afirmar
consistentemente que a mente possui uma estrutura inata rica e que, ao mesmo tempo, a
estrutura mental é homogênea entre os domínios cognitivos (incluindo a linguagem).
Em outras palavras, a assunção de a estrutura da mente ser inata e complexa é uma
posição neutra em relação à possibilidade de os vários sistemas cognitivos da mente
humana serem ou não determinados por princípios diferentes. Nos termos de Chomsky
(1980a: 40), “pode-se afirmar que existe uma estrutura inata rica, mas pouca ou
nenhuma modularidade”.
Sem dúvida, muitos argumentariam que a posição de Chomsky favoreceu
claramente uma abordagem modular à cognição em geral, mas essa afirmação deve ser
examinada com cuidado. Devemos primeiramente esclarecer que o sentido de
“modularidade” aqui é distinto e menos articulado do que o desenvolvido em Fodor
(1983). A modularidade para Chomsky (1980a) é simplesmente a suposição de que
vários sistemas da mente são organizados conjuntamente a princípios bem diferentes.
No caso da linguagem, isso se traduz na suposição de que a linguagem (enquanto
sistema cognitivo) é específica em termos dos princípios subjacentes à sua estrutura e
propriedades. Como veremos mais adiante, a noção de “especificidade de linguagem”
recebe uma nova interpretação no minimalismo. Consideremos primeiro as visões pré-
minimalistas de Chomsky sobre essa questão. À questão de saber se as propriedades da
linguagem são específicas ou compartilhadas com outras capacidades cognitivas,
Chomsky propôs uma resposta clara, embora cautelosa:
110
[p]arece haver pouca razão para supor, por enquanto, que existam princípios
gerais de estrutura cognitiva, ou mesmo de cognição humana, expressáveis
em algum nível superior, dos quais as propriedades particulares de
determinados órgãos mentais”, como a faculdade da linguagem, podem ser
deduzidos, ou mesmo que haja analogias esclarecedoras entre esses vários
sistemas. (Chomsky, 1980a: 215)
Essa também foi a posição de Chomsky em seu famoso debate com Jean Piaget,
realizado na Abbaye de Royaumont (Paris) em 1975, relatado em Piattelli-Palmarini
(1980). Uma questão central amplamente discutida nesse debate diz respeito às
capacidades linguísticas humanas e suas fundações. Contrariando as visões de Piaget,
nas quais a linguagem humana é vista como produto de processos progressivamente
constituídos de inteligência geral, Chomsky (1980b) esforçou-se para defender a visão
de que a faculdade da linguagem é um sistema intrincado com propriedades específicas
que são geneticamente fixadas. Ele permaneceu cético sobre as perspectivas de
encontrar propriedades semelhantes às da GU em domínios não linguísticos. Esse
ceticismo se reflete na seguinte interação com um dos participantes do debate, o
eminente psicólogo David Premack:
PREMACK: [...] você disse que não há esperança para a possibilidade de

encontrar em domínios não linguísticos o tipo de propriedades formais que se
encontra na língua [...].
CHOMSKY: Eu não disse isso; eu disse que não via nenhuma esperança para
isso.
PREMACK: Isso me parece um julgamento muito prematuro [...]. Acho
prematuro concluir que as estruturas formais que se sabe existir na língua não
serão encontradas em outros lugares, em outras espécies ou talvez em outros
domínios humanos. Vamos esperar e ver.
CHOMSKY: [...] Não vejo nenhum motivo específico para esperar o mesmo
resultado, mas se isso acontecer, ficarei muito satisfeito. (Piattelli-Palmarini,
1980: 179-80)
Observe-se, no entanto, que o ceticismo de Chomsky não se estende ao

dogmatismo, pois ele considerou repetida e explicitamente as questões como empíricas,
seu resultado a ser determinado a posteriori por mais pesquisas e experimentações. É
digno de nota que na década de 1980 o ceticismo é aparente não apenas no que diz
respeito à cognição em geral, mas também no que diz respeito aos sistemas com os
quais a faculdade da linguagem pode ser interpretada de perto, viz sistemas de som e
significado. Note-se, entretanto, que a cautela que vimos anteriormente também é
manifestada aqui com o uso de “parece” e “tende” na seguinte passagem de Chomsky
(1980a: 246, grifo nosso):
111
[a] crença na “simplicidade” das estruturas mentais está relacionada à
doutrina da uniformidade. No caso da língua, é comumente argumentado por
linguistas e outros que os princípios da gramática não podem ser “muito
complexos” ou “abstratos demais”, mas devem refletir propriedades de som e
significado, ou devem ser diretamente determinados de alguma maneira por
“funcionais considerações, “aspectos do uso da linguagem. Evidentemente,
não pode haver argumento a priori para esse efeito. Para mim, parece que o
trabalho recente tende a sustentar uma visão bastante diferente: que as regras
da sintaxe e da fonologia, pelo menos, são organizadas em termos de
princípios “autônomos” da computação mental e não refletem de maneira
simples as propriedades da “substância” fonética ou semântica ou
contingências de uso da linguagem.
Aparentemente, essa passagem contrasta bastante com as visões minimalistas de

Chomsky, mais notavelmente com sua TMF, na qual a alegação não é apenas que a FL
não pode ser “utilizável” a menos que se envolva com sistemas de uso da língua e
pensamento, mas também que esse engajamento com esses sistemas de desempenho
determina, em grande medida, as propriedades da linguagem.
Em relação à hipótese de a mudança para o minimalismo envolver uma remoção
da reivindicação da modularidade, consideremos a seguinte passagem de Chomsky
(1995a: 221):
[s]uponha que a abordagem [minimalista] se mostre mais ou menos correta.

O que poderíamos então concluir sobre a especificidade da faculdade da
linguagem (modularidade)? Não muito. A faculdade da linguagem pode ser
única entre os sistemas cognitivos, ou mesmo no mundo orgânico, na medida
em que satisfaz suposições minimalistas. Além disso, os parâmetros
morfológicos poderiam ser de caráter único, e o sistema computacional […]
biologicamente isolado. Outra fonte de possível especificidade da linguagem
reside nas condições impostas “de fora” na interface, o que podemos chamar
de condições de saída [bare output conditions].
Há dois pontos a considerar aqui. Primeiramente, Chomsky parece sugerir que

não há muito a ser concluído sobre a modularidade a partir da postulação minimalista de
um componente simples geneticamente determinado na estrutura da FL. Isso é coerente
com sua visão anterior, a que nos referimos anteriormente, de que a extensão em que a
linguagem pode ser geneticamente determinada não implica modularidade. Em segundo
lugar, parece haver uma reinterpretação da noção de “especificidade”. De uma
perspectiva pré-minimalista, a especificidade da linguagem é interpretada em termos
dos princípios subjacentes à estrutura da FL. A partir disso, podemos ter uma
interpretação da especificidade em termos do que é considerada a função central da
linguagem, ou seja, satisfazer as condições de legibilidade nas interfaces de som e
significado. Consequentemente, não é tanto que a hipótese da modularidade tenha sido
112
abandonada, mas que o domínio em que ela é investigada mudou. Embora a discussão
até aqui não tenha excluído considerações de sistemas não humanos de cognição, ela foi
em grande parte enquadrada com a cognição humana em mente.
O Programa Minimalista e a especificidade da espécie
Em suas colaborações (relativamente recentes) com os biólogos Marc Hauser e

Tecumseh Fitch (cf. Hauser et al., 2002; Fitch et al., 2005), Chomsky defendeu a
opinião de que muitas das propriedades da linguagem podem ser identificadas em outras
espécies, sugerindo que a extensão em que a linguagem é especial pode ser muito
restrita. Alguns inferiram a partir disso que a suposição pré-minimalista da
especificidade das espécies foi amplamente renunciada (Pinker e Jackendoff, 2005;
Kinsella, 2009). No entanto, uma inspeção mais detalhada do trabalho de Chomsky
revela o contrário. Observe-se, primeiro, que mesmo se admitirmos que haja uma
mudança envolvida aqui, devemos, contudo, estar cientes do fato de que ela é
inteiramente quantitativa e não qualitativa. Isto é, não há negação da visão de que a
linguagem é uma prerrogativa humana, mas apenas uma especulação quanto à extensão
em que é como tal. Certamente, o fato de a língua ter evoluído apenas em humanos
pareceria indicar que há pelo menos algo de especial nisso. Passemos então a considerar
brevemente se houve uma mudança na concepção de língua de Chomsky com relação à
noção de especificidade da espécie.
Qual é a principal alegação feita por Chomsky e seus colaboradores? É suficiente
dizer que Hauser et al. (2002) distinguem entre a faculdade da linguagem no sentido
estrito (FLN, Faculty of Language – narrow sense) e a faculdade da linguagem no
sentido amplo (FLB, Faculty of Language – broad sense), o primeiro contém
propriedades que são exclusivas dos humanos e da linguagem, e o último compreende
todas as outras propriedades que (a) estão de algum modo envolvidas na linguagem e
(b) podem ser compartilhadas com outras espécies ou ter um papel em outros domínios
cognitivos humanos. Dada essa distinção, os autores desenvolvem a hipótese de que a
recursividade é o único aspecto da FL exclusivo dos humanos e específico da linguagem.
A noção geral de “recursividade” é instanciada pela operação sintática Merge, que
“toma um conjunto finito de elementos e produz um conjunto potencialmente infinito de
expressões discretas” (Hauser et al., 2002: 1571). Isso constitui a principal reivindicação
desse trabalho colaborativo, e não parece imediatamente sinalizar um grande
113
afastamento das visões pré-minimalistas de Chomsky sobre a natureza da FL.
Consideremos, por exemplo, as duas passagens a seguir de um dos primeiros trabalhos

de Chomsky, no qual ele desenha “semelhanças impressionantes entre o clima de
opinião do século XVII e o da psicologia e da linguística cognitiva contemporânea”
(Chomsky, 1968: 15). A primeira passagem é um comentário sobre a definição de
inteligência (ingenio) humana, segundo o médico espanhol Juan Huarte de San Juan
(1575):
Huarte ficou admirado com o fato de que a palavra para “inteligência”,

ingenio, parece ter a mesma raiz latina que várias palavras que significam
“engendrar” ou “gerar”. Isso, ele argumentou, dá uma pista para a natureza da
mente. Assim, “pode-se discernir dois poderes gerativos no homem, um
comum com os animais e as plantas, e o outro participando da substância
espiritual. Inteligência (ingenio) é um poder gerativo. O entendimento é uma
faculdade geradora”. A etimologia de Huarte na verdade não é muito boa; a
percepção, no entanto, é bastante substancial. (Chomsky, 1968: 9)
Chomsky, lançando mão de observação feita por Descartes a respeito da

característica distintiva da linguagem humana, afirma:
[d]e fato, como o próprio Descartes muito corretamente observou, a língua é

uma posse específica da espécie, e mesmo em baixos níveis de inteligência,
em níveis patológicos, encontramos um comando da língua totalmente
inatingível por um macaco que pode, em outros aspectos, superar um imbecil
humano na capacidade de resolver problemas e outros comportamentos
adaptativos [...]. Há um elemento básico que falta nos animais, argumentou
Descartes [...], ou seja, o segundo tipo de inteligência de Huarte, a capacidade
geradora revelada no uso humano normal da língua como um instrumento
livre de pensamento. (Chomsky, 1968: 10-11)
Essas duas passagens estão de acordo com a hipótese de que a propriedade

recursiva da língua é o que a distingue dos sistemas comunicativos não humanos. De
fato, a continuidade entre o trabalho pré-minimalista de Chomsky e Hauser et al. (2002)
vai ainda mais longe. Por exemplo, a descrição de Chomsky (1980a: 54-55) da distinção
entre os sistemas computacional e conceitual é bastante semelhante àquela entre FLN e a
FLB:
[s]uponhamos que o que chamamos de “conhecer uma língua” não seja um

fenômeno unitário, mas deve ser resolvido em vários sistemas interativos,
mas distintos. Um envolve os aspectos “computacionais” da língua – isto é,
as regras que formam construções sintáticas ou padrões fonológicos ou
semânticos de vários tipos, e que fornecem o rico poder expressivo da
linguagem humana. Um segundo componente envolve o sistema de
referência a objetos e também relações como “agente”, “objeto”,
“instrumento” e coisas do tipo [...]. Por falta de um termo melhor, vamos
114
chamar este último de “sistema conceitual”. Supondo tudo isso, vamos
distinguir um sistema de regras e representações “computacionais” que
constituem a faculdade da linguagem, estritamente falando, e um sistema de
estrutura conceitual organizado ao longo das linhas que acabamos de
descrever. Os dois sistemas interagem. Assim, certas expressões do sistema
linguístico estão ligadas a elementos do sistema conceitual e talvez regras do
sistema linguístico se refiram a relações temáticas.
Com base nessa distinção, Chomsky (1980a: 57) prossegue, especulando que os
macacos superiores poderiam compartilhar com os humanos certas partes do sistema
conceitual, embora não possuam a propriedade recursiva do sistema computacional.
A partir das passagens citadas anteriormente, parece não haver nenhuma
substância na convicção de Pinker e Jackendoff (2005) de que a contribuição de
Chomsky para Hauser et al. (2002) representa uma “grande retratação”. É interessante
notar que os críticos que acreditam na “grande retratação” de Chomsky referem-se
frequentemente à concepção pré-minimalista da linguagem como um sistema
geneticamente complexo para sustentar sua posição. Mas já foi exposto aqui que essa
concepção se baseava no argumento da pobreza do estímulo, um argumento compatível
com o nativismo não genético subjacente à visão minimalista.
De forma simplificada, o argumento parece ser o seguinte: como as abordagens
pré-minimalistas consideravam a GU complexa, e como o minimalismo contesta isso
tentando demonstrar que grande parte da complexidade atribuída à GU está fora de seu
domínio, conclui-se que a marca do minimalismo implica que grande parte da
complexidade da linguagem é compartilhada com outras espécies. Pelo menos duas
suposições subjazem a esse argumento que, quando explicitadas, demonstram sua
fragilidade: (i) que o que constitui a GU deve ser geneticamente determinado e exclusivo
da língua; (ii) que o que está fora da GU deve ser ipso facto compartilhado com outras
espécies. A primeira hipótese não reflete necessariamente a definição de GU na obra pré-
minimalista de Chomsky, embora pareça estar em sintonia com seu trabalho posterior.
Para efeito de argumento, podemos assumir que essa é uma suposição válida. Mas,
neste caso, uma propriedade X que se encontra fora da GU pode pertencer a uma das três
categorias seguintes: (a) X é geneticamente determinado, mas não é exclusivo da
linguagem; (b) X não é geneticamente determinado, mas é exclusivo da linguagem; e,
(c) X não é geneticamente determinado nem é exclusivo da linguagem. Ao considerar a
categoria (a) como a única alternativa para o que constitui a GU, os proponentes do
argumento anterior são claramente culpados de uma falsa dicotomia, o que torna seu
argumento inválido. A categoria (b) exemplifica a especificidade da linguagem a partir
115
de uma perspectiva minimalista, como indicado anteriormente, e a categoria (c)
representa a aposta minimalista no nativismo não genético, ou seja, muitas das
propriedades da GU podem não fazer parte do componente genético da linguagem (ou,
pelo menos, não lhe são exclusivos). Esperamos poder ver agora que o argumento
exposto não levou em conta que reduzir o “tamanho” de GU não significa
necessariamente um aumento no número de propriedades compartilhadas, pois existe a
possibilidade de que o que está fora da GU não pode ser geneticamente determinado,
caso em que a distinção “única versus compartilhada” sequer surge.
Como observado, o minimalismo pode ser considerado uma exploração da visão
de que a complexidade da linguagem é apenas aparente, e que existem, de fato,
princípios mais profundos dos quais grande parte dessa complexidade pode ser
derivada. Essa perspectiva é incorporada na TMF, que, de forma simplificada, afirma que
a língua é uma solução ótima para o problema de satisfazer as condições da interface
(Chomsky, 2001: 1).
Há pelo menos três razões para sugerir-se que, na medida em que as noções de
“solução ótima” e “condições de interface” podem receber um conteúdo específico, não
deve haver nenhum problema em princípio em entender qual o conteúdo da TMF.
Primeiro, a questão de como a TMF deve ser interpretada não é direta. Isso porque
a abordagem de Chomsky à aparente complexidade da linguagem nas últimas duas
décadas não foi uniforme. Segundo, a noção de “necessidade conceitual virtual”, apesar
de central para o minimalismo em geral e para a TMF em particular, não recebeu atenção
na literatura minimalista. É, portanto, necessário submeter esta noção fundamental a um
exame mais detalhado para ver se ela esclarece a natureza da TMF. Terceiro, para uma
compreensão adequada da TMF, deve-se levar em consideração o discurso
extralinguístico de Chomsky, a saber, suas contribuições para os “artigos de evolução”
(Hauser et al., 2002; Fitch et al., 2005, Berwick e Chomsky, 2016, 2017). Qualquer que
seja a interpretação que se possa atribuir à TMF, ela deve ser consistente com a hipótese
de que a recursividade é a única propriedade exclusiva da linguagem humana, uma
hipótese que constitui a reivindicação central desses artigos.
Observam-se pelo menos três formulações da TMF que talvez sejam mais bem
visualizadas em termos de três abordagens diferentes que Chomsky provavelmente
contemplou em momentos distintos nos últimos anos. A primeira abordagem dá origem
a uma interpretação da TMF como uma generalização estrita – difícil de justificar. A
segunda abordagem é dominada pelo que entendemos como “estratégia da
116
imperfeição”, uma estratégia que pode ser enganosa, especialmente quando se trata da
força da TMF. A terceira abordagem pode ser considerada uma mudança de estratégia na
abordagem de Chomsky sobre a TMF, incorporando-a ao que será chamado de
“perspectiva dos três fatores”.
O Programa Minimalista e a “perspectiva dos três fatores”
A abordagem minimalista da aparente complexidade da linguagem culmina na

“perspectiva dos três fatores” (Chomsky, 2005, 2007b, 2008a, [NAS REFERÊNCIAS
CONSTAM APENAS UMA OBRA DE CADA ANO, PORTANTO, SEM AS LETRAS. CF] 2010).
Nesse contexto, a noção de “imperfeição” recebe pouca ênfase, e a expressão
“necessidade conceitual virtual” é pouco mencionada. Além do mais, a TMF recebe uma
formulação muito mais explícita do que anteriormente.
Em Chomsky (2005), percebe-se a sugestão de que o desenvolvimento da
linguagem no indivíduo é determinado pela interação de três fatores: (a) dotação
genética, (b) experiência e (c) princípios gerais não específicos da FL. O último desses
fatores se divide em duas subcategorias: uma diz respeito aos princípios da análise de
dados, e a outra se refere aos princípios de restrições estruturais e computação eficiente.
Por conveniência, vamos nos referir a esses três fatores como Fator I, Fator II e Fator
III, respectivamente.
Os dois primeiros fatores têm sido centrais para o problema da aquisição da
linguagem por muitos anos. Quanto ao terceiro fator, embora se possa observar na
literatura que seu significado para o problema da aquisição e evolução da linguagem
sempre foi reconhecido por Chomsky, não emergiu como um “fator” em si mesmo até a
formulação do quadro de três fatores. Podemos arriscar dizer que, não só seja
explicitamente chamado de “fator”, mas também seja o fator que pode sustentar grande
parte da explicação minimalista. Para colocá-lo em termos extraídos de Chomsky
(2004a), o Fator III é o responsável por levar a investigação linguística “além da
adequação explicativa” a um nível mais profundo de explicação.
Chomsky (2005) oferece alguns exemplos de como os três fatores podem interagir
para determinar o crescimento e o desenvolvimento da linguagem. Um envolve o
conceito de canalização, termo cunhado por Waddington (1940), que se refere à
“robustez dos processos de desenvolvimento em face da variação ambiental e genética”
(Siegal e Bergman, 2006: 235). A ideia básica é que, quando ocorre a canalização, um
117
fenótipo assume um “estado de inércia” com a consequência de que o desenvolvimento
fenotípico é insensível a certas diferenças genotípicas ou ambientais.
No entanto, embora o conceito de canalização possa indicar uma interação entre
fatores ambientais, genéticos e físicos no desenvolvimento de um fenótipo, não está
claro como isso poderia ser traduzido em um contexto linguístico significativo em
termos da abordagem dos três fatores. De fato, mesmo se assumimos, como
Waddington (1942), que o resultado da canalização é um fenótipo “ótimo”, a imprecisão
aqui não é reduzida simplesmente afirmando que “[um] problema central do estudo da
faculdade da linguagem é descobrir os mecanismos que limitam os resultados a ‘tipos
ótimos’” (Chomsky, 2005: 5), pois parece não haver uma maneira clara pela qual se
possa relacionar os “tipos ótimos” no sentido biológico a representações ou derivações
ótimas no contexto da computação linguística.
Nesse ponto, surge a pergunta sobre qual é o conteúdo da GU. A resposta que
muitos linguistas minimalistas dariam é que a GU consiste apenas na operação Merge
recursiva. Aparentemente, isso parece estar de acordo com a hipótese de Hauser et al.
(2002) de que a recursividade é o único aspecto da linguagem que é exclusivamente
humano e exclusivamente linguístico. Mas precisaremos suspender o julgamento sobre
essa questão até que se considere a relação entre os discursos linguístico e
interdisciplinar de Chomsky, o que não será feito neste texto, infelizmente.
Para finalizar, Chomsky (2010: 52) considera a TMF “[u]ma tese muito forte, [...]
que a língua mantém a operação recursiva mais simples, Merge, e é perfeitamente
projetada para satisfazer as condições da interface”. Quando comparado com outras
formulações da TMF em abordagens anteriores, a formulação contida nessa passagem
destaca-se não apenas por sua referência explícita à operação Merge, mas também por
sua especificação do estatuto ontológico de tal operação, pois dizer que a língua se
restringe a Merge é dizer que essa operação computacional é o único aspecto da
linguagem que constitui o Fator I. Em outras palavras, Merge é o único mecanismo
específico da FL, surgindo de alguma forma no curso da evolução da linguagem.
Entretanto, a passagem que acabamos de citar continua reduzindo a TMF à seguinte
equação:
Interfaces + Merge = Linguagem
118
o que pode ser mais explícito lendo a referência na passagem anterior de língua
“perfeitamente projetada” como abrangendo a noção de “computação ótima”. Podemos,
portanto, expandir a equação acima para produzir:
Interfaces + Computação Ótima + Merge = Linguagem
Em outras palavras, a GU é o resultado de Merge operando sob as condições de

legibilidade da interface e eficiência computacional. Isso parece ser essencialmente o
que a TMF representa.
Para finalizar: algumas palavras sobre o Programa Minimalista e a aquisição da

linguagem
Chomsky (1971) apresenta uma analogia de como o problema da aquisição da

linguagem foi concebido. Ele nos pede para imaginarmos um engenheiro que se depara
com o problema de construir uma teoria dos estados internos de um dispositivo,
estudando as relações de entrada e saída de um computador. Uma das funções principais
de um sistema operacional é controlar todos os dispositivos de entrada e saída de um
computador, tratar erros, interceptar interrupções, fornecer uma interface entre o
dispositivo e o sistema, emitir comandos para os dispositivos.
Assim, o engenheiro é o linguista, e esse dispositivo é o “dispositivo de
aquisição de linguagem”, o input e o output para os quais estão os dados linguísticos
primários e as gramáticas postuladas, respectivamente. A analogia continua: o linguista
não entende muito bem a função do dispositivo, mas a partir das informações sobre suas
relações de entrada e saída, ele constrói uma teoria da estrutura interna do dispositivo. O
linguista – para completar a analogia – observa a disparidade entre a entrada e a saída
do dispositivo e conclui que, para que o dispositivo desempenhe sua função, ele deve ter
uma estrutura interna rica (cf. a pobreza do argumento de estímulo mencionada
anteriormente). Assim, a tarefa do linguista é determinar o quão rica deve ser a estrutura
interna para que o dispositivo desempenhe sua função. Isso é o que Chomsky chama
retrospectivamente de uma abordagem top-down para a GU. Em outras palavras, “quanto
deve ser atribuído à GU para explicar a aquisição da linguagem” (Chomsky, 2007b: 3).
No minimalismo, no entanto, a imagem é conceitualmente diferente. Agora temos um
“dispositivo computacional” (ou seja, uma faculdade de linguagem), cuja entrada e
119
saída são conjuntos de itens lexicais e pares (legítimos) de som e significado,
respectivamente. De uma perspectiva minimalista, isto é, de uma perspectiva que
considera a linguagem como um sistema cognitivo, assume-se que a única função da
faculdade da linguagem é satisfazer as condições de interface impostas por outros
sistemas cognitivos. Também a partir de uma perspectiva minimalista, isto é, de uma
perspectiva que vê a língua como um “objeto natural”, supõe-se ainda que a faculdade
da linguagem é “perfeita” no desempenho de sua única função. Ao testar essas duas
suposições, surgem duas questões de design. Primeiro, qual é a estrutura mínima
necessária para a faculdade da linguagem desempenhar sua função? Essa questão
resume o que Chomsky (2007b) chama de abordagem bottom-up para a GU; ou seja,
“quão pouco pode ser atribuído à GU?”. A segunda questão é sobre até que ponto a
faculdade da linguagem é idealmente projetada para desempenhar sua função.
Entendemos, agora, que o minimalismo não começa do zero, como temos visto
desde o primeiro capítulo deste livro. Antes, o PM tenta passar da abordagem “de cima
para baixo” para a abordagem “de baixo para cima” da GU.
Referências
AL-MUTAIRI, F.R. The Minimalist Program: the nature and plausibility of Chomsky´s Biolinguistics.
Cambridge: Cambridge University Press, 2014.
BÉJAR, Susana. Phi-syntax: a theory of agreement. 214f. Tese (Doutorado em Linguística) – University of
Toronto, 2003.
BERWICK, R.C.; CHOMSKY, N. Why only us: language and evolution. Cambridge: MIT Press, 2016.
______; ______. Por que apenas nós: linguagem e evolução. São Paulo: Unesp, 2017.
BOŠKOVIĆ, Ž. Principles and Parameters theory and Minimalism. In: DEN DIKKEN, M. (Ed.). The
Cambridge Handbook of Generative Syntax (Cambridge Handbooks in Language and Linguistics).
Cambridge: Cambridge University Press, 2013, p. 95-121.
CARVALHO, D. S. A estrutura interna dos pronomes pessoais em português brasileiro. 158f. Tese
(Doutorado em Linguística) – Universidade Federal de Alagoas, 2008.
______. Traços. In: FERRARI-NETO, J; SILVA, C.R.T (Org.). Minimalismo em foco: princípios e debates.
1.ed. Curitiba: CRV, 2012, pp. 113-132.
______. Uma proposta de estrutura interna para os pronomes pessoais no português brasileiro. Signótica,
Goiânia, 29, n. 2, pp. 455-481, jul./dez. 2017a.
______. The internal structure of personal pronouns. Newcastle-upon-Thames: Cambridge Scholars
Publishing, 2017b.
______. Da natureza dos traços-phi. In: CARVALHO, D.S. (Org.). Traços-phi: contribuições para a
compreensão da gramática do português. Salvador: EDUFBA, 2017c, pp. 15-36.
120
______. O traço de gênero na morfossintaxe do português. DELTA, São Paulo, v. 34, n. 2, pp. 635-
660, jun. 2018.
______; CERQUEIRA, F. O.; MARIANO, V. C. Biolinguística: da evolução da espécie à noção de
parâmetros. Fórum Linguístico, Florianópolis, v. 14, n. 3, pp. 2286-2299, set. 2017.
CHOMSKY, N. The Logical Structure of Linguistic Theory. MIT Humanities Library, Microfilm, 1955.
______. Aspects of the Theory of Syntax. Cambridge: MIT Press, 1965.
______. Cartesian Linguistics. New York: Harper and Row, 1966.
______. Language and Mind. New York: Harcourt Brace and World, Inc. 1968.
______. The Case Against B. F. Skinner. The New York Review of Books, dez. 1971.
______. Rules and Representations. New York: Columbia University Press and Oxford: Basil Blackwell
Publisher, 1980a.
______. On Cognitive Structures and their Development: a Reply to Piaget. In: PIATTELLI-PALMARINI,
M. (Ed.). Language and Learning: The Debate between Jean Piaget and Noam Chomsky. New York:
Routledge and Kegan Paul, 1980b, pp. 35-52.
______. Lectures on Government and Binding. Dordrecht: Foris, 1981.
MIT Press, 1982.
______. The Minimalist Program. Cambridge, MA: MIT Press, 1995.
______. New Horizons in the Study of Language and Mind. Cambridge University Press, 2000a.
______. Minimalist Inquiries: the Framework. In: MARTIN, R.; MICHAELS, D.; URIAGEREKA, J. (Eds.).
Step by Step: Essays in Minimalist Syntax in Honor of Howard Lasnik. Cambridge, MA: MIT Press,
2000b, pp. 89-155.
______. Derivation by Phase. In: KENSTOWICZ, H. (ed.). Ken Hale: a Life in Language. Cambridge, MA:
MIT Press, 2001, pp. 1-52.
______. Beyond Explanatory Adequacy. In: BELLETTI, A. (ed.). Structures and Beyond. Oxford: Oxford
University Press, 2004, pp. 104p31.
______. Three Factors in Language Design. Linguistic Inquiry, 36: 1, Winter 2005, pp. 1-22.
______. Approaching UG from Below. In: SAUERLAND, U.; GÄRTNER, H.-M. (Eds.). Interfaces +
recursion = language? Chomsky’s minimalism and the view from syntax-semantics. Berlin: Mouton
de Gruyter, 2007, pp. 1-29.
______. On Phases. In: FREIDIN, R.; OTERO, C.P.; ZUBIZARRETA, M.-L. (eds.). Foundational Issues in
Linguistic Theory: Essays in Honor of Jean-Roger Vergnaud, Cambridge, MA: MIT Press, 2008, pp.
133-66.
______. Some Simple Evo Devo Theses: How True Might they be for Language? In: LARSON, R.;
DEPREZ, V.; YAMAKIDO, H. (eds.). The Evolution of Human Language: Biolinguistic Perspectives,
Cambridge University Press, 2010, pp. 45-62.
______. Problems of projection. Lingua, 130, pp. 33-49, 2013.
FERRARI-NETO, J.; SILVA, C.R.T. (Org.). Minimalismo em foco: princípios e debates. Curitiba: CRV,
2012.
121
FITCH, W. T.; HAUSER, M.D.; CHOMSKY, N. The Evolution of the Language Faculty: Clarification and
Implications. Cognition, 97, pp. 179-210, set. 2005.
FODOR, J. Modularity of Mind: an Essay on Faculty Psychology. Cambridge, MA: MIT Press, 1983.
HARLEY, H.; RITTER, E. Person and number in pronouns: a feature-geometric analysis. Language, 78, pp.
482-526, 2002.
HAUSER, M.D.; CHOMSKY, N.; FITCH, W. T. The Faculty of Language: What is it, Who has it, and How
did it Evolve?. Science, 298, pp. 1569-1579, nov. 2002.
HORNSTEIN, N. Logical Form: from GB to Minimalism. Oxford: Blackwell, 1995.
______; NUNES, J.; GROHMANN, K. K. Understanding minimalism. Cambridge: Cambridge University
Press, 2005.
HUARTE DE SAN JUAN, J. Examen de ingenios para las ciencias. Baeza, Spain: Juan Bautista de Montoya,
1575.
KATO, M. A evolução da noção de parâmetro. DELTA, v. 18, n. 2, pp. 309-337, 2002.
KINSELLA, A. R. Language Evolution and Syntactic Theory. Cambridge University Press, 2009.
LENNEBERG, E. Biological Foundations of Language. New York: Wiley, 1967.
OUHALLA, J. Introducing transformational grammar: from principles and parameters to minimalism.
London: Arnold, 1999.
PENNISI, A.; FALZONE, A. Chomsky and Biolinguistics. In: PENNISI, A.; FALZONE, A. (Eds.). Darwinian
Biolinguistics: Perspectives in Pragmatics, Philosophy & Psychology. vol 12. New York: Springer,
2016, pp. 7-13.
PIATTELLI-PALMARINI, M. (ed.). Language and Learning: the Debate between Jean Piaget and Noam
Chomsky. New York: Routledge and Kegan Paul, 1980.
PINKER, S.; JACKENDOFF, R.. The Faculty of Language: What's Special about it? Cognition, 95.2, pp.
201-36, mar. 2005.
RADFORD, A. Syntactic Theory and the Structure of English: A Minimalist Approach. Cambridge:
REZAC, Milan. The fine structure of cyclic Agree. Syntax, 6, pp. 156-182, 2003.
SIEGAL, M.L.; BERGMAN, A. Canalization. In: FOX, C.W.; WOLF, J.B. (eds.). Evolutionary Genetics:
Concepts and Case Studies. New York: Oxford University Press, pp. 235-51, 2006.
WADDINGTON, C. H. Organisers and Genes, Cambridge University Press, 1940.
______. Canalization of Development and the Inheritance of Acquired Characters. Nature, 150, pp. 563-
565, 1942.
WURMBRAND, S. On Agree and Merge. Manuscrito. University of Connectcut, 2011.
ZEIJLSTRA, H. There is only one way to agree. The Linguistic Review, 29, pp. 491-53, 2012.
122
Os cinco problemas para a teoria linguística
123
O PROBLEMA DE HUMBOLDT
Marcus Lunguinho
Mariana Terra Teixeira
Um novo olhar para a linguagem humana e uma agenda de investigação
Já vimos nos capítulos anteriores que, para Chomsky, a capacidade de adquirir

uma (ou mais de uma) língua é uma característica que diferencia a espécie humana das
demais espécies. Essa propriedade biológica unicamente humana se chama Faculdade
da Linguagem e é concebida como o “órgão da linguagem”.
A Faculdade da Linguagem é compreendida como um “órgão” porque ela é um
dentre vários componentes de uma estrutura maior e mais complexa, qual seja, a
mente/o cérebro.34 Essa visão da Faculdade da Linguagem como um órgão é
apresentada, de modo mais claro e direto nas palavras do próprio Chomsky (2001: 4):
A faculdade da linguagem pode ser razoavelmente considerada um “órgão da

linguagem” da mesma forma que os cientistas falam do sistema visual, do
sistema imunológico ou do sistema circulatório como órgãos do corpo.
124
Entendido dessa forma, um órgão não é algo que possa ser removido do
corpo, deixando o restante intacto. É um subsistema de uma estrutura mais
complexa.
A Faculdade da Linguagem é definida não só como um órgão, mas como o

“órgão da linguagem”. Isso se deve ao fato de essa faculdade ser um subsistema da
mente humana dedicado exclusivamente ao uso e à interpretação da linguagem
(Chomsky, 2000).
Ao caracterizar a Faculdade da Linguagem como um componente cognitivo da
mente/do cérebro, Chomsky redefine a natureza da teoria linguística, a qual passa a ser
uma teoria mentalista que está “preocupada em descobrir uma realidade mental
subjacente ao comportamento observável” (Chomsky 1965: 4). Além disso, essa
caracterização da Faculdade da Linguagem faz dela um objeto biológico, uma realidade
do mundo natural. Por essa razão, ela deve ser estudada segundo a metodologia das
ciências naturais. Adotando-se esse naturalismo metodológico, pode-se dizer que a
Faculdade da Linguagem é um órgão que apresenta um estado inicial S0, cujas
características são resultado da dotação genética e, portanto, é comum a todos os
membros da espécie humana. Esse órgão se desenvolve a partir do contato com a
experiência linguística (sob a forma de dados linguísticos primários) e disso resulta uma
língua particular. Esse processo de desenvolvimento do “órgão da linguagem”
caracteriza a aquisição da língua pela criança e é esquematizado a seguir:
(1)
Faculdade da Linguagem Língua particular
(S0) (SL)
Experiência linguística
(dados linguísticos primários)
De acordo com o esquema em (1), o estado inicial da Faculdade da Linguagem é

geneticamente programado para produzir uma (ou mais de uma) língua particular. No
entanto, é necessário que esse estado inicial seja ativado. É aí que entra o papel da
experiência linguística: os dados linguísticos primários vão ativar o estado inicial da
Faculdade da Linguagem e esse estágio inicial vai passar por estágios intermediários até
chegar a um estágio relativamente estável – representado como SL. Em outras palavras,
125
como consequência da interação do estado inicial S0 da Faculdade da Linguagem com
os dados provenientes da experiência linguística, a Faculdade da Linguagem se
desenvolve até atingir o estado estável SL, que corresponde à gramática de uma língua
particular L (que pode ser o português, o wapixana, o japonês ou qualquer outra língua
humana).
Com essa proposta, a Linguística passa a ser, então, o estudo da Faculdade da
Linguagem, mais especificamente, o estudo do estado inicial Faculdade da Linguagem e
o estudo dos estados pelos quais ela passa, ou seja, das línguas particulares que se
desenvolvem a partir do estado inicial. Assim, cabem ao linguista duas tarefas: propor
uma teoria para o estado inicial da Faculdade da Linguagem, teoria essa denominada
gramática universal, e propor uma teoria para o estado estável que caracteriza uma
língua particular L, teoria essa denominada gramática particular ou, simplesmente,
gramática.
Tendo definido a sua concepção de linguagem, o objeto de estudo da Linguística
e o papel do linguista na perspectiva gerativa, Chomsky elenca cinco questões que, pela
sua importância, constituem uma agenda de pesquisa para o estudo da linguagem
(Chomsky, 1986, 1991 [não consta esta data nas Referências]; Chomsky e Lasnik,
1993[não consta nas Referências], Jenkins, 2000[não consta nas Referências]):
(2) a. O que constitui o conhecimento da linguagem?

b. Como esse conhecimento é adquirido?
c. Como esse conhecimento é posto em uso?
d. Como esse conhecimento é implementado no cérebro?
e. Como esse conhecimento evoluiu na espécie?
Essas cinco questões têm, segundo Chomsky, uma rica tradição e constituem
problemas clássicos na reflexão sobre a linguagem (Chomsky, 1991; Chomsky &
Lasnik, 1993). Para resgatar essa tradição, Chomsky traça a história de cada uma delas e
as associa ao nome de um pensador que contribuiu para sua formulação ou para seu
entendimento. Assim, a questão (2a), sobre a natureza do conhecimento linguístico, é
denominada Problema de Humboldt; a questão (2b), sobre o processo de aquisição do
conhecimento linguístico, é chamada Problema de Platão; a questão (2c), sobre o uso
do conhecimento linguístico, é intitulada Problema de Descartes. As outras duas
questões não são nomeadas por Chomsky, mas, mesmo assim, recebem nomes de
126
pensadores: a questão (2d), sobre a base física e os mecanismos cerebrais relacionados
ao conhecimento linguístico, é chamada Problema de Broca ou Problema de Gall
(Boeckx, 2009a[não consta nas Referências]) e a questão (2e), sobre a origem e a
evolução do conhecimento linguístico na espécie humana, é chamada Problema de
Darwin (Fujita, 2009, Hornstein, 2009, Boeckx, 2009ª [[não constam esta obras nas
Referências]) ou Problema de Wallace (Bickerton, 2014), ou como chamamos neste
livro, Problema de Wallace-Darwin .
Neste capítulo e nos quatro seguintes, abordaremos em detalhe cada uma dessas
questões que orientam a pesquisa em Gramática Gerativa. O objeto deste capítulo é
discutir a primeira questão: o Problema de Humboldt.
Sobre a natureza do conhecimento linguístico: o problema de Humboldt
As pessoas – independentemente de fatores sociais como idade, gênero, grau de

instrução e classe social – sabem muitas coisas sobre sua língua materna. O simples fato
de essas pessoas terem adquirido uma língua faz com que elas tenham conhecimento
dessa língua. Nós, por exemplo, sabemos muitas coisas sobre o português brasileiro.
Esse saber inclui as seguintes informações:
(3) a. A sequência de sons [sm] é permitida, mas não em uma mesma sílaba.
b. A forma estudavariam não é uma flexão possível para o verbo estudar.
c. As palavras o e trabalho podem se combinar na ordem [o trabalho], mas
não na ordem [trabalho o].
d. A oração O ministro demitiu-se é diferente (em vários aspectos) da oração
Demitiu-se o ministro.
e. A oração O rapaz só leu o livro do Chomsky pode ter mais de uma
interpretação.
O nosso saber linguístico nos permite produzir e entender um número

potencialmente infinito de expressões da língua. Além disso, podemos reconhecer em
um conjunto de sequências (de sons, de morfemas ou de palavras) aquelas que
constituem expressões da língua e aquelas que não constituem. Em outras palavras,
127
temos a capacidade de reconhecer sequências gramaticais e sequências agramaticais.
Esse saber linguístico é o que Chomsky denomina competência linguística (Chomsky
1965, 1986). É importante destacar que a competência linguística existe,
independentemente de termos consciência dela ou não. Trata-se de um saber
inconsciente, um conhecimento intuitivo que todo falante tem sobre sua língua.
O Problema de Humboldt se coloca como uma questão sobre a natureza do
conhecimento que uma pessoa tem das propriedades de sua língua (sua competência
linguística). Esse problema pode ser formulado como a seguir:
(4) Problema de Humboldt

Em que consiste o conhecimento linguístico do falante de uma língua
particular que lhe permite produzir e entender as expressões dessa língua?
De acordo com Chomsky (1988, 1991), o Problema de Humboldt tem

importância central na investigação sobre a linguagem, uma vez que ele é logicamente
anterior aos demais. Dessa forma, a resposta dada a esse problema estará na base da
resposta a ser dada aos outros quatro problemas, ou seja, para responder ao Problema de
Platão, ao Problema de Descartes, ao Problema de Broca-Gall e ao Problema de
Wallace-Darwin, é necessário termos alguma ideia do conteúdo do sistema de
conhecimento linguístico que uma pessoa possui.
Conforme mencionamos na seção anterior, cada uma das questões que motivam
a pesquisa em gramática gerativa tem uma história dentro dos estudos sobre a
linguagem. A investigação sobre a natureza do conhecimento da linguagem, por
exemplo, se beneficiou muito das ideias de pensadores como Galileu Galilei, René
Descartes, Antoine Arnauld, Claude Lancelot, Wilhelm von Humboldt, Charles Darwin,
Otto Jespersen e muitos outros (ver Chomsky, 1964, 2000, 2006, 2009, 2016 [não
constam estas datas nas Referências]). Desses intelectuais, Humboldt, em seus estudos
sobre a linguagem, traz duas ideias que constituem contribuições importantes para a
compreensão da natureza do conhecimento linguístico. Uma de suas contribuições está
relacionada à concepção da linguagem como um sistema que “faz emprego infinito de
meios finitos” (Humboldt, 1988: 91[não consta nas Referências]). A sua outra
contribuição refere-se à caracterização da linguagem não como um produto morto
(ergon), mas como uma atividade (energeia) – como vemos em Humboldt (1988: 48-
128
49). Em suas palavras, a linguagem é “um ato, uma performance verdadeiramente
criativa da mente” (Humboldt, 1988: 183).
Chomsky vai aproveitar essas duas ideias para construir a sua resposta ao
Problema de Humboldt. Vejamos de que forma ele faz isso.
Observando o esquema (1) e lembrando que o problema de Humboldt é uma
questão acerca de um sistema de conhecimento particular, o conhecimento da
linguagem, concluímos que esse problema se volta a investigar um dos estados da
Faculdade da Linguagem – o estado L (SL). Esse estado corresponde a uma gramática
mental entendida como um sistema de conhecimento gramatical representado
internamente na mente/no cérebro de uma pessoa. Tal sistema de conhecimento
gramatical, o saber linguístico, reflete a competência linguística de um falante nativo.
A resposta ao Problema de Humboldt é dada, portanto, com a formulação de
uma gramática, ou seja, uma teoria do estado da mente/do cérebro de uma pessoa que
tem uma língua particular L. Apenas formular uma gramática não é o bastante. Essa
gramática precisa ser uma gramática gerativa, ou seja, uma gramática explícita, formal,
precisa (Chomsky, 1957, 1965, 1986).
A gramática de uma língua particular é composta de um léxico e de um sistema
finito de regras e princípios que atua de modo recursivo para a geração de um conjunto
ilimitado de expressões estruturadas hierarquicamente (cf. Chomsky, 1995, 2001, 2010,
2013, 2014, 2015, 2016[não constam estas datas nas Referências]; Berwick e Chomsky,
2016). Nessa caracterização da gramática gerativa de uma língua como um sistema
finito, Chomsky incorpora a ideia de Humboldt de que a linguagem faz “uso infinito de
meios finitos”. Os meios finitos correspondem, na interpretação de Chomsky, às
gramáticas gerativas propostas para as línguas particulares. Esse sistema deve ser finito,
pois ele é parte do cérebro que, por sua vez, é um órgão de dimensões finitas.
Ao afirmar que a gramática é um sistema que atua de modo recursivo, Chomsky
evoca, mais uma vez, a ideia de “uso infinito de meios finitos”. Enquanto o sistema de
regras e princípios é finito, seu modo de operar é potencialmente infinito, permitindo
que a pessoa que conhece uma língua possa produzir e entender sentenças novas sem
nenhum problema. Em outras palavras, a capacidade gerativa do sistema de
conhecimento linguístico de uma pessoa não tem limites.
Finalmente, ao caracterizar a gramática de uma língua como um procedimento
gerativo que gera um conjunto ilimitado de expressões, Chomsky, mais uma vez, está
fazendo referência à ideia de Humboldt de linguagem como atividade. As línguas não
129
são conjuntos de produtos, de dados linguísticos; pelo contrário, as línguas são um
procedimento gerativo que produz expressões linguísticas.
Dada essa resposta geral ao Problema de Humboldt, na próxima seção,
mostraremos como se organizam internamente as gramáticas gerativas propostas em
dois momentos da teoria, a saber, na Teoria Padrão e na Teoria de Princípios e
Parâmetros.
A gramática como um sistema de regras
Os primeiros trabalhos de Chomsky já demonstravam uma clara preocupação

com o Problema de Humboldt. Esses trabalhos se caracterizam por um esforço de
elaboração de (fragmentos de) gramáticas de descreviam a competência linguística dos
falantes. A gramática de uma língua, nesse primeiro momento da teoria conhecido como
Teoria Padrão (ver capítulo “Teoria Padrão e Teoria Padrão Estendida”, neste volume),
era concebida como um sistema computacional composto de um conjunto finito de
regras e de um léxico finito.
As regras de estrutura sintagmática são mecanismos que produzem
marcadores/indicadores sintagmáticos. Em (5), são apresentadas algumas regras que
caracterizam a estrutura sintagmática do português. Contudo, as regras a seguir estão
simplificadas. Nelas, por exemplo, omitimos o símbolo Aux que se reescreve como a
flexão verbal e como o constituinte formado da combinação dos verbos auxiliares com
os morfemas das formas nominais que os acompanham. Também não desenvolvemos
plenamente o VP nem o NP, nem apresentamos a estrutura do sintagma adjetival (AdjP)
nem a do sintagma preposicional (PP) – para uma descrição mais completa das regras de
estrutura sintagmática do português, recomendamos a leitura de Perini (1976), Lobato
(1986), Lemle (1984).
(5) a. S → NP VP
b. VP → V
c. NP → Det N
d. V → chorou
e. N → bebê
f. Det → o
130
Nas regras em (5), podemos ver que há um símbolo à esquerda da seta e pelo
menos um símbolo à direita dela. Os símbolos que aparecem à esquerda são expandidos
ou reescritos como o(s) símbolo(s) que aparece(m) à direita. Por exemplo, em (6a), o
símbolo S (sentença) é reescrito/expandido como NP (sintagma nominal) seguido de VP
(sintagma verbal). Cada um desses símbolos também vai ser reescrito: o NP como (6c) e
o VP como (6b). A reescrita desses símbolos acontece ordenadamente, sendo uma de
cada vez. O processo de reescrita continua enquanto houver símbolos não terminais, ou
seja, símbolos que aparecem à esquerda da seta e que, portanto, podem ser reescritos.
No conjunto de regras em (6), são não terminais os símbolos: S, NP, VP, N, V, Det. O
processo de reescrita cessa quando se chega aos símbolos terminais, aqueles com os
quais termina o processo de reescrita. São terminais os itens lexicais o, bebê e chorou.
As regras que introduzem símbolos não terminais são responsáveis por garantir
propriedades estruturais como ordem de palavras e organização das palavras em
unidades sintagmáticas (constituência). Já as regras que introduzem símbolos terminais
são denominadas regras de inserção lexical.
Para a derivação da estrutura sintagmática, parte-se do símbolo S, que, por ser o
elemento a partir do qual o processo de reescrita começa, denomina-se símbolo inicial.
Depois, utilizam-se as regras para reescrever os símbolos não terminais até que se
chegue ao final da derivação, ou seja, quando não for mais possível reescrever nem mais
um símbolo. A derivação da estrutura sintagmática de uma oração como O bebê chorou
é a seguinte:
(6) Linha 1: S
Linha 2: NP VP
Linha 3: Det N VP
Linha 4: Det N V
Linha 5: o N V
Linha 6: o bebê V
Linha 7: o bebê chorou
Partindo de (6), é possível associar cada símbolo com o(s) símbolo(s) que o
rescreve(m). Fazendo isso, tem-se a representação da derivação na forma de árvore (7a),
a qual pode ser simplificada como (7b), excluindo-se os símbolos repetidos:
131
(7) a. S b. S
3 3
NP VP NP VP
2 | 2 |
Det N VP Det N V
| | | | |
| o bebê chorou
Det N V
| |
|
o N V
| |
|
o bebê V
| |
|
o bebê chorou
Apesar de seu poder, as regras sintagmáticas não eram capazes de, sozinhas,
produzir todas as estruturas da língua. Uma oração como (8), por exemplo, não poderia
ser gerada por meio de uma regra sintagmática:
(8) Quantos livros a Maria leu?
Nessa oração, aparece o sintagma quantos livros, que é interpretado como o

objeto direto do verbo leu. Esse sintagma, no entanto, não aparece na posição típica de
objetos. Para garantir a interpretação de quantos livros como objeto de leu, assume-se
que (8) é formada a partir da aplicação das regras de estrutura sintagmática, cujo
resultado é a representação como (9):
(9) A Maria leu quantos livros?
Dessa forma, assegura-se a interpretação de quantos livros como o objeto de leu,

porém, perde-se a ordem linear, uma vez que, em (9), o sintagma quantos livros não
aparece na posição pós-verbal, mas antes do sujeito. Como manter a interpretação e, ao
mesmo tempo, permitir a ordem linear em que os constituintes aparecem na oração?
Para casos como esse, é necessária a postulação de um tipo de regra que atue
sobre uma estrutura sintagmática já formada, manipule essa estrutura e produza outra
estrutura sintagmática. Tal regra é uma transformação (que já foi discutida no capítulo
132
Estruturas Sintáticas e a reinvenção da teoria linguística, neste volume). No caso da
oração em (9), teríamos o seguinte:
(10) a. A Maria leu quantos livros?

b. A Maria leu quantos livros ?
Transformação
c. Quantos livros a Maria leu?
Em (10a), temos a representação gerada a partir das regras de estrutura

sintagmática. Sobre essa representação, vai operar uma transformação responsável por
deslocar o sintagma interrogativo quantos livros para o início da oração, como se vê em
(10b), e, como consequência, vai produzir uma nova representação sintagmática (10c).
Importante destacar que essa não era a única transformação possível. Havia um
conjunto de transformações propostas para construções particulares e para línguas
particulares. A transformação aplicada em (10b) é denominada Deslocamento de
sintagma interrogativo (Deslocamento Qu-), que acontece em construções interrogativas
e é específica ao português (e outras línguas). Além disso, na tipologia das
transformações, havia transformações obrigatórias e transformações opcionais, como
discutido no capítulo “Estruturas sintáticas e a reinvenção da teoria linguística”. A
transformação Deslocamento Qu- é uma transformação opcional, ou seja, ela pode ser
aplicada ou não a uma representação. Se ela for aplicada a (10b), produzirá (10c) como
resultado. Se ela não for aplicada a (10b), produzirá uma sentença com o sintagma
interrogativo in situ (A Maria leu quantos livros?).
Com isso, temos ilustrada, de maneira breve, a primeira tentativa de descrever o
conteúdo da competência linguística de um falante. De acordo com essa proposta, a
gramática é um sistema gerativo composto de um conjunto finito de regras e de
transformações.
Um último ponto que merece ser discutido é o lugar da recursividade nesse
modelo de competência. Como se formaliza a propriedade das línguas humanas de
poderem operar infinitamente e produzirem expressões potencialmente infinitas em sua
extensão? Por exemplo, como especificar a possibilidade de, a partir de (11a), podermos
produzir (11b) e, a partir de (11b), podermos produzir (11c)?
(11) a. O João tinha comido o bolo.

133
b. A Maria disse que o João tinha comido o bolo.
c. A Ana acha que a Maria disse que o João tinha comido o bolo.
Na Teoria Padrão, há duas maneiras de pensarmos o lugar da recursividade. Em

Chomsky (1955/1975[não consta esta data nas Referências], 1957), as regras de
estrutura sintagmática só produzem sentenças simples. Cabe às transformações
generalizadas o papel de combinar sentenças simples e formar sentenças mais
complexas. Ou seja, as transformações generalizadas respondem pela recursividade da
linguagem. Em Chomsky (1965), há uma revisão da sua proposta anterior e a
recursividade passa a fazer parte das regras de estrutura sintagmática. Assim, além da
regra (5a), renumerada como (12a), o sistema de regras passaria a ter também uma regra
de estrutura sintagmática que reescreve o VP como se vê em (12b):35
(12) a. S → NP VP
b. VP → V S
O que se vê é que o símbolo S aparece tanto à esquerda da seta como à sua

direita. A consequência é que, agora, uma oração pode aparecer encaixada dentro de um
VP, que por sua vez é parte de outra oração. Com isso, garante-se a recursividade.
Com esse sistema de regras e transformações, a gramática proposta pelos
linguistas se aproximava do ideal de adequação descritiva proposto por Chomsky
(1965), segundo o qual uma gramática descritivamente adequada é aquela que descreve
plenamente a competência linguística do falante.
Um sistema de princípios e parâmetros
Como vimos na seção anterior, um sistema de conhecimento linguístico

composto de regras e de transformações servia muito bem ao ideal de adequação
descritiva. No entanto, Chomsky (1965) já havia proposto que a gramática deveria
satisfazer duas condições de adequação: a adequação descritiva e a adequação
explicativa. Já vimos que a adequação descritiva é atingida quando a gramática proposta
representa o conhecimento gramatical do falante. A adequação explicativa, por sua vez,
é atingida quando se explicita de que modo línguas particulares podem ser adquiridas a
partir de um mesmo estágio inicial da Faculdade da Linguagem.
134
Uma consequência imediata do sistema de regras e transformações foi uma
inflação de regras e de transformações, postuladas para línguas particulares e para
construções particulares. Com toda essa variedade e complexidade, a adequação
explicativa estava ficando comprometida, pois as gramáticas postuladas eram tão
distintas que se tornava quase impossível encontrar alguma propriedade em comum
entre os diversos sistemas linguísticos postulados. Ou seja, ficava difícil mostrar de que
forma o estado inicial da Faculdade da Linguagem poderia se desenvolver e dar origem
aos sistemas propostos.
A saída encontrada para satisfazer essas duas condições de adequação foi
repensar a organização da Gramática Universal de modo a reduzir o sistema de regras e
o de transformações, buscando abstrair desses sistemas propriedades mais gerais e
atribuí-las ao estágio inicial da Faculdade da Linguagem.
Com esse pensamento, analisou-se criticamente a necessidade de um sistema
com regras de estrutura sintagmática e notou-se que o seu papel era redundante, pois, de
certa forma, já estava previsto na informação dos itens lexicais. Como a informação
lexical não podia ser descartada, o passo lógico foi abandonar as regras de estrutura
sintagmática. Assim, a estrutura sintagmática passou a ser construída a partir da
projeção das informações lexicais na sintaxe.
As regras transformacionais também foram examinadas com cuidado e, apesar
de não serem redundantes, elas foram reduzidas a uma única regra, Mova α, segundo a
qual qualquer constituinte poderia se mover para qualquer lugar a qualquer momento.
Surge, assim, a Teoria de Princípios e Parâmetros (cf. Chomsky, 1981, 1986, 1988,
Chomsky e Lasnik, 1993, além do capítulo “Teoria da Regência e Ligação e a proposta
de Princípios e Parâmetros”, neste volume), uma nova visão da arquitetura da
gramática, de acordo com a qual o estado inicial da Faculdade da Linguagem é um rico
e complexo sistema composto de um conjunto de princípios e de parâmetros. Os
princípios não precisam ser adquiridos, pois fazem parte do estado inicial da Faculdade
da Linguagem. Os parâmetros, por sua vez, delimitam o espaço de variação
translinguística permitido e seus valores são fixados com base na experiência
linguística.
A ideia por trás da proposta de Princípios e Parâmetros é a de que uma grande
parte do nosso conhecimento da linguagem é inata. Com essa proposta, pela primeira
vez se reduz a tensão entre a adequação descritiva e a adequação explicativa.
135
Os princípios se organizam em módulos da linguagem (ou subteorias) que
interagem para filtrar estruturas malformadas. Os módulos da linguagem são os
seguintes:
(13) Módulos da linguagem
a) Teoria X-Barra: módulo que se volta à construção das estruturas

sintagmáticas.
b) Teoria Temática: módulo que se relaciona com a estrutura argumental
de predicados e com a sua representação na sintaxe.
c) Teoria do Caso: módulo que define posições em que o Caso é atribuído
e de como esse caso é realizado.
d) Teoria da Ligação: módulo que especifica possíveis domínios em que
podem se dar relações de co-referência entre constituintes nominais.
e) Teoria da Fronteira: módulo que trata das condições que regem os
deslocamentos sintáticos.
f) Teoria da Regência: módulo que se ocupa das relações entre núcleos e
constituintes dependentes deles.
g) Teoria do Controle: módulo que especifica as possibilidades
interpretativas de PRO, sujeito de orações sem tempo.
Assim, uma língua particular é definida como a combinação dos princípios

inatos e da escolha específica das possíveis marcações paramétricas. Os princípios são
as regras válidas para todas as línguas naturais. Um exemplo clássico de princípio
linguístico é a marcação de tempo. Todas as línguas possuem indicação de tempo
gramatical (tense), pelo menos de presente e passado, seja esse tempo linguístico
codificado no verbo da sentença, como em português, ou através de advérbios, como em
mandarim, ou através de outros mecanismos existentes na linguagem humana. Esse
princípio faz parte do módulo da Teoria X-barra. Na Teoria Padrão, o tempo verbal era
representado juntamente com o verbo, dentro do sintagma verbal. Na Teoria de
Princípios e Parâmetros, o tempo verbal ganha destaque, e sua flexão passa a ser o
núcleo da sentença.
Um exemplo clássico de parâmetro é o parâmetro do sujeito nulo: as línguas
naturais podem ou não permitir que o sujeito não seja expresso foneticamente na
136
sentença. Por exemplo, a língua inglesa tem o valor negativo atribuído para esse
parâmetro; por isso, uma sequência sem o sujeito ser pronunciado, em inglês, é
agramatical, como *ate pizza yesterday. Para que a sentença seja gramatical na língua
inglesa, o falante tem de, necessariamente, expressar o sujeito: I ate pizza yesterday. O
português brasileiro tem o valor positivo atribuído ao parâmetro do sujeito nulo, o que
quer dizer que, em português, uma sentença sem o sujeito expresso foneticamente,
como Fui ao shopping ontem, é gramatical.
Na Teoria de Princípios e Parâmetros, a Gramática Universal é composta por
princípios universais a todas as línguas e parâmetros que, como vimos, são regras que
serão fixadas, isto é, que adquirirão o valor positivo ou negativo de acordo com a língua
natural que a criança esteja em contato. Quando a criança tiver os parâmetros da sua
língua fixados, ela terá adquirido a gramática de uma língua natural e chegado ao estado
final da aquisição linguística (SL).
Após o modelo de Princípios e Parâmetros, a teoria gerativa iniciou uma nova
fase, o Programa Minimalista (Chomsky, 1995), vigente até hoje. O Programa
minimalista, conforme o nome sugere, busca uma descrição explícita e econômica da
linguagem. O novo programa se baseia no modelo de princípios e parâmetros, mas tem
como objetivo buscar os princípios de economia que se aplicam a representações e a
derivações linguísticas. Chomsky e demais pesquisadores do Programa Minimalista
buscam uma teoria econômica e precisa que explique o estágio inicial da faculdade da
linguagem e descreva adequadamente os fenômenos linguísticos das diferentes línguas
particulares. O que todas as fases da teoria gerativa têm em comum é o léxico. O léxico
é parte imprescindível da gramática e da linguagem, conforme veremos na próxima
seção.
O léxico
O problema de Humboldt – em que consiste o conhecimento linguístico do

falante de uma língua particular – foi parcialmente respondido até aqui. A gramática
está na mente do falante e é um sistema finito de regras que pode gerar infinitas
expressões linguísticas. Mas com o que opera essa gramática? A gramática opera com
itens lexicais. Itens lexicais constituem o léxico mental humano. O conceito de “léxico
mental” pode ser entendido como um “dicionário mental” onde estariam as informações
sobre o significado das palavras na mente do falante. Esse conceito foi aprimorado, e o
137
léxico não é considerado apenas um repertório de palavras. No léxico mental, os itens
lexicais compreendem características sintáticas, semânticas e de forma das palavras
(forma fonológica e até mesmo forma ortográfica, no caso das línguas que contam com
sistemas de escrita e para falantes escolarizados), cf. Jackendoff (2002). Dessa maneira,
o conhecimento linguístico do falante, a gramática de uma língua particular, é composto
por um sistema finito de regras que pode gerar infinitas expressões linguísticas e
também é composto pelo léxico, conjunto de itens lexicais e suas propriedades.
A teoria gerativa chomskyana desenvolveu modelos de gramática que operam
com itens lexicais para explicitar a competência linguística do falante, como vimos
anteriormente. Na passagem do Modelo Padrão para o modelo de Princípios e
Parâmetros, houve a análise crítica das regras de estrutura sintagmática (SN  Det N,
por exemplo) e notou-se uma redundância, posto que informações sobre estruturas
sintagmáticas já estariam codificadas nos itens lexicais. Assim, desde o modelo de
Princípios e Parâmetros entende-se que a estrutura sintagmática é construída a partir da
projeção das informações lexicais na sintaxe. Além da estrutura sintagmática, o léxico
contém outras informações sobre cada item lexical, como a categoria de cada palavra
(se é um verbo, um nome, um adjetivo) e demais características sintáticas e semânticas
daquele item lexical. Além disso, o léxico também contém todas as informações
irregulares e que devem ser memorizadas de uma língua (por exemplo, em português
brasileiro, que o particípio do passado do verbo imprimir é irregular: impresso, e não
imprimido). Cada entrada lexical, isto é, cada item lexical (palavra), contém, pelo
menos, as seguintes informações:
(14) Informações lexicais
significado da palavra
categoria sintática da palavra (N, V, Adj etc.)
pronúncia da palavra
estrutura argumental da palavra
informações excepcionais dos mais variados tipos (como
irregularidades morfológicas)
Fonte: Carnie, 2006: 225.
Quando aprendemos uma nova palavra, memorizamos todas as informações

listadas na tabela acima sobre aquela palavra, além de sua forma gráfica (a depender da
escolaridade do falante). As informações sobre a estrutura argumental de cada item
138
lexical são chamadas na teoria gerativa de informações de subcategorização. O conceito
de estrutura argumental demonstra uma relação estreita entre sintaxe e semântica, pois
na estrutura argumental de uma palavra temos os argumentos exigidos por essa palavra
e seus respectivos papéis semânticos. Os papéis semânticos (ou temáticos) dizem
respeito à função semântica que os argumentos desempenham nas orações. Por
exemplo, a função semântica de agente, aquele que pratica a ação, pode ser atribuída a
um dos argumentos exigidos por um verbo em uma dada sentença. Vejamos um
exemplo de informações de um item lexical armazenado no léxico mental de um falante
do português brasileiro:
(15) Informações sobre o item lexical beber
- beber
significado da palavra 1. Ingerir algo líquido, tomar algo

2. Tomar ou ingerir bebida alcoólica
categoria sintática da palavra V – verbo
(N, V, Adj etc.)
pronúncia da palavra /bebeɾ/
estrutura argumental da Verbo transitivo direto
palavra V – NP (agente/experienciador), NP (objeto)
Verbo intransitivo
V – NP (agente)
informações excepcionais dos - verbo regular da terceira conjugação (verbos
mais variados tipos (como terminados em -er)
irregularidades morfológicas)
Vemos na tabela as informações do item lexical beber. Na entrada lexical de

beber estão codificadas duas possibilidades de estrutura argumental desse verbo. Ele
pode ser transitivo direto e exigir dois argumentos, um NP sujeito, com papel temático
de agente, aquele que bebe, e um NP objeto, a bebida ingerida. Assim, na estrutura
argumental armazenada no léxico para o verbo beber, temos a estrutura sintagmática e
os papéis semânticos a serem distribuídos a seus argumentos. O verbo beber também
pode ser empregado como verbo intransitivo, com um sentido diferente, o de beber
bebida alcoólica (por exemplo: O João anda bebendo demais). Dessa forma, também
está codificada no léxico a estrutura argumental desse segundo significado possível,
139
com um argumento, um NP sujeito agente, aquele que bebe bebidas alcoólicas. Esse é
um exemplo de uma entrada lexical do português brasileiro, para entendermos que
informações relevantes à estrutura da sentença estão codificadas nos itens lexicais
armazenados em nosso léxico mental.
Chomsky (1982) postula o Princípio da Projeção Lexical:
(16) Princípio da Projeção Lexical:36

Informações dos itens lexicais (tais como subcategorização e papéis temáticos)
são sintaticamente projetadas na estruturação das sentenças.
O Princípio da Projeção Lexical é o princípio que estabelece que a estrutura

inicial da sentença é projetada a partir do léxico. Essa estrutura satisfaz as propriedades
temáticas e de subcategorização dos itens lexicais. Dessa forma, uma sentença projetada
do verbo beber pressupõe um NP sujeito agente e um NP objeto para ser uma sentença
gramatical, isto é, bem formada, em português brasileiro.
O léxico mental é, então, parte fundamental do conhecimento linguístico de um
falante de uma língua particular. Tanto o sistema de regras sintagmáticas, quanto as
informações específicas dos itens lexicais de uma língua estão na mente e constituem a
capacidade da linguagem humana.
Considerações finais
O problema de Humboldt é a base do que é investigado pela ciência da

linguagem, a saber, o que é a faculdade da linguagem humana. Chomsky (1957, 1986)
se propôs a responder a esse problema: o que sabe o falante de uma língua particular
quando dizemos que ele sabe uma língua? A reposta, como vimos, é ao mesmo tempo
simples e complexa. A resposta é simples se pensarmos que o falante tem armazenado
em sua mente/cérebro um léxico mental, isto é, itens lexicais que são as palavras e
expressões de uma língua qualquer L, e um conjunto finito de regras que ordena e
organiza esses itens em sentenças e estruturas maiores. Por outro lado, a resposta é
complexa se pensarmos que o falante pode gerar, em posse de ambos os mecanismos (o
léxico e o conjunto de regras), um conjunto infinito de expressões linguísticas
perfeitamente entendíveis por seu ouvinte. Dessa forma, a teoria linguística deve ser
capaz de descrever as formas linguísticas de uma dada língua e explicar não só como a
140
criança as adquire e as produz, assim como o ouvinte é capaz de entendê-las mesmo
sem, muitas vezes, nunca as ter ouvido antes. Por isso, a teoria linguística é composta de
subáreas, que foram ao longo do tempo se dividindo entre os problemas discutidos neste
livro. A área teórica da linguística busca descrever e explicar o que é o conhecimento
linguístico dos falantes, a área de aquisição da linguagem explica como as crianças
adquirem uma língua, a área de processamento da linguagem explica como ela é posta
em uso, a Neurolinguística busca descrever os mecanismos neurais envolvidos no
processamento da linguagem e, ainda, há linguistas que trabalham em um ramo
evolucionista e buscam explicar como a linguagem evoluiu na espécie humana.
Quando uma pessoa sabe uma língua, ela tem uma gramática interna daquela
língua em sua mente. Essa gramática é composta por regras que são universais a todas
as línguas, os princípios, e por regras que são específicas daquela língua, os parâmetros.
Ainda, faz parte dessa gramática interna o léxico daquela língua, que também possui
características universais como, por exemplo, as informações armazenadas nas entradas
de cada item lexical e informações específicas como o significado e a estrutura de
palavras e expressões daquela língua em particular.
Referências
BICKERTON, D. More than nature needs: Language, mind, and evolution. Cambridge, MA: Harvard
University Press, 2014.
BERWICK, R.C.; CHOMSKY, N. Why only us: language and evolution. Cambridge, MA: MIT Press, 2016.
CARNIE, A. Syntax: a generative introduction. 2nd ed. Blackwell Publishing Ltd, Malden, MA, 2006.
CHOMSKY, N. Syntactic structures. The Hague: Mouton, 1957.
______. Aspects of the theory of syntax. Cambridge: The MIT Press, 1965.
______. Cartesian Linguistics. New York: Harper and Row, 1966.
______. Language and Mind. New York: Harcourt Brace and World, Inc, 1968.
______. The Case Against B. F. Skinner. The New York Review of Books, dez. 1971.
______. Rules and Representations. New York: Columbia University Press and Oxford: Basil Blackwell
Publisher, 1980.
______. Knowledge of language: its nature, origin and use. New York: Praeger, 1981.
MIT Press, 1982.
______. Knowledge of Language: its nature, origin and use. New York: Praeger, 1986.
______. Language and problems of language – the Managua lectures. Cambridge: MIT Press, 1988.
______. The Minimalist Program. MIT Press, 1995.
______. New Horizons in the Study of Language and Mind. Cambridge University Press, 2000.
141
______. Derivation by Phase. In: KENSTOWICZ (ed.). Ken Hale: a Life in Language, Cambridge, MA:
MIT Press, 2001, pp. 1-52.
______. Beyond Explanatory Adequacy. In: BELLETTI, A. (ed.). Structures and Beyond. Oxford: Oxford
University Press, 2004, pp. 104-31.
______. Three Factors in Language Design. Linguistic Inquiry, 36: 1, winter 2005, pp. 1-22.
______. Approaching UG from Below. In: SAUERLAND, U.; GÄRTNER, H.-M. (eds.). Interfaces +
recursion = language? Chomsky’s minimalism and the view from syntax-semantics. Berlin: Mouton
de Gruyter, 2007 p. 1-29.
______. On Phases. In: FREIDIN, R.; OTERO, C.P.; ZUBIZARRETA, M.-L. (eds.). Foundational Issues in
Linguistic Theory: Essays in Honor of Jean-Roger Vergnaud. Cambridge, MA: MIT Press, 2008, pp.
133-66.
______. Some Simple Evo Devo Theses: How True Might they be for Language? In: LARSON, R.;
DEPREZ, V.; YAMAKIDO, H. (eds.). The Evolution of Human Language: Biolinguistic Perspectives.
Cambrdge: Cambridge University Press, 2010, pp. 45-62.
______. Problems of projection. Lingua, 130, pp. 33-49, 2013.
HAEGEMAN, L. Introduction to Government and Binding Theory. 2nd ed. Blackwell, Oxford, 1994.
JACKENDOFF, R. Foundations of Language. , New York: Oxford University Press, 2002.
LEMLE, M. Análise sintática: teoria geral e descrição do português. São Paulo: Ática, 1984.
LOBATO, L. M. P. Sintaxe gerativa do português: da Teoria Padrão à Teoria da Regência e Ligação. Belo
Horizonte: Vigília, 1986.
MIOTO, C.; SILVA, M. C. F.; LOPES, R. Novo Manual de Sintaxe. São Paulo: Contexto, 2013. PERINI,
Mário. A gramática gerativa: introdução ao estudo da sintaxe portuguesa. Belo Horizonte: Vigília,
1976.
142
O PROBLEMA DE PLATÃO
Ruth E. V. Lopes
No prefácio ao livro Knowledge of Language, Chomsky (1986) afirma que

sempre se intrigou com o fato de que sabemos muito a despeito de termos evidências
limitadas, um quebra-cabeça a que chamou de Problema de Platão, em homenagem ao
diálogo, escrito por Platão, entre Sócrates e Mênon. Nele, através de Sócrates, Platão
sugere que nada aprendemos, antes recordamos conceitos já conhecidos através de
nossa alma. Sócrates desenvolve essa ideia mostrando que um escravo de Mênon era
capaz de demonstrar conhecimento geométrico, sem nunca ter sido ensinado.
Chomsky (1986: xxv) diz:
A essência do problema de Platão foi muito bem expressa por Bertrand

Russell em seus trabalhos mais tardios ao levantar a questão: ‘como pode ser
que os seres humanos, cujo contato com o mundo é breve, pessoal e limitado,
consigam saber tanto quanto sabem?’ [...] O problema que surge quando se
examina a questão com cuidado é o da “pobreza de estímulo”. Embora
nossos sistemas cognitivos certamente reflitam nossa experiência de alguma
forma, uma especificação cuidadosa sobre as propriedades desses sistemas,
por um lado, e, por outro, sobre a experiência que levou à sua formação,
mostra que ambas as coisas estão separadas por uma lacuna considerável, na
realidade, um abismo. O problema é como dar conta da especificidade e da
riqueza dos sistemas cognitivos que emergem no indivíduo com base na
parca informação disponível.
Chomsky continua, então, discutindo como a emergência desses sistemas

cognitivos resulta da interação entre a experiência e a forma como o organismo os
constrói e lida com eles. A questão que se coloca, pois, é como determinar o que é parte
de uma dotação inata, genética, que serve para acomodar a lacuna entre a experiência e
o conhecimento adquirido.
Note-se que o autor fala em sistemas cognitivos – no plural –, pois os toma
como modulares, ou seja, capazes de lidar apenas com o tipo de informação relevante
143
para si. Isso o afasta, portanto, de modelos que preconizam a existência de mecanismos
gerais de inteligência e desenvolvimento.
Chomsky (1983 [não consta esta data nas Referências]) dizia: “Podemos
começar por tentar delimitar certos domínios cognitivos, cada um deles regido por
algum sistema integrado de princípios. É então perfeitamente legítimo considerar a
linguagem como sendo um desses domínios, embora estejam por determinar os seus
limites exatos e suas relações com outros domínios” (1983: 52) Este último ponto, os
limites do domínio linguístico e suas relações com outros sistemas cognitivos, continua
na pauta do dia, especialmente a partir da Biolinguística, ponto de que, contudo, não
trataremos aqui, ao menos diretamente.
No texto de 1986, Chomsky tenta mostrar ao leitor por que a linguagem seria de
particular interesse para essa visão, pois se trata de uma propriedade da nossa espécie e
apenas da nossa, além de ser central para o pensamento humano. Mas como colocar
uma hipótese tão forte a teste? Em inúmeros textos Chomsky, entre tantos outros
autores, mostra o caminho a percorrer (conferir, por exemplo, 1983: 52-54; 1986: xxv-
xxvi): (i) observando o desenvolvimento de um indivíduo a partir de um estágio inicial,
segundo a hipótese, geneticamente determinado; (ii) observando os estágios pelos quais
esse indivíduo – uma criança pequena – passa até atingir um estágio estável, próximo
àquilo que se encontra na comunidade linguística ao seu redor; (iii) observando que,
durante esse processo, a criança vai passar por estágios não previstos em sua gramática
alvo, mas possíveis em outras línguas naturais; (iv) observando o conhecimento
adquirido – português brasileiro, kaingang, pirahã etc. que, assim, evidenciaria a gama
de possibilidades bastante restrita de variação entre as línguas naturais.
Um último fator a ser acrescentado é o exame do que, de fato, há como
evidência para a criança: do inexistente ou escasso ao abundante e qual o impacto disso
sobre o processo de aquisição da linguagem – ou, melhor dizendo, da aquisição da
gramática de uma língua (sua fonologia, morfologia, sintaxe e semântica).
Ao longo do empreendimento gerativista, essa tarefa empírica vem sendo
desenvolvida. E um ponto nos leva a conhecer melhor o outro: quanto maior for a base
empírica envolvida, mais se conhecerá. E há, atualmente, um enorme conhecimento
sobre inúmeras línguas, aparentadas ou não, apontando para especificidades, mas,
sobretudo, apontando para processos comuns, universais. Da mesma forma, quanto mais
se estuda o desenrolar da aquisição da gramática (fonologia, morfologia, sintaxe e
semântica), mais se percebe quão uniformes e universais são os caminhos que a criança
144
trilha no percurso, independentemente da língua que está adquirindo – para um
panorama da área, ver Guasti (2002) e Lust (2006), entre tantos outros; para um
panorama sobre o português, ver Freitas e Santos (2017).
O problema de Platão leva, assim, à postulação de uma Faculdade da Linguagem
(FL) – um sistema cognitivo inato dedicado única e tão somente à linguagem – e à
Gramática Universal (GU) – uma teoria do estado inicial da FL. Um dos pontos
essenciais em relação à GU é a necessidade de estar exposta a uma (ou várias) língua(s)
para que possa formatar o conhecimento linguístico de uma língua particular (ou
várias), levando a FL a um estado estável, próximo àquele dos adultos ao redor da
criança.
A questão que este capítulo deve enfrentar para discutir como o problema pode
ser equacionado é sobre a natureza da experiência. Antes, porém, é preciso ponderar que
a hipótese é logicamente dependente de uma dada visão de linguagem. Esse é o ponto
(ou um dos pontos) de maior desentendimento em relação ao nativismo gerativista –
sobre esse ponto, ver Chomsky (2015); para uma discussão mais ampla sobre os
problemas em relação ao problema da pobreza de estímulo, ver Guimarães (2017), mais
especificamente o capítulo 5.
Em Chomsky (2015: 92) encontramos: “Por linguagem [...] quero dizer língua-
I[nternalizada], um objeto biológico interno a um indivíduo e considerado em
intensão.37 Ou seja, interessa-nos a natureza mesma do sistema, não apenas suas
manifestações externas”. Ou como o autor afirmou em 2013, “linguagem é sentido com
som (ou outra forma de externalização)”, é “pensamento audível” (2013: 36).
Uma das propriedades da língua-I é se constituir como um sistema de discretude
infinita, ou seja, um sistema capaz de gerar um conjunto infinito de expressões
hierarquicamente estruturadas que receberão uma interpretação semântica e uma
fonológica. Ora, é essa propriedade essencial daquilo que se toma como linguagem que
em si aponta para a limitação da experiência: jamais teremos acesso à totalidade daquilo
que o sistema é capaz de gerar.
Mioto et al. (2013) exemplificam esse ponto através do conjunto de números
pares, levando o leitor a imaginar que a tarefa de uma criança seja a de os adquirir
observando o mundo, tentando encontrá-los entre outros objetos, matemáticos ou não,
chegando a algum deles, como {2, 4, 6, 8, 10, 12…}. Ocorre que esses números
agrupados no conjunto são apenas exemplos de números pares, sendo impossível chegar
145
à totalidade deles, pois o conjunto é infinito, conquanto a experiência da criança com
eles seja finita.
Pode-se imaginar, por outro lado, que o aprendiz, ao invés de contar apenas com
a observação do mundo, pode contar com uma “regra” que o auxilie no processo, tal
como (1):
(1) Um número par é qualquer número resultante da multiplicação de um número

integral por 2: {x: x = 2y, y um integral} [Mioto et al., 2013: 26]
Ora, (1) vai garantir que o aprendiz seja capaz de identificar o número
2.568.253.478 como par, mesmo nunca tendo sido exposto a ele antes; assim como
descartar o número 3.555.789 como possível para ocorrer no conjunto dos números
pares. Em outras palavras, (1) faz com que o aprendiz seja capaz de deduzir que
números podem pertencer ao conjunto dos números pares, independentemente da
eventual experiência que tenha tido com eles.
É com isso em mente que vamos pensar sobre a tarefa de aquisição da
linguagem na seção a seguir.
O que está em jogo
Muitas vezes nos esquecemos de quão complexa é (ou, como veremos, poderia
ser, não fosse uma ajuda da natureza) a tarefa de adquirir uma língua. Chomsky (1998:
1) afirma: “Uma criança, mas não o seu gatinho, categorizará partes da confusão ao seu
redor como ‘linguagem’ e desenvolverá uma capacidade (linguística) rica e altamente
articulada […]”. O que nos interessa aqui são as “partes da confusão ao seu redor”, pois
para adquirir a língua a que está exposta, a criança terá que o fazer através do contínuo
da fala. Tomemos um exemplo, de Santos (2008[não consta nas Referências]), transcrito
em (2b):
(2) a. A Maria acaba usando ovos na receita.

b.
Como a autora aponta, temos, no contínuo, um processo de degeminação

(Maria+acaba = mariacaba), um processo de elisão (acaba+usando = kabu...) e um
146
processo de ditongação em função da altura da vogal final em “usando” (usandu+ovos
=...duo...). E é nesse contínuo que a criança terá que achar a sua língua.
Pesquisas das últimas décadas (ver, entre muitos outros, Jusczyk, 1998) têm
revelado, entretanto, que, desde o nascimento, o bebê exibe predisposições universais
que permitem que possa discriminar qualquer contraste fonético presente em qualquer
língua natural. Mas para que consiga “picotar” o contínuo da fala para adquirir o léxico
de sua língua particular, o bebê terá que perder essa habilidade. Kail (2013) nomeia esse
processo de “o bebê-cidadão do mundo que deve se tornar a criança especializada em
uma língua” (2013: 27).
Suponhamos que, para fazer essa transição, o bebê se utilize de mecanismos
gerais de aprendizagem, como, por exemplo, aprendizagem estatística. Yang (2004)
analisou essa possibilidade com base em Saffran, Aslin e Newport (1996), que propõem
que a segmentação das palavras no fluxo da fala pode ser adquirida através de
probabilidade de transição (PT) entre sílabas adjacentes A e B:
(3) PT(A à B) = P(AB)/P(A), onde P(AB) = probabilidade de B seguir A E P(A) =

frequência total de A
Numa sequência como ‘prettybaby’ (bebê bonito), o bebê teria de calcular a PT

entre pre  tty e ba  by vs. tty  ba. A última é a mais baixa, ou seja, menos
provável do que as anteriores, portanto, o bebê postula uma fronteira de palavra entre
pretty e baby (tty#ba).
Saffran et al. (1996) testaram o modelo em (3) em experimentos com bebês em
torno de 8 meses utilizando-se de ‘línguas’ artificiais em que todas as pseudopalavras
utilizadas continham 3 sílabas e todas as sílabas eram canônicas, ou seja, formadas por
uma consoante e uma vogal (CV). Aparentemente os bebês não demonstraram
dificuldade com a tarefa, mas é oportuno lembrar que Jusczyk (1998), entre outros,
mostra que é justamente a partir dessa idade que os bebês começam a sair da fase
“cidadão do mundo” para se especializar em sua(s) língua(s). Yang (2004), porém, testa
o modelo em um corpus natural de fala dirigida à criança (do CHILDES), contendo
226.178 palavras e 263.660 sílabas, perguntando-se se o modelo de fato consegue
segmentar as palavras a partir da informação estatística sobre a PT entre sílabas. Yang
mediu a precisão do modelo (número de palavras segmentadas corretamente em relação
ao número de todas as palavras extraídas) e o que o autor chama de “recall” (número de
147
palavras corretamente extraídas em relação ao total de palavras no corpus), cujos
resultados são, respectivamente, 41,5% e 23,3%; em outras palavras, mais da metade
das ‘palavras’ extraídas pelo modelo não são palavras da língua (por exemplo, ttyba em
pretty baby, acima) e aproximadamente 80% das palavras do corpus não são
extraídas/segmentadas.
Diferentemente da ‘comportada’ língua artificial testada originalmente, o corpus
natural continha, em média, uma palavra monossilábica seguida por outra
monossilábica em 85% das ocorrências, o que levaria o modelo a ter que postular uma
fronteira a cada sílaba! Yang se pergunta então o que aconteceria se o aprendiz soubesse
alguma coisa sobre estrutura fonológica, como, por exemplo, a estrutura de uma sílaba e
o fato de que seu núcleo é sempre uma vogal e que cada palavra pode ter apenas um
acento primário, como em (4):
(4) a. bigbadwolf
big bad wolf
grande mau lobo
‘lobo mau grande’
A informação estrutural levaria a criança a reconhecer três palavras no contínuo.

Assim, o autor aplica novamente o modelo incorporando o princípio estrutural ao
algoritmo estatístico, obtendo como resultado 73,5% de precisão e 71,2% de recall.
Além disso, o autor ainda testa a implementação de um aprendiz simbólico que se
utiliza de conhecimento das palavras já segmentadas e armazenadas. Os resultados
melhoraram consideravelmente, atingindo, respectivamente, 81,5% de precisão e 90,1%
de recall. A conclusão a que chega é que os princípios da Gramática Universal (GU) –
motivados linguisticamente e atestados desenvolvimentalmente – auxiliam o aprendiz
estatístico, restringindo o espaço de aplicação desse tipo de algoritmo apenas para casos
em que o conhecimento inato não seja suficiente. O mais importante a observar é que
(3) baseia-se no fato de que a informação segmental é absolutamente abundante para o
bebê; contudo, mesmo assim, isso não o ajuda.
Ainda em relação à aquisição do conhecimento fonológico, uma das tarefas da
criança é, segundo Santos (2008), aprender a fazer distinções contrastivas em sua língua
(na percepção e na produção), desconsiderando diferenças não contrastivas. Assim,
148
sonoridade pode ser relevante ou não, como em /p/ e /b/ mas não em /s/ e /z/ que se
neutralizam em posição de coda de sílaba, como em (5):
(5) [a.’xas.ta] ‘arrasta’ vs. [‘xaz.ga] ‘rasga’
Outra tarefa da criança é descobrir o que é uma regra obrigatória ou opcional na

língua alvo. A neutralização de sonoridade acima ocorre sempre; portanto, trata-se de
uma regra obrigatória. Porém, a criança tem de considerar que isso só é verdade em
coda silábica, mas nunca em ataque, como vemos no par mínimo em (6):
(6) [‘ka.za] ‘casa’ vs. [‘ka.sa] ‘caça’
Novamente a criança precisa da informação estrutural – no caso, a estrutura da

sílaba – para adquirir a gramática. O interessante é que se nota que a criança faz essa
distinção ao longo do percurso de produção, pois na mesma idade em que produz o /s/
em posição de ataque, ainda não o produz em coda silábica, como vemos nos exemplos
em (7), de Santos (2008):
(7) [so(r)’veti] ‘sorvete’ e [‘kaka] ‘casca’
Conclui-se mais uma vez que a abundância de informação em nada ajuda a

criança, que precisa se guiar pela informação estrutural para chegar à gramática
fonológica de sua língua. Passemos agora para o outro lado da gramática, examinando
um fenômeno semântico: a aquisição dos quantificadores universal e existencial. Antes,
contudo, pensemos um pouco sobre sentenças e significados. Como apontam Crain e
Thornton (1998), é bastante provável que uma criança seja capaz de mapear uma
sentença como (8) ao seu significado com base naquilo que ouve ao seu redor.
(8) Tem um cobertor no sofá.
É bastante provável que uma sentença dessa natureza seja enunciada ao redor da
criança quando, de fato, houver um cobertor no sofá. Temos um feliz exemplo de um
caso em que uma sentença é mapeada numa única representação semântica, ou, num
149
único significado (<sentença, significado>). Infelizmente, da perspectiva do aprendiz, as
línguas são mais complexas do que esse pareamento um-para-um deixa entrever.
Talvez o caso mais complexo sejam os daquelas sentenças às quais,
eventualmente, somos capazes de atribuir um sentido, conquanto sejam agramaticais
numa dada língua ou nas línguas naturais de forma universal. São os dados negativos a
que uma criança nunca (ou muito raramente) terá acesso, embora saiba que não são
possíveis:
(9) *Quem o João viu o menino que abraçou a mãe?
Temos também enunciados que poderiam ser linearmente mapeados a mais do

que uma representação semântica, mas não o são porque uma interpretação é barrada em
função da estrutura envolvida. Senão vejamos:
(10) a. Ela dançava enquanto a Magali comia melancia.

b. Ela (= Mônica) dançava enquanto a Magali comia melancia.
c. * Ela (= Magali) dançava enquanto a Magali comia melancia.
Saber que (b) é uma representação possível de (a), mas que (c) não é, implica
saber que <sentença, {significado1, *significado2}>. Num nível mais profundo, implica
saber que o pronome “ela” não pode se correferir ao nome “Magali” por conta da
relação estrutural que há entre ambos, normalmente conhecida como c-comando (veja
definição no capítulo “Teoria da Regência e Ligação e a proposta de Princípios e
Parâmetros”, neste volume). Para uma dada sequência linear, então, temos uma
representação semântica possível e outra, não. As restrições, contudo, são estruturais, ou
seja, dizem respeito à organização estrutural dos constituintes que formam a sentença.
Chegamos aos casos em que uma mesma sequência linear pode ser mapeada
para dois (ou mais) sentidos, as sentenças ambíguas (<sentença, {significado1,
significado2}>):
(11) Todos os meninos têm um cachorro.
Em (11) temos que cada um dos meninos é dono de seu próprio cachorro, ou de
ao menos um cachorro, mas também temos a interpretação, talvez pragmaticamente
150
menos feliz, de que o conjunto todo de meninos é dono de um cachorro, leituras
conhecidas respectivamente como distributiva e coletiva. Esse efeito se dá em função da
interação entre o “todos”, um quantificador universal, e o “um”, um quantificador
existencial, e o escopo de um sobre o outro. Na leitura distributiva, o quantificador
universal tem escopo sobre o existencial (diz-se que tem escopo amplo), o que se vê
mesmo na ordem linear dos elementos na sentença, já que “todos” antecede linearmente
“um”. Para se obter a representação semântica relativa à leitura coletiva, em que o
quantificador existencial é que tem escopo amplo sobre o universal, deve-se imaginar
que há algum tipo de movimento não visível deste, em algum nível sintático, originando
a leitura esperada. Ora, mas que tipo de evidência uma criança teria para isso?
A pergunta a fazer então é se as crianças pequenas conseguem capturar a
ambiguidade e, caso não consigam, como interpretam uma sentença como (11)? Lopes
(2014) se fez essas perguntas. E Müller, Negrão e Gomes (2007) mostraram que um
mesmo item morfológico pode se combinar a um NP ou a um DP, produzindo diferentes
interpretações:
(12) a. tod- + NP_sg = todo/cada (every, do inglês)

b. tod-+ DP_sg = comporta-se como um advérbio (Ex: Tomou toda a sopa = a
sopa inteira)
c. tod-+ DP_pl = todos (all, do inglês)
Como (b) não envolve um quantificador, foi deixado de lado; Lopes (2014)
começou testando um grupo controle de 20 adultos entre 18 e 30 anos, falantes nativos
do português brasileiro, pedindo que interpretassem sentenças como (a) e (c) anteriores,
nas condições “singular” e “plural”, em um questionário off-line.
(13) Toda menina está em um barquinho.

a. ( ) Há 4 meninas e todas elas estão em um mesmo barquinho.
b. ( ) Há 4 meninas e cada uma delas está em um barquinho distinto.
(14) Todas as bolas estão em uma caixa.

a. ( ) Há 3 bolas e todas elas estão numa mesma caixa.
b. ( ) Há 3 bolas e cada uma delas está em uma caixa distinta.
151
Os adultos têm uma clara preferência pela leitura distributiva na condição
singular e pela coletiva com o plural (índices de 97,5% em ambos os casos), o que
indica que fazem o movimento do quantificador no segundo caso.
Lopes (2014) testou, então, 40 crianças entre 3 e 6 anos com as mesmas
condições, em uma tarefa de manipulação de brinquedos (act-out). As crianças
apresentaram, no geral, uma clara preferência pela leitura distributiva em ambas as
condições (73,4% na condição singular e 85%, com o plural). Apenas quatro crianças –
justamente as mais velhas – apresentaram os julgamentos do grupo adulto de maneira
sistemática. Esse resultado poderia sugerir que as crianças começam a operar com a
gramática movimentando o quantificador para obtenção do escopo. Mas e todas as
demais, apenas interpretam a sentença a partir de sua linearidade?
Para verificar se as crianças se valem apenas da ordem linear na interpretação de
sentenças ambíguas, Lidz e Musolino (2002) testaram sentenças como (15), em que há a
interação de um quantificador universal com a negação:
(15) Everyone didn’t smile.

‘Todo mundo não sorriu’, com as seguintes leituras:
a. Para todo x, se x é pessoa, então x não sorriu (= nenhum ninguém sorriu)
b. Nem todo x, se x é pessoa, então x sorriu (= alguns sorriram)
A interpretação em (a) apresenta escopo estrito da negação. Essa interpretação é

chamada de isomórfica pelos autores porque a relação de escopo reflete a ordem linear
entre o quantificador e a negação. A segunda interpretação (em (b)) apresenta escopo
largo da negação; portanto, é não isomórfica, já que não reflete a ordem linear entre os
elementos, envolvendo o alçamento do operador de negação para a devida interpretação
semântica. Note-se, contudo, que em ambos os casos o que está em jogo é uma relação
estrutural hierárquica, como mostram os autores (2002: 120):
(16)
152
Foram testadas 24 crianças falantes nativas do inglês entre 3;11 e 4;11 anos e 24
adultos igualmente falantes do inglês. Os resultados mostram que os adultos acessam as
duas interpretações possíveis em índices próximos ao teto. As crianças, contudo, têm
uma clara preferência pela interpretação isomórfica, apresentando uma taxa de aceitação
de 81% vs. 33%. Esses resultados podem implicar que a criança não lida com a
informação hierárquica estrutural, mas tão somente com a ordem linear. Mesmo que
seja esse o caso, o que não é, como veremos a seguir, claramente esse estágio deixa de
existir já que os adultos exibem um comportamento que evidencia a existência de
movimento da negação, como em (16b).
Os autores, porém, têm evidências que sugerem que o aparente comportamento
“isomórfico” das crianças é, na realidade, apenas superficial. Além de sentenças como
(15), eles testaram também sentenças como (17):
(17) The Smurf didn’t buy every horse.

‘O Smurf não comprou todos os cavalos.’
Vemos aqui que a relação de escopo entre a negação e o quantificador se

invertem, mas a posição entre eles ainda é isomórfica. Em (15) temos o sujeito,
contendo o quantificador, c-comandando a negação; em (17) a negação é que c-
comanda o quantificador. Demonstrar compreensão das leituras possíveis nesses dois
casos, mesmo que respeitem precedência linear, parece indicar que o que guia a criança,
desde cedo, são as relações hierárquicas. É o que os autores concluirão, mas não sem
antes examinar uma outra língua – o kannada, língua da família dravídica falada
predominantemente no sul da Índia – que apresenta a ordem SOV. Comparemos (18) e
(19):
153
(18) The Smurf didn’t catch two guys. [inglês]
‘O Smurf não pegou dois caras.’
(19) naanu eraDu pustaka ood-al-illa [kannada]

Eu-nom dois livros ler-neg
‘Eu não li dois livros.’
Em ambas as sentenças, as duas leituras estão disponíveis: a de escopo estrito

(não é o caso que o Smurf tenha capturado duas pessoas) e a de escopo largo (há duas
pessoas que o Smurf não capturou). Ocorre que, em inglês, a negação c-comanda e
precede o objeto quantificado, enquanto que, em kannada, a negação c-comanda o
objeto, mas não o precede, como vemos pela representação arbórea dos autores (2002:
137):
(20)
Essa distinção faz as seguintes previsões: (i) se a criança se utiliza apenas da

ordem linear, então em kannada a preferência será pela leitura de escopo amplo em que
o quantificador precede a negação; (ii) se for pela relação hierárquica estrutural de c-
comando, então a preferência será pela leitura de escopo estrito, em que a negação c-
comanda o quantificador; assim as crianças falantes de kannada devem se comportar
como as do inglês.
Para colocar a previsão à prova, os autores testaram 24 crianças falantes nativas
de kannada com idade entre 4;0 e 4;11 anos, assim como 24 adultos. A previsão em (ii)
se mostrou robusta, em que os resultados apontam para uma preferência de 75% vs.
154
22,9% pela leitura de escopo estrito Com base nos resultados, os autores concluem que
o efeito de isomorfismo é uma consequência da estrutura hierárquica e não da

ordem linear. A interpretação que as crianças fazem das sentenças ambíguas
é determinada pelas relações superficiais de c-comando que se estabelecem
entre dois elementos que podem ter escopo. Para as crianças, um tal elemento
toma escopo sobre tudo que c-comandar na superfície. Desta forma, as
crianças são diferentes dos adultos não no que tange aos princípios usados
para mapear a estrutura sintática para a semântica, mas apenas em sua
disposição de aplicar operações de movimento encobertas. (2002: 141)
Finalmente, examinemos um fenômeno estritamente sintático, envolvendo a

composição de traços de elementos expletivos, em alguns casos, expletivos sem
conteúdo fonológico (os chamados ‘expletivos nulos’).
Chomsky (1995: 273-275) observa que a concordância verbal com um elemento
associado na sentença (there e three men em (21a), adiante) parece se correlacionar com
a composição de traços do expletivo. Um dado verbo concorda com o associado se o
expletivo não tem Caso e traços-phi (traços de pessoa, número e gênero), como o there
em (21a), mas não se o expletivo tiver esses traços, como o il do francês em (21b).
(21)
(a) There are three men in the room. [inglês]
Expl Estão três homens na sala.
‘Há três homens na sala.’
(b) Il y a trois hommes dans la salle. [francês]
Expl locativo Há três homens na sala.
‘Há três homens na sala.’
Chomsky motiva o movimento encoberto do associado para a posição de sujeito,

pois exibe propriedades de ligação e controle tal qual um sujeito realizado abertamente,
como se vê nos exemplos em (22); contudo, apenas os casos que se comportam como
“there” apresentam essa propriedade:
(22)
(i) a. There arrived three men without identifying themselves. [inglês]
b. * I met three men without identifying themselves.
Eu encontrei três homens sem identificar eles mesmos
155
(ii) Sono entrati tre uomini senza identificarsi. [italiano]
São entrados três homens sem se identificar
(iii) * il est entré trois hommes san s’annoncer. [francês]
Expl É entrado três homens sem se identificar
(iv) Es sind gestern viele Leute angekommen, ohne sich zu identifizieren. [alemão]
Expl São ontem muitas pessoas chegadas sem se identificar
(v) a. Chegaram três homensi sem sei identificar. [português]
b. * Eu encontrei três homensi sem sei identificar.
Em (22va), temos uma sentença que apresenta um expletivo nulo em sua

estrutura. Entretanto, como o elemento associado “três homens” é interpretado como o
reflexivo “se” – dizemos que estão ligados – e este elemento está em uma sentença
encaixada, o associado teria de estar numa posição mais alta. Ocorre que esse
movimento, assim como o discutido anteriormente para os quantificadores, se dá de
forma “velada”, inaudível, encoberta, apenas para que a sentença receba a representação
semântica adequada e, assim, seja interpretada.
Ora, o que haveria de evidência para a criança chegar a uma generalização sobre
a composição de traços dos expletivos, realizados ou nulos, em sua língua? Nada para
além de refinadas dependências estruturais.
O nome do jogo: dependência estrutural
À guisa de conclusão, retomemos os exemplos oferecidos na seção anterior. O

que há de comum entre eles é que todos envolvem algum tipo de dependência estrutural
para que sejam adequadamente adquiridos. Vimos, na exploração sobre o percurso da
aquisição da gramática fonológica de uma língua, que não basta a abundância de
informação segmental. Sem conhecer – através da GU – a estrutura da sílaba, tal
informação é basicamente irrelevante.
Um caso oposto à abundância de informação foi o da interação entre
quantificadores e/ou quantificadores e operadores. Aí é virtualmente impossível que a
criança tenha acesso a duas interpretações distintas para uma mesma sequência
superficial; entretanto, isso não é um problema, como se viu. Viu-se ainda que há fortes
evidências de que a criança se guia pela estrutura hierárquica e não pela sequência linear
156
de elementos numa sentença. O mesmo tem de ser verdade para o último exemplo
discutido, o da composição de traços dos elementos expletivos nas diferentes línguas.
Todos os exemplos discutidos tratam do funcionamento da gramática das
línguas naturais e, igualmente, do funcionamento da cabeça das crianças, pelo que se
pode inferir das evidências trazidas. O debate sobre o quanto há de inato e o quanto vem
da evidência, esse vai continuar, não há dúvidas, ele precisa existir. Mas negar o
inatismo, considerando as evidências dadas pelo processo de aquisição, não parece uma
hipótese muito promissora.
Apenas para resumir o argumento da pobreza de estímulo, retomando a primeira
seção, faço-o através de Crain e Pietroski (2001: 139):
A principal tarefa da teoria linguística, dentro da tradição gerativa, tem sido a

de explicar o incrível cenário da aquisição da linguagem. Os detalhes
envolvem, entre outros, (i) – (iii):
(i) o conhecimento linguístico que as crianças atingem,

(ii) o input linguístico que recebem, e
(iii) as capacidades não linguísticas das crianças, especialmente a capacidade
de formar e testar generalizações com base em sua experiência.
Nativistas assumem que (i) é subdeterminada por (ii) em aspectos teóricos

importantes, mesmo quando se é otimista quanto à (iii). Em trabalhos
recentes, alguns têm acusado os nativistas de subestimarem (ii) e/ou serem
muito pessimistas em relação à (iii).
Esperamos ter conseguido mostrar um grande otimismo, um otimismo em

relação à capacidade linguística das crianças. Mas como afirma Chomsky (2015: 95): “a
discussão sobre esses tópicos tem sido frequentemente obscurecida na literatura pela
incapacidade de se distinguir competência de performance; grosseiramente, de
distinguir o que sabemos do que fazemos.”
Referências
CHOMSKY, N. Knowledge of Language: Its nature, origin and use. Westport, CT: Praeger, 1986.
______. Minimalist Inquiries: The framework. MIT Occasional Papers in Linguistics, 15, 1998.
______. Problems of projection. Lingua, 130, pp.33-49, 2013.
______. Some core contested concepts. Journal of Psycholinguistic Research, 44, pp. 91-104, 2015.
CRAIN, S.; THORNTON, R. Investigations in Universal Grammar. Cambridge, MA: MIT Press, 1998.
______; PIETROSKI, P. Nature, nurture and Universal Grammar. Linguistics and Philosophy 24, pp. 139-
186, 2001.
157
FREITAS, M. J.; SANTOS, A. L. (Eds.). Aquisição de língua materna e não materna: questões gerais e
dados do português. Berlin: Language Science Press, 2017.
GLEITMAN, L.; GILLETTE, J. O papel da sintaxe na aprendizagem verbal. In: P. FLETCHER, P.;
MACWHINNEY, B. (Eds.). Compêndio da linguagem da criança. PA: Artes Médicas, 1995.
GUASTI, M. T. Language Acquisition: The growth of gramar. Cambridge, MA: MIT Press, 2002.
JUSCZYK, P. The discovery of spoken language. Cambridge, MA: MIT Press, 1998.
KAIL, M. Aquisição de linguagem. São Paulo: Parábola, 2013.
LIDZ, J.; MUSOLINO, J. Children’s Command of Quantification, Cognition 84-2, pp. 113-154, 2002.
LOPES, R. E. V. How children distribute: The acquisition of the universal quantifier in Brazilian
Portuguese. Revista da ABRALIN, 13, pp. 351-74, 2014.
LUST, B. Child Language: Acquisition and growth. New York: Cambridge University Press, 2006.
MIOTO, C.; FIGUEIREDO SILVA, M. C.; LOPES, R. Novo Manual de Sintaxe. São Paulo: Contexto, 2013.
MÜLLER, A. P.; NEGRÃO, E. V. GOMES, A. P. “Todo” em contextos coletivos e distributivos. DELTA.
Documentação de Estudos em Linguística Teórica e Aplicada, 23, pp. 71-95, 2007.
PIATTELLI-PALMARINI, M. (Org.). Teorias da Linguagem: Teorias da Aprendizagem: O debate entre Jean
Piaget & Noam Chomsky. Trad. Álvaro Cabral. São Paulo: Cultrix/Edusp, 1983.
SAFFRAN, J. R.; ASLIN, R. N.; NEWPORT, E. Statistical learning by 8-month-old infants. Science, 274, pp.
1926-1928, 1996.
YANG, C. Universal grammar, statistics or both?. Trends in Cognitive Sciences, 8, pp. 451-456, 2004.
158
O PROBLEMA DE DESCARTES EM LINGUÍSTICA
Marcus Maia
O Problema de Descartes, também chamado problema corpo-mente, reúne um

complexo de posições teóricas envolvendo, em última análise, as relações
epistemológicas entre um sujeito cognoscente e um objeto cognoscível, encontrando-se
em Platão, de um lado, a defesa gnosiológica da ideia, ou mesmo do ideal, como
requisito prioritário na relação de conhecimento. Para Platão, portanto, o mundo dos
objetos sensíveis não seria mais do que uma instanciação do mundo das formas ideais,
não sendo, por isso, constituído de substâncias à parte das formas, mas uma espécie de
externalização imperfeita das próprias formas eternas. Aristóteles, discípulo de Platão,
por outro lado, propôs que a ontologia do objeto fosse prioritária para o conhecimento.
Nesse sentido, para Aristóteles, as formas seriam propriedades dos objetos, não
preexistindo a eles, mas estando neles incorporadas. Embora articuladas em uma
espécie de dualidade corpo-mente, tanto o idealismo platônico, quanto o fisicalismo
aristotélico instanciam, na realidade, posturas filosóficas monistas, mas com sentidos
opostos. Em Platão, os objetos são projeções das formas e, em Aristóteles, estas são
imanentes aos objetos. É com René Descartes, no século XVIII, que, de fato, a postura
filosófica dualista encontraria sua caracterização mais plena, propondo-se que a mente
ou res cogitans seja distinta da matéria, a res extensa. Ao contrário da posição monista
de que haveria apenas uma única realidade unificada, seja de base idealista ou
fisicalista, a posição dualista separa o que seria o reino da mente do reino da matéria.
Exposta através da metodologia dubitativa criteriosa exercitada por Descartes, a
dualidade corpo-mente encontra, no filósofo, não obstante, um sentido platônico, em
que a razão é priorizada, como se depreende, por exemplo, no seu célebre cogito ergo
sum. Penso, como ponto de partida, logo existo. O dualismo racionalista de Descartes
levanta o problema da causalidade ou o problema da interação: como poderiam
substâncias não corpóreas causarem movimentos corpóreos? Descartes reconhece, no
159
entanto, que res cogitans e res extensa interagem nas sensações e sentimentos, que são
entidades psicofísicas, não podendo ser classificadas como puramente mentais ou
puramente físicas. No que concerne mais especificamente à linguagem, Descartes
mantém, entretanto, o dualismo estrito, não concebendo ser possível que a flexibilidade
e a criatividade linguísticas pudessem ser explicadas no âmbito do reino da matéria,
devendo, por isso, ser a linguagem uma faculdade necessariamente, do reino da
substância imaterial.
Três séculos mais tarde, Noam Chomsky inicia a caracterização da natureza da
faculdade da linguagem em termos inatistas, retomando as ideias racionalistas, em
contraposição ao antimentalismo behaviorista dominante na primeira metade do século
XX. Vale notar que Chomsky, ainda que fornecendo elementos cruciais para que se
possa conceber a mente em termos de sistemas computacionais explícitos, fazendo
avançar indubitavelmente nossa compreensão dos fenômenos da res cogitans, não se
posiciona nem de modo dualista e nem de modo reducionista:
Eu não tenho estado me ocupando da questão da “redução da mente à

matéria”, e nem mesmo compreendo o que é essa questão. [...] Eu uso o
termo “mente” sem nenhum valor ontológico: pelo contrário como uma
maneira informal de fazer referência ao “estudo do corpo” – especificamente
o cérebro – conduzido em um certo nível de abstração. [...] Desse ponto de
vista, não há lugar para o problema de Lycan sobre a “redução” da mente à
matéria (Chomsky, 2003: 257-8 [NÃO CONSTA ESTA DATA NAS
REFERÊNCIAS])
Destaque-se, na argumentação chomskyana, a caracterização do termo “mente”,

como o estudo do corpo “conduzido em um certo nível de abstração”. Nesse sentido,
Chomsky, adotando a posição que tem sido chamada de monismo neutro, diverge do
materialismo eliminacionista de Churchland (1981), por exemplo, que recusa
radicalmente qualquer dualidade do tipo mente-cérebro, propondo que a Neurociência
pode eliminar qualquer referência a fenômenos não estritamente fisicalistas.
No presente capítulo, ao invés de perseguir o questionamento mais estritamente
filosófico que também é encetado por Chomsky em vários textos (cf. Antony e
Hornstein, 2003), optamos por tomar como modelar essa epistemologia
antirreducionista utilizada por Chomsky, fundada na caracterização de níveis de
abstração na investigação de fenômenos complexos, para discutir a relação entre a
gramática e o processamento linguísticos. Em Maia (2014), já apontamos que a
eliminação das diferenças entre os campos da gramática e do processamento,
160
unificando-os forçadamente em um único e mesmo campo, traz como consequência
inevitável a perda de conteúdo relevante. Naquele trabalho, nos posicionamos em favor
da proposta de que haja um único sistema cognitivo, aferido em diferentes níveis. Sobre
esse mesmo único sistema incidiriam diferentes angulações: uma mais teórica, que
descreveria suas propriedades gerais (a Teoria Gramatical), outra que estuda a
implementação do sistema em sua relação com outras funções cognitivas, tais como
memória, atenção, etc. e em situações de ambiguidade de análise (o Processamento de
Frases). A terceira angulação – intermediária às duas primeiras – seria a Sintaxe
Experimental, a proposta de investigação on-line e off-line38 da computação da
gramática no processamento, abstraindo-a, no entanto, de fatores mnemônicos,
atencionais e de incerteza e profundidade de análise. No presente capítulo, por outro
lado, pretendemos discutir casos de convergência e de divergência entre essas
angulações nos estudos linguísticos para apontar que a confusão acidental ou
intencional entre as questões da representação gramatical e as questões do
processamento, além de causar a perda de conteúdos relevantes, pode levar a erro do
tipo II, ou seja, à postulação de falso negativo.39
Competência e desempenho
Uma dualidade fundamental em Linguística é o binômio competência vs

desempenho, proposto em Chomsky (1965). Naquele muito lembrado primeiro capítulo
de Aspects, Chomsky estabelece a diferença que, embora muito citada, vale aqui ser
apresentada diretamente mais uma vez, não só pela sua importância intrínseca, mas
também pela incompreensão sobre ela que ainda perdura:
A Teoria Linguística preocupa-se primariamente com um falante ouvinte

ideal em uma comunidade de fala completamente homogênea que conhece
perfeitamente sua língua e não é afetado por condições de gramaticalidade
irrelevantes, tais como limitações de memória, distrações, mudanças de
atenção e interesse e erros (randômicos ou característicos) ao aplicar seu
conhecimento da língua no desempenho real. [...] Assim, fazemos uma
distinção fundamental entre competência (o conhecimento do falante-ouvinte
de sua língua) e desempenho (o uso real da linguagem em situações
concretas). Somente sob a idealização estabelecida no parágrafo anterior, a
performance é um reflexo direto da competência. Na verdade, obviamente,
ela não poderia refletir diretamente a competência. (Chomsky, 1965: 3-4)
Gostaria de chamar a atenção especialmente para as duas últimas frases da

citação, em que Chomsky afirma que apenas nesse contexto idealizado é que seria lícito
161
pensar que o desempenho poderia ser reflexo direto da competência, parecendo-lhe
óbvio que no mundo real o desempenho não refletiria a competência. E, no entanto,
nem a necessidade conceptual virtual da distinção impediu que muita discordância e
confusão fosse levantada na história da linguística. Muita confusão desnecessária, como
lembra Chomsky, em 2015, em Some Core Contested Concepts, em que, mais uma vez,
a naturalidade da distinção é colocada em termos amplos, como sendo constituída por
diferenças necessárias “entre o que nós sabemos e o que nós fazemos”.40 Não obstante,
como veremos nas próximas seções, há confusões para todos os gostos – unificações,
reducionismos e eliminacionismos – a serem revisitadas e revisadas de modo que se
possa contribuir para que, como se lê em Chomsky (2015), a falência em se observar a
distinção não continue a obscurecer as discussões.
A Teoria da Complexidade Derivacional
A literatura costuma reconhecer que a primeira grande teoria em Psicolinguística

foi a Derivational Theory of Complexity (DTC), a Teoria da Complexidade Derivacional,
em que se entretém que o desempenho seja algum tipo de função do conhecimento
gramatical. É o que se lê no trabalho em colaboração entre o psicólogo George
Armitage Miller e Noam Chomsky:
A plausibilidade psicológica de um modelo transformacional do usuário de

linguagem seria fortalecida, é claro, se pudesse ser demonstrado que nosso
desempenho em tarefas que exigem uma apreciação da estrutura de sentenças
transformadas é alguma função da natureza, número e complexidade das
transformações gramaticais envolvidas. [FALTOU A REFERÊNCIA]
De fato, como revisto em Maia (a aparecer), na década de 1960, a nascente

disciplina da psicolinguística, impulsionada pela atmosfera efervescente de ideias da
revolução cognitivista (cf. Gardner, 1985[NÃO CONSTA NAS REFERÊNCIAS]), tomou como
hipótese central que a gramática transformacional de base chomskyana fornecesse um
modelo completamente transparente para o processamento. A Teoria da Complexidade
Derivacional (cf. Miller & Chomsky, 1963) assumia o modelo gerativista da época,
conhecido como kernel & tags (cf. Chomsky, 1957). Concebendo que as frases fossem
armazenadas na memória como um composto de kernel + transformational tags41,
quanto mais transformações, mais custoso seria processar a frase. Assim, por exemplo,
162
uma construção como “A menina comprou uma casa”, sendo uma oração declarativa
simples, seria mais fácil de processar do que “A casa não foi comprada pela menina?”,
que teria tags de passiva, interrogativa e negativa. Conforme revisto em Fodor, Bever e
Garrett (1974), diferentes experimentos testando uma variedade de construções
pareceram inicialmente fornecer apoio à proposta de Miller e colegas, mas
subsequentemente, vários outros experimentos indicaram que a relação completamente
isomórfica pretendida entre um modelo de representação gramatical específico e o
processamento era, de fato, insustentável.
A Despeito da avaliação de que a crise da DTC tenha levado ao afastamento entre
a Psicolinguística e os estudos gramaticais (cf. Harley, 1996, entre vários outros), a
hipótese de que haja correlação entre as dimensões da competência e do desempenho é
crucial para a Psicolinguística e, como avalia Marantz (2005), não há outra escolha para
a ciência cognitiva e para a neurociência cognitiva do que continuar a abraçar a
hipótese metodológica de que quanto maior a complexidade da representação
gramatical, maior o custo de processamento de tarefas desempenhadas
experimentalmente e maior atividade deve ser observada no cérebro42. Se houve
questões que, como se costuma avaliar, levaram ao afastamento entre a psicolinguística
e a teoria gramatical (cf. Fodor, Bever & Garrett, 1974), estas deveriam, segundo
Marantz, ser revistas tanto do ponto de vista dos experimentos, quanto das teorias, pois
como concorda Phillips (2012), a hipótese continua a ser nuclear e padrão na pesquisa
psicolinguística e neurocientífica43.
Platonismo metodológico
Tenha sido apropriado ou não, o fato é que a crise da DTC levou a um dualismo
metodológico entre os campos da teoria gramatical e do processamento linguístico. Pós-
crise, de modo geral, enquanto os psicolinguistas continuaram a desenvolver e aplicar
em seus estudos uma variedade de experimentos, testando questões mais diretamente
relevantes para investigar heurísticas de processamento, como, por exemplo, os
princípios de Bever (1970), Kimball (1973), que, ao menos em parte, vieram a
desembocar na Teoria do Garden-Path (Fodor, 1978; Frazier, 1979; Frazier & Rayner,
1982, entre outros), os teóricos passaram a restringir-se, fundamentalmente, aos
julgamentos intuitivos de gramaticalidade. A concepção de que a gramática fosse
constituída pelas formas ideais platônicas, sendo acessível apenas pela intuição levou a
163
pesquisa em teoria gramatical a minimizar radicalmente as metodologias, confiando
apenas nos julgamentos intuitivos do pesquisador ou quando muito na obtenção
informal de julgamentos de alguns poucos falantes, o que veio mesmo, posteriormente,
a ser caricaturado pelo termo Hey Sally method, proposto por Cowart (1997)44. Assim,
ter-se-ia, de um lado, o estudo da competência, viabilizado por um método off-line
informal, como a intuição gramatical e, de outro, os estudos de processamento, que
utilizariam metodologias on-line, capazes de acessar os processos computacionais no
momento mesmo em que estes estariam ocorrendo. Como avalia Marantz, no entanto,
esta interpretação incorreta da dicotomia competência x desempenho, não faz jus nem
aos estudos gramaticais, que podem beneficiar-se tanto de estudos off-line, quanto de
estudos on-line, e nem aos estudos de processamento que, igualmente, usam ambas as
metodologias (Marantz, 2005: 432[NÃO CONSTA NAS REFERÊNCIAS]).
Lemos tudo duas vezes?
Townsend e Bever (2001[NÃO CONSTA NAS REFERÊNCIAS]) propõem que a correlação

entre a competência e o desempenho seja resolvida em uma arquitetura da compreensão
linguística em que haja, em um primeiro momento, uma análise rough, menos refinada,
em que o processador sintático ou parser construiria uma estrutura preliminar que seria
utilizada para se chegar a uma síntese mais completa baseada nos princípios
gramaticais. As sentenças seriam, portanto, representadas mentalmente duas vezes,
primeiro pelo parseamento preliminar e, posteriormente, pelo uso mais pleno da
gramática. Como indica Phillips (2012[NÃO CONSTA NAS REFERÊNCIAS]), os autores chegam
a cooptar para o seu modelo resultados como os de Miller e Isard (1963[NÃO CONSTA NAS
REFERÊNCIAS]), que concluem, baseados em experimentos, que as sentenças gramaticais
são melhor reconhecidas perceptualmente do que as agramaticais. Townsend e Bever
(2001) propõem que o progresso nas ciências cognitivas é alcançado “separando-se as
questões relativas ao que as pessoas compreendem e dizem das questões de como elas
compreendem e dizem” (Townsend e Bever, 2001: 37). Em contraposição, Phillips
(2012) argumenta que, embora seja um truísmo que o “saber o quê” seja distinto do
“saber como”, essa diferença por si não garante que deva haver analisadores sintáticos
múltiplos para cada frase. Em outras palavras, o fato de que a análise inicial do parser
possa ser, de fato, rápida e reflexa, em contraste com a síntese gramatical final,
164
geralmente, mais reflexiva, não acarretaria a necessidade de que haja dois sistemas
gramaticais na mente, um dedicado a análises rápidas e o outro a análises lentas.
Um único sistema cognitivo
Lewis e Phillips (2015) propõem que tanto os fenômenos on-line quanto os off-
line sejam diferentes aferições de um mesmo e único sistema cognitivo, que constrói
representações que são usadas tanto na produção quanto na compreensão. Os dois
autores argumentam que, se as teorias gramaticais e de processamento descrevessem
sistemas cognitivos separados, gerando representações isoladas, não precisaria haver
interesses comuns entre os dois campos. Na realidade, entretanto, grande parte dos
psicolinguistas concorda que os construtos gramaticais devam ter impacto na
compreensão on-line e há também muitos teóricos que valorizam os estudos com
aferição on-line que têm o potencial até para fornecer evidências para decidir entre
diferentes propostas teóricas (cf. Lewis e Phillips, 2015: 41). Disputas teóricas
importantes como a postulação ou não de categorias vazias geradas por movimento, por
exemplo, têm sido beneficiadas por estudos experimentais (cf. Phillips e Wagers, 2007).
Note-se, finalmente, que a proposta fundamental de que teoria e processamento
gramatical sejam tratados como níveis de aferição diferenciados do mesmo sistema
cognitivo já pode ser encontrada seminalmente, em diversos artigos de Chomsky, tais
como, entre vários outros, o primeiro capítulo de Aspects, de 1965, a introdução do The
Minimalist Program, de 1995, e o texto de 2003, que citamos na introdução deste
capítulo, em que Chomsky recusa a “redução da mente à matéria”, referindo-se ao
problema corpo-mente como sendo resolvido pela adoção do conceito de níveis de
abstração.
Evidências experimentais, matches e mismatches entre gramática e processamento:

infinitivos flexionados controlados ou arbitrários?
Modesto e Maia (2017[NÃO CONSTA NAS REFERÊNCIAS]) desenvolveram um estudo de

rastreamento ocular para investigar experimentalmente a compreensão do infinitivo
flexionado em português brasileiro, procurando testar a proposta de análise teórica de
Rodrigues e Hornstein (2010[NÃO CONSTA NAS REFERÊNCIAS]). De acordo com esses autores,
o sujeito de orações não finitas em português brasileiro (PB) seria um prozinho, seja
165
como indicado em (1a) ou em (1c), enquanto Modesto (2010, 2016ª [NÃO CONSTAM NAS
REFERÊNCIAS]), por outro lado, argumenta que apenas (1b) e (1c) seriam possíveis no PB
falado:
(1) a. SN1 control predicate [CP pro2 T-tense,+agr v ]

b. SN1 control predicate [CP PRO1 T-tense,+agr v]
c. SN1 control predicate [CP proarb T-tense,+agr v]
Modesto (2010) argumenta contra a teoria de controle por movimento, assumida por
Rodrigues e Hornstein (doravante R&H), alegando a sua incapacidade de explicar diversos
fatos do PB. R&H deixam de considerar, por exemplo, a possibilidade de verbos infinitivos
flexionados, que R&H afirmam não serem mais usados no PB falado. Modesto (2016)
discute a representação sintática dos sujeitos nulos de formas verbais não finitas flexionadas
em PB, revendo as suas leituras referencial, controlada e arbitrária, para propor que o
infinitivo flexionado não só é produtivo no PB falado, como também que sua interpretação
preferencial em orações complemento seria a de controle, como em (1b), sendo possível
também a interpretação arbitrária em (1c). Modesto (2010, 2016a) apresenta argumentos
intrateóricos, diacrônicos e sociolinguísticos, em defesa de sua análise. A análise de
representação gramatical em (1b) é, no entanto, refutada por R&H.
Em Modesto e Maia (2017), apresenta-se um experimento de rastreamento ocular
para investigar a leitura de períodos compostos por uma oração subordinada
contextualizadora, uma oração principal e uma oração final contendo uma oração com
verbo no infinitivo flexionado. O objetivo do experimento foi duplo. Em primeiro lugar,
os autores pretendiam investigar o efeito de contextos de controle obrigatório sobre o
processamento das frases em relação a contextos favorecendo leituras indeterminadas,
arbitrárias e referenciais. Em segundo lugar, manipulou-se a concordância de número
entre o sujeito e o verbo no infinitivo flexionado, para avaliar se a concordância no
singular bloquearia totalmente uma leitura de controle da frase ou se uma interpretação
de controle parcial ainda seria permitida. A hipótese entretida foi a de que as latências
das medidas de leitura de primeira passagem do olhar (Durações de Fixação Total)
seriam mais longas nas condições de não controle do que nas condições de controle,
refletindo o maior custo de processamento de não se estabelecer uma relação sintática
de controle local, que deveria ser a preferência padrão na computação da sentença. Os
detalhes completos sobre o design, variáveis, participantes e resultados e estatísticas do
166
experimento podem ser lidos em Modesto e Maia (2017). Na presente revisão, pretende-
se apenas demonstrar como análises de representação e de processamento, embora não
devam ser reduzidas uma a outra, podem, no entanto, convergir. Nesse sentido,
observem-se os gráficos com os resultados dos tempos de leitura e dos índices de acerto
de frases em três das condições testadas no experimento:
(2) PRO Controle interno: Como chegaram logo ao local da queda, os bombeiros
julgaram terem salvo muitas vidas
(3) PRO Controle externo: Só quando os bebês foram examinados, o cuidador percebeu
terem sujado as fraldas
(4) PRO ARB: Quando os dados chegaram na base, os cientistas perceberam estarem em
órbita.
Gráfico 1: Duração Total de Fixação
Duração de Fixação Total (ms)

2000 1806
1459 1584
1500
1000
500
0
PRO Controle PRO Controle PRO Arbitrário
Interno Externo
Gráfico 2: Interpretação de Controle
Int. Controle (%)

100 83
80
60
36
40 24
20
0
PRO Controle PRO Controle PRO Arbitrário
Interno Externo
167
Frases como (2), de controle obrigatório, sempre continham, na oração
subordinada inicial, um verbo cujo sujeito catafórico era o sujeito SN da oração
principal, que constituía um sujeito semanticamente plausível para todos os verbos na
frase. Tendo um controlador local para a categoria vazia na posição de sujeito da oração
com o infinitivo flexionado (PRO terem salvo muitas vidas), essas frases foram as de
leitura mais rápida, como representado no Gráfico 1. As frases dessa condição tiveram
tempos médios de leitura de 1459 ms e obtiveram 83% de interpretação de controle na
questão interpretativa final, como se representa no Gráfico 2. Em contraste, frases
como (3) obtiveram latências de fixação total significativamente mais altas do que a
condição anterior (1583m) e índices de interpretação de controle significativamente
menores (24%). Nas frases dessa condição, procurou-se bloquear a possibilidade de que
o SN sujeito da oração principal ([o cuidador]) controlasse a categoria vazia na posição
de sujeito do verbo no infinitivo flexionado, através de recursos formais
(incompatibilidade de concordância de número entre o SN [o cuidador] e o verbo no
infinitivo flexionado no plural (*o cuidador terem). Entretanto, nessa condição colocou-
se na oração subordinada um SN plausível ([o bebê]) para praticar a ação do infinitivo
flexionado (terem sujado as fraldas), ao contrário do SN da oração principal ([o
cuidador]), que não seria plausível para praticar essa ação. Essa manipulação de
plausibilidade, que não está presente na condição anterior, exigiu maior tempo de
fixação, indicando que o processamento semântico se deu on-line, com consequências
também para a medida interpretativa off-line, que cai significativamente em seu
percentual de decisão de controle, rejeitando-se que o cuidador possa ter sujado as
fraldas. Finalmente, a condição que demanda as fixações médias mais longas de todas
as condições é a condição ilustrada pela frase (4), uma vez que não existe um SN
semanticamente plausível na sentença que poderia ser o controlador apropriado para o
PRO. Os tempos totais de fixação alcançam 1806ms e os índices de interpretação de
controle são de 36%. A interpretação arbitrária do PRO é, portanto, a mais dispendiosa,
pois exige escaneamento visual intenso na busca do SN plausível, recorrendo-se à
interpretação arbitrária apenas quando essa busca se revela infrutífera. Esses resultados
vão ao encontro de vários estudos psicolinguísticos que têm consistentemente
estabelecido a prioridade das análises estruturais sobre as interpretações inferenciais (cf.
Clifton e Ferreira, 1989, entre vários outros). Os resultados também se alinham com
outros, obtidos para o processamento de PRO em espanhol por Betancort, Carreiras e
Acuña-Farina (2006), que demonstram que o processador busca imediatamente um
168
antecedente na frase para a categoria vazia PRO, assim que essa é encontrada. Em
conformidade com o que se espera na especialidade do processamento de frases,
Modesto e Maia (2017) demonstraram a prioridade dos processos estruturais sobre os
inferenciais no processamento do PRO em PB: quando os leitores encontram o sujeito
nulo do verbo no infinitivo flexionado, dão início imediatamente a uma busca de um
antecedente na frase, como default. Modesto e Maia (2017) argumentam, então, que os
resultados do experimento demonstram uma harmonia entre a análise representacional e
os algoritmos de processamento, que são tomados pelos autores como eficiência
computacional, podendo constituir um exemplo do que Chomsky (2005) denomina de
terceiro fator. Pode-se concluir, portanto, nesse caso, que efeitos de processamento
atuam como terceiro fator e interagem com os princípios da GU e com propriedades
gramaticais das línguas específicas, o que pode, algumas vezes, trazer tensões, quando
se aplicam nas derivações, mas frequentemente tendem a se harmonizar com elas e,
provavelmente, não sobrepujam os princípios internos da gramática.
Espera-se haver demonstrado nesta seção que há, frequentemente, relações
harmônicas entre os níveis de aferição do processamento e da representação gramatical,
o que não justificaria, no entanto, o reducionismo de um nível a outro. Nos termos de
Chomsky (2003), não há redução da mente à matéria ou da matéria à mente. Da mesma
forma que, em Medicina, não há redução da perspectiva da disciplina da Anatomia, que
enfoca a organização estrutural dos seres vivos, à perspectiva da Fisiologia, que analisa
os processos de funcionamento orgânico desses seres. Obviamente, ambas as
perspectivas incidem sobre um único e mesmo corpo. Reequacionando, então, o
problema de Descartes, poderíamos dizer que res cogitans e res extensa seriam, nesta
ótica, perspectivas de aferição distintas sobre uma mesma e única res. Aferições essas
que, como argumentamos nesta seção, podem, em muitos casos, ser perfeitamente
harmônicas.
Dar e receber papéis temáticos têm o mesmo custo?
Em contraste com o estudo reportado anteriormente, em que se encontrou

correlação harmônica entre a representação gramatical e o processamento de frases, o
estudo revisado nesta seção identifica custos de processamento diferenciados entre a
atribuição e o recebimento de papel temático pelo verbo, que não são, necessariamente,
aproveitados na teoria gramatical, que não distinguiria no Critério theta (Chomsky,
169
1981) nenhuma diferença entre a atribuição e o recebimento de papel temático. O estudo
reportado em detalhe em Maia (2014) será aqui brevemente revisto. Maia (2014) revê o
critério-theta, que prevê biunivocamente que o núcleo do predicado atribua papéis aos
argumentos e que cada argumento receba no máximo um papel, sem diferenciar,
portanto, a atribuição do recebimento de papel temático. Maia entretém a hipótese de
que, ao contrário do previsto na proposta de representação da teoria gramatical, haveria
uma assimetria no processamento, entre a atribuição e o recebimento de papel temático:
O SN seria mais “ativo” em sua busca de licenciamento gramatical do que o verbo, em
sua busca de atribuição de papel temático. Para demonstrar essa diferença entre a
representação e o processamento, Maia revê, inicialmente, duas estratégias de
processamento, a saber, o Princípio do Antecedente Ativo (cf. Clifton & Frazier, 1989)
e a Estratégia da Lacuna Ativa (cf. Ng, 2008[NÃO CONSTA NAS REFERÊNCIAS]) comparando-
se, em seguida, em um experimento de leitura automonitorada, os dois efeitos. O
Princípio do Antecedente Ativo prevê que um elemento em posição A-barra, que não
recebe Caso ou papel temático naquela posição, procure como primeiro recurso uma
posição vazia na frase, em que possa se tornar visível para Caso e receber papel
temático para, assim, poder ser interpretado. A Estratégia da Lacuna Ativa, por outro
lado, prevê que, quando o elemento atribuidor de papel temático precede o elemento a
que deve atribuir um papel, haja também um processo de busca ativo para atribuir esse
papel. Destacam-se, nesta revisão, apenas duas das condições diretamente relevantes,
exemplificadas pelas frases a seguir, que incluem as segmentações feitas no
experimento:
(5) Para quem / o redator / enviou /o manual /no escritório/ sábado /de manhã?
(6) O redator / enviou / o manual / no escritório / para quem / sábado/ de manhã?
Em (5), o Sintagma-QU “Para quem” precisa encontrar uma lacuna na frase

como primeiro recurso, o que poderia ocorrer após o SN complemento “o manual”. A
posição se encontra, no entanto, preenchida pelo SP “no escritório”, o que causa o efeito
da lacuna preenchida, aferido comparando-se os tempos de leitura desse SP em frases
controles onde não há esse efeito. Já em (6), a forma verbal “enviou”, que subcategoriza
tanto um SN complemento, quanto um SP alvo, precisa também atribuir os seus papéis
temáticos, conforme prevê o Critério-theta. O papel temático de paciente é atribuído
sem delongas ao SN complemento “o manual”. No entanto, o papel de alvo não pode
170
ser atribuído apropriadamente ao SP locativo “no escritório”, verificando-se, portanto, o
efeito da lacuna ativa, aferido comparando-se os tempos médios de leitura de “no
escritório”, em frases controle, em que este SP não preenche lacuna. Os resultados do
estudo de leitura automonitorada indicaram que em (5) o SP “no escritório”, em frase
com antecedente ativo, exibe latências significativamente mais elevadas (929ms), do
que o mesmo SP em (6) (830ms), frase com lacuna ativa. Obtiveram-se, portanto,
resultados que indicam a maior magnitude na busca por papel temático por um
antecedente ativo do que na atribuição de papel temático por uma lacuna ativa. Em
outras palavras, a surpresa do parser ao encontrar preenchida a lacuna postulada como
primeiro recurso, para analisar o SP-QU deslocado, em (5), seria significativamente
maior do que a frustração obtida na tentativa de atribuição de papel pelo verbo de (6) ao
encontrar o SP não alvo “no escritório” ocupando a primeira posição em que um SP
alvo poderia ser postulado para receber Caso e papel temático. Tal assimetria, que não é
prevista, originalmente, na formulação biunívoca da teoria-theta, seria um fenômeno do
nível do processamento, não precisando, necessariamente, ser uma propriedade do nível
da arquitetura gramatical, embora razões intrateóricas possam até vir, em futuros
modelos, a prever a assimetria como parte do aparato gramatical.
Na presente seção, procuramos demonstrar que, em contraste com a harmonia
entre a representação e o processamento do infinitivo flexionado, discutida em 3.1. [A
QUAL SEÇÃO SE REFERE?], pode haver também discrepâncias entre as formulações da
teoria gramatical e as formulações do processamento. Repensando nesses termos o
problema de Descartes, conclui-se que res cogitans e res extensa podem, sim, diferir,
mas seriam, como propõe seminalmente Chomsky, perspectivas de aferição de uma
única e mesma res.
Representação e Processamento da recursividade direta e indireta e o erro de

Everett
A propriedade central da sintaxe na Gramática Universal é a recursividade, que

pode ser caracterizada como uma operação que toma a sua saída como entrada, nos
termos de Roeper (2010 [NÃO CONSTA NAS REFERÊNCIAS]). Os constituintes podem ser
mergidos formando estruturas recursivas diretas e indiretas. A recursividade direta gera
construções com interpretação conjuntiva, enquanto a recursividade indireta gera
171
estruturas de encaixe (self-embedding), como exemplificado em (7) e (8),
respectivamente:
(7) Tem peixe no cesto, no banco, no barco e na praia.

(8) Tem peixe no cesto no banco no barco na praia.
No Programa Minimalista (cf. Chomsky, 1995, além do capítulo “O Programa

Minimalista”, neste volume), a recursividade é entendida como um epifenômeno da
operação Merge, que combina elementos, podendo operar recursivamente. Hauser,
Chomsky e Fitch (2002 [NÃO CONSTA ESTA DATA NAS REFERÊNCIAS]) propuseram que a
recursividade é central e exclusiva da faculdade humana da linguagem. Everett (2005)
afirma, no entanto, que na língua indígena brasileira pirahã (família Mura, Amazonas)
não existiria a recursividade indireta, sendo que em trabalho posterior (Everett, 2009),
ele afirma também que a operação Merge é desnecessária em pirahã, assim como a
recursividade, insinuando uma “abordagem alternativa à sintaxe” que não é, no entanto,
discutida em maior detalhe (cf. Everett, 2009: 438). Nesta seção, procuraremos
demonstrar que a proposta de Everett comete dois erros. O primeiro é um erro
fundamental de metodologia, o erro do Tipo II, ou falso negativo. O segundo é
justamente o tema central deste capítulo, a saber, o binômio representação-
processamento que, a nosso ver, é confundido por Everett. Trataremos inicialmente do
primeiro erro, demonstrando o falso negativo em que Everett incorre: a ausência de
evidência não deve ser tomada como evidência da ausência. Em outras palavras, não
tendo encontrado evidências de encaixes oracionais recursivos, Everett não deveria
afirmar que a recursividade não existiria em pirahã tout court. Esse erro será
demonstrado revisando-se brevemente dois estudos45 que encontraram encaixamento na
gramática pirahã, a saber, construções relacionadas à Teoria da Mente, expressando
crenças de segunda ordem e construções com SPs encaixados e justapostos. Em
seguida, discutem-se construções de encaixe de SPs em karajá (tronco macro-jê,
Tocantins), para demonstrar o segundo erro de Everett, a saber, a obliteração ilegítima
da distinção entre a representação e o processamento.
Sauerland (2018[NÃO CONSTA NAS REFERÊNCIAS]) argumenta que construções de
discurso reportado caracterizam-se pelo fato de que o falante não precisa,
necessariamente, compartilhar a atitude no verbo da oração mais alta com a atitude
reportada na oração encaixada, ou seja, o falante pode até mesmo discordar do conteúdo
172
da oração encaixada. Por exemplo, observa Sauerland, ao dizer uma frase como “João
disse que eu me comportei mal”, obviamente eu não preciso me comprometer com a
verdade da assertiva “eu me comportei mal”. Baseado nesse fato, Sauerland construiu
com a ajuda de consultores pirahã, dez diálogos curtos, como o exemplificado a seguir:
(9) A: ce kahape ogehiai igeuo

Eu tenho-estado estrelas lá
“Eu estive nas estrelas”
B: Toe hi gai- sai ce kahape ogehiai igeuo

Toe 3s falar 1s tenho-estado estrelas lá
Subordinação: Toe fala “Eu estive nas estrelas.”

Coordenação: Toe fala e eu estive nas estrelas.
Sauerland adicionou a suas sentenças alvo 9 itens de controle, aplicando a 16

falantes de pirahã um pequeno teste no qual um falante pronunciava a frase A para o
sujeito testado, seguido pela enunciação da frase B por outro falante pirahã. Após a
enunciação, solicitava-se aos participantes que respondessem à pergunta “O falante B
disse a verdade?”, com ma’a “sim” ou maabi “não”. A lógica do experimento era a de
que, se os pirahã não fossem capazes de encaixe, a frase B só poderia ser compreendida
como coordenação ou como duas frases separadas, devendo ser julgada como falsa. Se,
por outro lado, os pirahã forem capazes de encaixe, a frase B poderia ser julgada como
verdadeira, caso Toe tivesse dito antes, na frase A, que ele tinha estado no céu.
Sauerland conclui que, de fato, os dados dos 16 pirahã testados “inequivocamente
apoiam a análise de subordinação” (Sauerland, 2018: 31), demonstrando que os pirahã
computam pelo menos um nível de encaixe subordinativo, falseando, portanto, a
proposta de Everett (2005).
Conforme apresentado em Maia et al. (data [CONFERIR]), dois testes pilotos
foram realizados com falantes de pirahã por Sândalo et al. [QUAL DATA?] para investigar
a computação de SPs justapostos e encaixados. O primeiro consistiu em apresentar três
conjuntos de imagens aos participantes, pedindo que eles indicassem qual delas
combinaria melhor com frases previamente elucidadas em pirahã. As frases poderiam
conter ou não a partícula coordenativa piai. As imagens inequivocamente indicavam
173
uma representação de justaposição (e.g., Jacaré na areia, na esteira e também na pedra)
ou de encaixe (e.g., Jacaré na esteira na pedra na areia). O segundo teste piloto foi do
tipo “act-out”, pedindo ao participante pirahã que executasse o comando dado por outro
pirahã. Essas sentenças foram previamente elucidadas podendo indicar coordenação
entre dois ou três SPs ou encaixe recursivo de dois ou três SPs:
(10) ihiaipati gigohoi kopo ko tiapapati apo piai

colocar moeda copo em cadeira sobre também
“Coloque a moeda no copo e na cadeira”
(11) ihiaipati gigohoi kopo ko tiapapati apo

colocar moeda copo em cadeira sobre
“Coloque a moeda no copo na cadeira”
(12) ihiaipati gigohoi kapiiga apo tiapapati apo (piai) tabo apo piai
colocar moeda papel sobre cadeira sobre (também) tábua sobre
também
“Coloque a moeda no papel, na cadeira e no tablado”
(13) ihiaipati gigohoi kapiiga apo tiapapati apo tabo apo
colocar moeda papel sobre cadeira sobre tábua sobre
“Coloque a moeda no papel na cadeira no tablado”
Os autores concluem que os pirahã que participaram de ambos os estudos pilotos

não demonstraram qualquer dificuldade ao lidar com construções de encaixe, tanto no
teste de combinação entre imagem e frases quanto no teste de execução de comandos,
ao contrário do que prevê Everett, que afirma estarem disponíveis na gramática pirahã
apenas estruturas paratáticas. Como demonstrado, os falantes pirahã identificaram
figuras, formularam e executaram comandos envolvendo dois ou três níveis de encaixe,
embora suas preferências espontâneas parecessem favorecer a coordenação. Este último
ponto nos leva justamente à questão que dá título ao presente capítulo, ou seja, a
diferenças entre a representação gramatical e o processamento de frases.
Maia (2016) apresenta e discute dois experimentos psicolinguísticos de
rastreamento ocular comparando o processamento da coordenação e do encaixe de SPs,
em PB e em karajá. O experimento 1 comparou o processamento de frases contendo SPs
que podiam estar coordenados ou encaixados recursivamente em PB; o experimento 2
174
comparou o processamento de Sintagmas Posposicionais que poderiam estar
recursivamente encaixados ou coordenados em karajá. No total, 20 sujeitos falantes de
PB e 20 de karajá tiveram seus movimentos oculares monitorados enquanto realizavam
uma tarefa de julgamento de correspondência entre frase e imagem. Com base em
estudos anteriores (Maia et al., 2018), duas hipóteses foram formuladas, tanto para o PB
quanto para o karajá, a saber, (i) o lançamento do processo de encaixe de SPs seria mais
custoso para processar do que o lançamento do processo de coordenação de SPs; (ii)
após o lançamento, o terceiro SP seria menos custoso do que o SP anterior. Os
resultados confirmaram essas previsões, demonstrando que embora o processo de
subordinação seja, de fato, mais custoso inicialmente de processar do que o processo de
coordenação, ambos estão igualmente disponíveis na gramática do português e do
karajá.
Finalmente, gostaríamos de salientar que a proposta feita em Everett (2005) de
que a recursão indireta não seria encontrada na língua indígena brasileira pirahã pode
ser resultado de um falso negativo, por duas razões: (i) as línguas apresentam uma vasta
gama de recursos gramaticais ainda pouco estudados, que podem ser usados inclusive
para formar construções recursivas diretas ou indiretas (por exemplo, Gomes, França,
Maia e Rilliard, 2017[NÃO CONSTA NAS REFERÊNCIAS], demonstram que o encaixe recursivo
de relativização pode ser codificado gramaticalmente na língua indígena karajá através
de variações na localização do acento de intensidade, caracterizando processo que,
embora incomum nas línguas mais conhecidas, é produtivamente utilizado em karajá
para expressar um tipo de modificação que é mais frequentemente expresso através de
partículas relativizantes ou nominalizações); (ii) embora sejam mais difíceis de
processar do que as construções de coordenação, tendendo a aparecer com menor
frequência nos corpora, as construções de encaixe recursivo (mesmo podendo não ser
igualmente produtivas por razões de processamento) podem estar, de fato, disponíveis
na gramática. Por essas razões, estudos que se pretendam realmente criteriosos devem
distinguir entre fatores de representação e de processamento, evitando falsos negativos,
antes de fazer afirmações definitivas sobre a inexistência de processos recursivos nas
diferentes línguas.
175
Retomamos aqui a questão que dá título ao presente capítulo: o Problema de
Descartes em Linguística. Assim como na área médica, anatomia e fisiologia se
referem naturalmente a um único corpo e, na física, a estática e a dinâmica podem se
referir ao mesmo sistema de forças, em Linguística, representação e processamento
devem ser considerados níveis distintos de aferição do mesmo sistema cognitivo. É a
proposta que preserva as ontologias próprias do saber gramatical e do fazer do
processamento, garantindo as tensões – convergências e divergências – necessárias
entre os dois níveis e evitando não só a unificação eliminacionista, mas também os erros
resultantes da confusão entre as propriedades do portfolio da gramática, que nem
sempre se atualizam com a mesma produtividade, e os princípios independentes do
processamento linguístico.
Em resumo, reafirmamos que representação e processamento não devem ser
reduzidos um ao outro, sob pena de causar perda de conteúdo e, principalmente, de
levar a erro, como o que atribuímos a Everett, que teria cometido um falso negativo por
deixar de considerar diferentes construções que admitiriam recursão em pirahã e,
aparentemente, por confundir os níveis da representação e do processamento
gramaticais. Por um lado, como já dissemos, a ausência de evidência não deve ser
tomada como evidência da ausência; por outro, o custo de processamento não pode, em
si, desqualificar uma construção como gramatical. Para corrigir o erro, basta não
desconsiderar os conceitos nucleares – desnecessariamente contestados – de Chomsky,
que, em última análise, propõe que a res cogitans e a res extensa cartesianas, devem ser
apropriadamente compreendidas como níveis de análise diferenciados de uma única e
mesma res.
Referências
AMARAL, L. et al. Recursion across domains. Cambridge: Cambridge University Press, 2018.
ANTONY, L.; HORNSTEIN, N. Chomsky and his critics. Blackwell Publishing, Oxford, 2003.
BETANCORT, M.; CARREIRAS, M.; ACUÑA-FARINA, C. Processing controlled PROs in
Spanish.Cognition, v. 100, 2006, pp. 217-282.
BEVER, T. The cognitive basis for linguistic structures. In: HAYS, J. R. (ed.) Cognition and the
Development of Language. New York: Wiley, 1970.
CHOMSKY, N. Syntactic Structures. Mouton: The Hague, 1957.
______. Aspects of the theory of syntax. Cambridge, MA: MIT Press, 1965.
______. Lectures on government and biding. Dordrecht: Foris, 1981.
176
______ The Minimalist Program. Cambridge, MA: MIT Press, 1995.
______. Some core contested concepts. Journal of Psycholinguistic Research 44.1, pp. 91-104, 2015.
______. Three factors in Language Design. Linguistic Inquiry, v. 36, pp. 1-22, 2005.
CHURCHLAND, P. M. Eliminative Materialism and the Propositional Attitudes. Journal of Philosophy 78,
pp. 67-90, 1981.
CLIFTON, C.; FERREIRA, F. Ambiguity in context. Language and Cognitive Processes, v.4, pp. 77-103,
1989.
______; FRAZIER, L. Comprehending sentences with long distance dependencies. In: TANENHAUS, M. K.;
CARLSON, G. (Eds.). Linguistic structure in language Processing. Dordrecht: Kluwer Academic
Press, 1989.
COWART, W. Experimental Syntax: Applying objective methods to sentence judgments. Thousand Oaks:
Sage Publications, 1997.
DESCARTES, R.. Discourse on Method, Part V. London: Nelson Publishers, 1637/1966.
______. Méditations Métaphysiques. Paris: Pierre Le Petit – Imprimeur Ordinaire du Roi, 1641, fac-
símile.
EVERETT D. Cultural constraints on grammar and cognition in Piraha: Another look at the Design
Features of human language. Current Anthropology, 2005.
______. Pirahã culture and grammar: a response to some criticisms. Language, 85 (2), 2009.
FODOR, J.; BEVER, T.; GARRETT, M. The Psychology of Language. Na Introduction to Psycholinguistics
and Generative Grammar. New York: McGraw Hill, 1974.
FRAZIER, L. On comprehending sentences: Syntactic parsing strategies. Tese (Doutorado) – University of
Connecticut (Indiana University Linguistics Club), 1979.
______; FODOR, J. D.The sausage machine: A new two-stage parsing model. Cognition, 6, pp. 291-325,
1978.
FRAZIER, L.; RAYNER, K. Making and correcting errors during sentence comprehension: Eye movements
in the analysis of structurally ambiguous sentences. Cognitive Psychology, v. 14, pp. 178-210, 1982.
GOMES, J.; FRANÇA, A. I.; MAIA, M. A. R.; RILLIARD, A. Prosody as a recursive embedding tool in
production and perception of karajá: an acoustic and neuropsycholinguistic investigation. Joss, v. 5,
pp. 101-123, 2017.
HARLEY, T. The Psychology of Language: From Data to Theory. New York, NY: Psychology Press,
1996.
HAUSER, M.; CHOMSKY, N.; FITCH, W. T. The Language Faculty: What is it, who has it, and how did it
eolve? Science, 298, 1569–1579.
KIMBALL, J. Seven principles of surface structure parsing in natural language. Cognition 2 (1), pp. 15-47,
1973.
LEWIS, S.; PHILLIPS, C. Aligning Grammatical Theories and Language Processing Models. Journal of
Psycholinguistic Research 44, pp. 27-46, 2015.
MAIA, M. Teoria gramatical, sintaxe experimental e processamento de frases: explorando efeitos do
antecedente e da lacuna ativos. Revista da ABRALIN, v. 13, p. 95-120, 2014.
177
______. A computational efficiency principle in action in the processing of recursively embedded PPs in
Brazilian Portuguese and in Karajá. Gragoatá, v. 40, p. 157-174, 2016.
______ et al. The processing of PP embedding and coordination in Karajo and in Brazilian Portuguese.
In: AMARAL, L.; MAIA, M.; NEVINS, A.; ROEPER. Recursion across domains. Cambridge:
______. Dimensões do processamento sintático. A aparecer.
MARANTZ, A. Generative linguistics within the cognitive neuroscience of language. The Linguistic
Review, 22, pp. 429-445, 2005.
MILLER, G. A.; CHOMSKY, N. Finitary models of language users. In:. LUCE, R. D; BUSH, R. R.;
GALANTER, E. (Eds.). Handbook of mathematical psychology. New York: Wiley, 1963.
MILLER, G. A.; ISARD, S. Some perceptual consequences of linguistic rules. Journal of Verbal Learning
and Verbal Behavior, 2, pp. 217-228, 1963.
______; MCKEAN, K.O. Chronometric study of some relations between sentences . Quarterly Journal of
Experimental Psychology, 16, 1964.
MODESTO, M. What Brazilian Portuguese says about control: remarks on Boeckx & Hornstein. Syntax, v.
13, n. 1, pp. 78-96, 2010.
MODESTO, M. Inflected infinitives in Brazilian Portuguese and the theory of control. In: GONÇALVES, A.
(Org.). Complement Clauses in Portuguese: Syntax and Acquisition. Amsterdam: John Benjamins.
2016a.
______; MAIA, Marcus. Representation and Processing of the Inflected Infinitive in Brazilian Portuguese:
an eye-tracking study. Revista de Estudos da Linguagem, v. 25, pp. 1183-1224, 2017.
NG, S. An Active Gap Strategy in the Processing of Filler-Gap Dependencies in Chinese. Proceedings of
the 20th North American Conference on Chinese Linguistics (NACCL-20). Edited by Marjorie
K.M. Chan and Hana Kang. Columbus, Ohio: The Ohio State University, 2008 . v. 2.
PHILLIPS, C. Parser-grammar relations: we don’t understand everything twice. In: SANZ, M.; LAKA, I.;
TANENHAUS, M. (Eds.). Language down the Garden path: the cognitive and biological basis for
linguistic structure, (Papers in honor of Thomas G. Bever). Oxford University Press, 2012.
; WAGERS, M. Relating Structure and Time in Linguistics and Psycholinguistics. In: GASKELL, G. (Ed.),
Oxford Handbook of Psycholinguistics. Oxford University Press, 2007, pp. 739-756.
RODRIGUES, C.; HORNSTEIN, N. Epicene Agreement and Inflected Infinitives When the Data Is “Under
Control”: A Reply to Modesto (2010). Syntax, v. 16, pp. 292-309, 2013.
RODRIGUES, C.; SALLES, R.; SÂNDALO, F. Word Order in Control: Evidence for Self-Embedding in
Pirahã. In: AMARAL, L.; MAIA, M.; NEVINS, A.; ROEPER. Recursion across domains. Cambridge:
ROEPER, T. Recursion: what is innate, why it needs a trigger, where it belongs in cross- linguistic work
and How it fits into the Mind. In: FRANÇA, A.; MAIA, M. (Orgs.). Papers in Psycholinguistics. Rio
de Janeiro: Imprinta, pp. 38-60, 2010.
SÂNDALO, F. et al. Self-Embedded Recursive Postpositional Phrases in Pirahã: A Pilot Study. In:
AMARAL, L.; MAIA, M.; NEVINS, A.; ROEPER. Recursion across domains. Cambridge: Cambridge
178
SAUERLAND, U. False Speech Reports in Pirahã: A Comprehension Experiment. In: AMARAL, L.; MAIA,
M.; NEVINS, A.; ROEPER. Recursion across domains. Cambridge: Cambridge University Press,
2018.
O PROBLEMA DE BROCA
Aniela Improta França
179
Desde os anos 1950, Chomsky demarcou um perímetro filosófico muito claro
dentro do qual a Gramática Gerativa iria atuar. O Depois de Chomsky tornou-se um
marco epistemológico porque a capacidade do mundo ao observar fatos corriqueiros
como a aquisição de linguagem nos primeiros anos da infância nunca mais foi a mesma.
A teoria especializou o olhar do linguista para uma gama de fenômenos que se passam
longe da apresentação superficial, fruto do desempenho do falante.
Por exemplo, na sentença Instintivamente, linguistas que se interessam por
biologia se tornam experimentalistas,46 o advérbio instintivamente modifica o verbo
tornar-se, e não o verbo interessar-se, apesar da distância linear entre instintivamente e
interessar-se ser menor do que a distância entre esse advérbio e o verbo tornar-se.
Porém, é importante notar que a distância estrutural entre instintivamente e tornar-se é
menor, porque ambos estão na oração principal, enquanto interessar-se se encontra na
oração subordinada. Sem hesitar, falantes nativos adultos e crianças adotam o cálculo
mais complexo que se baseia na distância estrutural, que é uma informação subjacente.
Portanto, rejeitam a simplicidade da distância linear (Chomsky, 2015: 46).
Com observações simples e agudas como essa, Chomsky levou a Gramática
Gerativa para o centro da Revolução Cognitiva iniciada nas universidades da Nova
Inglaterra, nos Estados Unidos, nos anos 1950-1960, como já foi discutido nos três
primeiros capítulos do livro. Ele reposicionou a Linguística entre as ciências naturais,
explicitando o seu objetivo último de entender por quais processos falantes de qualquer
uma das (aproximadamente) 6.000 línguas humanas conseguem usar criativamente e de
forma infinita um número finito de primitivos linguísticos.
Nas versões Transformacional e Regência e Ligação, o programa de estudos
gerativista retoma Grandes Problemas da ciência – os Problemas de Humbolt, Platão e
Descartes – discutidos anteriormente neste volume. A teoria fez ressaltar as
propriedades da língua-I, um sistema interno ao indivíduo, biologicamente determinado
e exclusivo da espécie, como já foi visto.
Ao procurar por princípios que restrinjam as regras gerativas, o pensamento
chomskyano converge para a Teoria de Princípios e Parâmetros (veja o capítulo “Teoria
da Regência e Ligação e a proposta de Princípios e Parâmetros” neste volume). Nesse
ponto, a teoria atingiu adequação explicativa articulando princípios gerais (Gramática
Universal, GU) e parâmetros abertos que caracterizam o estado inicial da faculdade da
180
linguagem, isto é, as estruturas mentais biologicamente dotadas a partir das quais,
naturalmente e sem esforço, se dá a aquisição de linguagem nos bebês.
A linguagem da criança cresce em sua mente assim como o sistema visual

desenvolve a capacidade para a visão binocular ou assim como a criança
entra na puberdade em um certo estágio de maturação. A aquisição de
linguagem é alguma coisa que acontece com a criança, não é algo que ela
faça. (Chomsky, 1994: 29)
Essa forma de entender os sistemas cognitivos impacta também o pensamento

de cientistas que estudam outros sistemas biológicos. Em 1984, Niels K. Jerne,
eminente imunologista dinamarquês radicado na Inglaterra, ganhou o Prêmio Nobel de
fisiologia por sua pesquisa explicando o funcionamento e a variedade dos anticorpos
que atuam na relação antígeno- anticorpo. Jerne mostra que ao interagir com o antígeno
(do vírus, por exemplo), os anticorpos do indivíduo podem se moldar para provocar
uma série de respostas imunes adequadas para bloquear a ação daquele invasor.
Na noite do recebimento do prêmio, no Château de Bellevue na França, Jerne
proferiu um discurso intitulado The Generative Grammar of the Immune System (A
Gramática Gerativa do Sistema Imunológico), e fez menção direta à Teoria de
Princípios e Parâmetros de Chomsky, que, segundo ele, o ajudou a conceituar o
processo de que no sistema imune, uma parte da estrutura de defesa é fixa, determinada
pelo DNA, mas uma parte restante dos anticorpos se forma por escolha paramétrica de
um entre um repertório de respostas disponíveis ao indivíduo para um dado tipo de
antígeno. Jerne demostrou que a escolha é feita a partir do contato do anticorpo com o
antígeno no meio, ou seja, a partir do contato entre anticorpo-antígeno.
Jerne arriscou ainda dizer que, mediante verificação empírica das hipóteses de
Chomsky, a Linguística deveria ser um novo ramo da biologia. De fato, estando tão
afeita a descrições e explicações que fazem sentido ao arcabouço de informações sobre
os sistemas biológicos, a partir dos anos 1990, a Gramática Gerativa passou por uma
reformulação buscando atender critérios de economia dos sistemas biológicos.
[Há uns 60 anos] para muitos biólogos, a variedade de organismos parecia ser
quase infinita. Contudo, trabalhos mais recentes mostraram que a diversidade
é, de fato, fortemente restrita, tanto que agora é possível se especular que
pode haver até mesmo um “genoma universal” para o Reino Metazoa (o reino
dos seres vivos pluricelulares). Portanto, todo o Reino teria apenas um único
animal multicelular de um ponto de vista apropriadamente abstrato. Algo
semelhante aconteceu no estudo da linguagem – na minha opinião, pelo
menos. Ao longo dos anos, foi demonstrado, de forma convincente, que
181
grande parte da complexidade poderia ser eliminada e que a variedade de
línguas é muito mais restrita do que parecia ser o caso. (Chomsky, 2015: 128)
Assim chegou a teoria em sua versão atual, o Programa Minimalista, que

entende a cognição de linguagem como um sistema fundamentalmente mais simples do
que se havia descrito anteriormente e mais em conformidade com outros sistemas
biológicos (cf. Chomsky, 1993, 1995, além do capítulo “O Programa Minimalista”,
neste mesmo volume). Nessa versão, o sistema gerativo recursivo produz expressões
limitadas pelas condições impostas pelas interfaces semântico-pragmática e sensório-
motora.
Com efeito, o Minimalismo renovou a motivação e explicitou as ferramentas
para se investigar a fisiologia da linguagem. A clara explicitação das fronteiras do
componente micromodular onde se dá a computação de linguagem propriamente dita
(narrow syntax, Chomsky, 2001), posiciona além do perímetro central de visibilidade
um conjunto variado de mecanismos de interface entre a computação gramatical e os
sistemas de desempenho externos a ela, como a interpretação semântico-pragmática, a
memória, a decodificação e a codificação da fonética, além de instruções motoras para o
aparelho fonador. Assume-se que cada módulo linguístico, com seus traços mínimos
primitivos, interaja, de forma específica, com módulos externos à linguagem, com os
quais faz interface. O licenciamento desses traços, veículos da intensa comunicação
intermodular, passa a ser um campo de estudo imprescindível para as ciências
cognitivas, entre elas a própria linguística. Por isso é desejável conhecer os traços
primitivos e entender como o cérebro os computa de forma a gerar produtos legítimos
nas interfaces.
Para ganhar esse novo terreno no âmbito do Programa Minimalista, o grande
objetivo é enfrentar-se enfim o Problema de Broca: unificar a porção sutil da cognição
de linguagem no âmbito da mente, com sua contraparte física no cérebro. Essa
unificação está programada na obra de Chomsky na forma da quarta questão
fundamental elencada neste volume: quais são os mecanismos físicos no cérebro do
falante que servem de base para o sistema de conhecimento linguístico e para seu uso?
(Chomsky, 1986).
Esse novo espaço legítimo de investigações de computações linguísticas no
cérebro vem se impondo junto à Neurociência. Usando a teoria linguística como guia,
tem sido possível cumprir objetivos programáticos de se atingir níveis mais internos e
182
fisiológicos da cognição não diretamente transparentes na expressão do desempenho. O
convite para tomar esse espaço foi feito pelo próprio Chomsky.
As noções externa e interna derivam de uma abordagem do estudo da

linguagem que me parece dúbia de começo, uma abordagem que procura
distinguir evidência linguística de evidência psicológica. Um dado específico
não vem com uma etiqueta presa na manga indicando seu propósito. É só um
dado que pode ser encarado como uma evidência de alguma coisa à luz de
uma teoria. Julgamentos de gramaticalidade de sentença (essencialmente
perceptuais) são dados legítimos, assim como resultados de estudos de
priming e de atividade elétrica do cérebro. [] Naturalmente, temos esperança
de podermos unificar estes [dados]: por exemplo, como a atividade elétrica se
relaciona com as representações e derivações ou como elementos dos
sistemas computacionais se relacionam com as células. (Grewendorf, 1994:
296)
Apesar de haver muitos momentos em que Chomsky fala de modo positivo

sobre o desideratum de unificação dos dados linguísticos, psicológicos e fisiológicos,
inegavelmente, além das dificuldades empíricas, existe ainda resistência para se
estender a pesquisa linguística em Gramática Gerativa para a Neurociência da
linguagem. Um dos objetivos deste capítulo é entender melhor as motivações para esse
estado de coisas.
Depois dessa introdução, serão apresentados e comentados fatos históricos que
situam o Problema de Broca e as barreiras principais de ordem técnica, epistemológica e
psicológica para a sua suplantação. Em seguida, serão apresentados os desafios
modernos e algumas alternativas que começam a aparecer século XXI.
O P(p)roblema de Broca
No dia 11 de abril de 1861, um homem de 51 anos foi transferido para a

enfermaria cirúrgica do Hospital Bicêtre, onde o Dr. Pierre Paul Broca (lê-se bro-CAH),
médico, anatomista e antropólogo francês, dava plantão. O paciente, cujo nome era
Leborgne, sofria com a epilepsia desde a infância. O estado do paciente era grave
devido à gangrena que se estendia da ponta do pé direito até a virilha. Broca viu na ficha
do paciente que, apesar da epilepsia, ele havia conseguido trabalhar como sapateiro até
os 30 anos. Depois, a doença se agravou e o incapacitou para o trabalho e para a vida
independente. Parou de falar, condição à época, conhecida como afemia. O paciente
tornou-se residente do hospital, onde já morava há 21 anos. A ficha revelava que além
da afemia, o paciente era lúcido, preservara o raciocínio lógico e normalmente era
183
afável. Havia um fato interessante que chamou a atenção de Broca. O paciente
respondia a tudo o que lhe era perguntado através da repetição da sílaba tan, que
formava a palavra prosódica, tantan, reiterada inúmeras vezes como se fossem palavras
comuns do francês concatenadas em uma frase com prosódia regular. Esse
comportamento deu notoriedade ao paciente, conhecido por todos em Bicêtre como Tan
(Benton, 1981).
Uns parênteses históricos. Na sociologia médica da época, havia um debate
polarizado sobre a organização da função cerebral, entre os localizacionistas e os
holistas. Os localizacionistas derivavam da frenologia, um movimento do final do
século XVIII liderado pelo neuroanatomista Franz Joseph Gall e seu pupilo, Johann
Gaspar Spurzheim, que tentavam estabelecer uma relação de um para um entre as
irregularidades topográficas do crânio e as funções mentais de alto nível, traduzidas em
aspectos fixos de caráter moral – faculdades ou aptidões. Também sob essa perspectiva,
argumentava-se que havia centros do cérebro especializados para certas tarefas.
Dissecando o cérebro de baixo para cima, Gall seguiu o caminho dos nervos
e concluiu que eles chegavam a lugares diferentes por todo o cérebro. Não verificou
uma confluência para um órgão central que comandaria toda a cognição e a
personalidade, mas, sim, identificou áreas com diferentes arranjos celulares ligadas aos
nervos. Interpretando esse achado anatômico como indício de modularidade, Gall
propôs que as irregularidades anatômicas seriam oriundas de crescimento celular
exacerbado, ou de morte de tecido cerebral que subservia uma dada característica sutil.
Ele pensava que quanto mais desenvolvida fosse uma característica psicológica maior
hipertrofia da área cerebral correspondente a ela haveria, a ponto de deformar a parte do
crânio sobre essa região com uma concavidade ou protuberância. Por exemplo, a região
fronto-central foi mapeada como sendo o centro da benevolência. Uma concavidade no
crânio naquele lugar indicaria que o indivíduo seria marcadamente sádico. Gall mapeou
todos os centros dos sistemas cognitivos no cérebro. A linguagem, por exemplo, estaria
na porção orbital do lobo frontal bilateralmente (Luzzatti e Whitaker, 2001).
Os mapas localizacionistas da frenologia em pouco tempo saíram das mãos dos
cientistas e ganharam as praças do mundo, nas mãos de especuladores. Especialmente
depois da excursão de Spurzheim, em 1832, e de seu discípulo George Combe entre
1838-40 aos Estados Unidos, muitas sociedades frenológicas se formaram, e
profissionais da frenologia passaram a fazer espetáculos para grandes públicos
oferecendo leituras dos crânios de personagens e políticos eminentes e de pessoas
184
importantes locais. Tem-se notícia de que, no ano do lançamento do principal livro de
Combe, “A Constituição do Homem”, somente a Bíblia o tenha superado em número
de exemplares vendidos. Essa prática comercial acabou por desmoralizar a frenologia e
todos os neurologistas que tinham simpatia pela tese localizacionista.
O primeiro opositor consistente à frenologia foi exatamente um de seus
adeptos: o francês Marie-Jean-Pierre Flourens, influente médico fisiologista
experimental e político, que se tornou um frenologista arrependido. Entre 1835-40,
Flourens fez muitos estudos com pássaros de cujos cérebros retirava pequenas porções
de massa encefálica, denominadas ablações, nos sítios frenológicos. Segundo Flourens,
se não fossem extensas, as ablações não causavam nenhuma perda cognitiva observável,
independente de onde eram feitas. O animal continuava saudável depois da cirurgia.
Isso o levou a defender a Hipótese do Campo Agregado, segundo a qual todas as
sensações, percepções e volições, entre elas a linguagem, seriam processadas em todo o
cérebro; e portanto, decorriam, essencialmente, de uma única faculdade, isto é, de um
todo indivisível.
Em 1861, quando Broca atendeu o Tan em Bicêtre, a frenologia ainda estava mal
falada. Esse era o problema de Broca. Ele era um frenologista amargurado, porque
simpatizava com a tese da localização, mas nada podia revelar sobre suas inclinações
intelectuais politicamente incorretas, uma vez que sua associação com a frenologia não
seria bem vista na academia.
É claro que o problema (pessoal, psicológico) de Broca, problema com p
minúsculo, desembocou desde então no Problema de Broca, problema com p maiúsculo,
que trata da unificação ou redução da porção sutil da cognição de linguagem no âmbito
da mente, à contraparte física, no cérebro. Note-se que o Problema de Broca no século
XIX não era diferente daquele que chegou a nós hoje e que é parte da agenda de pesquisa
gerativista. Talvez a proporção do que não se sabe hoje seja menor, mas a tarefa de
mapear computações linguísticas em tecido cerebral, a neurocartografia, certamente
ainda vai mobilizar as próximas gerações de pesquisadores.
Podemos também especular que o problema (pessoal) de Broca quanto a se
revelar localizacionista e, portanto, reducionista, também se reproduz hoje em alguma
medida. O simples dado de que Broca aparentemente não é mencionado nenhuma vez
na obra de Chomsky é, no mínimo, surpreendente.
Fato é que Broca é um grande nome para os estudos da linguagem e são muitos
os pontos de convergência entre as ideias dele e as de Chomsky: Broca, sendo um
185
frenologista de coração, (i) é, em tese, modularista; (ii) acredita em especificidade de
domínio cognitivo; (iii) defende a especialização do ser humano para a linguagem, já
que entende que “os animais têm outras faculdades mesmo que somente de forma
rudimentar, mas linguagem verdadeira e fala articulada estão totalmente além das
possibilidades dos animais” (Broca, 1865, apud Berker, Berker e Smith, 1986: 232); (iv)
defende uma noção bem próxima da noção de período crítico para a aquisição da
linguagem: “Não acredito que a educação de um adulto seria mais fácil do que o de uma
criança; pelo contrário, é muito mais difícil. Há coisas que você nunca pode aprender
bem além de uma certa idade” (Broca, 1865, apud Berker, Berker e Smith, 1986: 234); e
(v) defende o inatismo em relação à linguagem através da afirmação de que quase todos
os indivíduos incluindo os canhotos teriam o sítio dominante da linguagem no
hemisfério esquerdo, sendo essa localização persistente uma prova de que “a linguagem
é uma característica inata” (Broca, 1865, apud Berker, Berker e Smith, 1986: 240).
Enfim, devido ao cuidado com a sua própria reputação, Broca vinha
acompanhando à distância os trabalhos de outro neurologista francês, Jean Bouillaud e
seu genro, Ernest Auburtin. Eles vinham coletando evidências clínicas que poderiam
resgatar a tese do localizacionismo, e a hipótese de que a fala estava localizada no lobo
frontal do cérebro (Broca, 1861, apud Kann, 1950).
Sabe-se que os frenologistas localizam a fala na área frontal anterior no

cérebro, em uma das circunvoluções que repousa no arco orbital. Essa
opinião, que realmente se baseou em uma análise muito imperfeita do
fenômeno da linguagem, teria, sem dúvida, desaparecido com todo o resto se
não fosse pelo professor Bouillaud, que a resgatou do ‘naufrágio’, tendo feito
grandes modificações descritivas cercadas de provas patológicas. (Broca,
1861, apud Kann, 1950: 16).
Como o paciente Tan faleceu logo nos dias após Broca tê-lo atendido, Broca
vislumbrou a chance de investigar as suspeitas de Bouillaud de forma menos
especulativa, olhando dentro do cérebro de quem havia perdido a fala. O exame post-
mortem do cérebro de Tan, que Broca fez questão de preservar, e que está até hoje em
exposição no Museu Dupuytren de Paris, revelou danos na segunda e terceira
circunvoluções frontais do hemisfério cerebral esquerdo, uma lesão perisylviana
envolvendo ainda parte adjacente do corpo estriado.
Após a publicação do caso de Tan no Bulletin de la Societé Anthropologique,
Broca se envolveu em inúmeras controvérsias. Na mais contundente delas, Pierre Marie,
ex-aluno do eminente neurologista Jean Charcot, e famoso autor da primeira descrição
186
da acromegalia,47 examinou o cérebro de Tan e discordou de Broca em relação à
localização anatômica da lesão. Ou seja, a tese localizacionista causa polêmica de novo.
De Tan em 1861 até 1863[NÃO ESTÁ CLARO], foram encaminhados a Broca 25
pacientes que haviam sofrido AVC, apresentavam hemiplegia direita e déficits
linguísticos. Broca foi muito cuidadoso na descrição dos sintomas desses novos casos.
Ele notou que esses pacientes não produziam enunciados estereotipados como Tan, mas
tinham dificuldade de usar certas palavras, que no século XX foram identificadas como
sendo preponderantemente palavras do tipo classe fechada (preposições, conjunções,
pronomes, desinências verbais). A falta dessas palavras fazia a fala dos pacientes
parecer telegráfica, por exemplo:
Médico: “O que o senhor fez ontem?

Paciente: “Sim ontem... ah... dentista, quarta, 10 horas, gengiva.
operação.”
Broca também observou que esses pacientes pareciam não ter dificuldade de
compreensão, embora apresentassem apraxia de fala, ou seja, tinham dificuldade de
repetir o que lhes era dito, fato que atrapalhava a verificação do nível de entendimento
que eles alcançavam.
Um exame superficial post-mortem feito por Broca nesses novos pacientes
revelou a localização persistente de lesão no hemisfério esquerdo, na terceira
circunvolução do lobo frontal anterior em 24 dos 25 pacientes. Isso levou Broca a se
comprometer de vez com o localizacionismo, cunhando, em seu artigo de 1865, uma das
frases mais marcantes da Neurologia: “Falamos com o hemisfério esquerdo!” (“Nous
parlons avec l’hémisphère gauche!”). Em seguida ao artigo, a disfunção descrita por
Broca foi batizada pelo grande neurologista Armand Trousseau como Afasia de Broca
ou Afasia Motora (cf. Lebrun, 1993).
Um século mais tarde, estudos de neuroimagem do cérebro preservado de Tan,
realizados por Castaigne et al. (1980) e Signoret et al. (1984), demonstraram que a lesão
daquele caso emblemático ia além da área de Broca, atingindo uma região subcortical
mais medial, abaixo da área de Broca, denominada ínsula. Portanto, a lesão de Tan tinha
extensão colunar e era maior do que a que havia sido originalmente reportada por Broca
(Dronkers et al., 2007).
187
Em 2000, Selnes e Hillis revisaram o diagnóstico da doença de Tan seguindo
a descrição original de Broca e concluíram que hoje Tan seria classificado como tendo
sido acometido por afasia global por causa dos enunciados estereotipados. De fato,
vários estudos modernos associam a presença de enunciados estereotipados a pacientes
com afasia global e, geralmente, tais pacientes apresentam lesões na ínsula (Poeck, De
Bleser e Keyserlingk, 1984; Blanken, Wallesch e Papagno, 1990).
Outra revisão importante à descrição inicial de Broca diz respeito à
capacidade da preservação da compreensão dos pacientes. Testes feitos na segunda
metade do século XX demonstram que a compreensão também é afetada nessa afasia,
quando se trata do processamento de sentenças sintaticamente complexas que envolvem
movimento de constituintes. Observemos a sentença passiva (1), representada pela
estrutura arbórea na Figura 1.
(1) João foi beijado pela Maria.
Figura 1: Estrutura arbórea da sentença passiva “João foi beijado pela Maria”
Note que apesar de João começar a sentença, ele não é agente de beijar. João,
paciente, sai da posição ao lado do verbo beijar, onde pode ser interpretado como
paciente, e vai parar na frente da sentença, na posição de sujeito, onde é pronunciado. A
motivação para esse movimento é receber caso. Contudo, mesmo depois do movimento,
João mantém seu papel temático de paciente. É esta a computação da voz passiva. De
fato há relatos mostrando que quando estimulados por sentenças como essa, os afásicos
de Broca ignoram o movimento sintático e interpretam João como agente de beijar.
Eles parecem não ter acesso às computações morfossintáticas da passiva e usam
heurística para interpretar, valendo-se da ordem default do português sujeito-verbo-
objeto (SVO). Interpreta João como se fosse sujeito agente, ignora o auxiliar foi,
188
computa a informação lexical da raiz beij, ignora a morfologia passiva do verbo ado e a
preposição pelo. Fica com João beij__ Maria. A dica experimental é a de que para
flagrar o déficit, o experimentador teria que usar passivas não reversíveis, do tipo A
bola foi chutada por João, pois essas não se prestam à interpretação através da
heurística.
Além da passiva, o acesso a morfemas formais e todas as operações com
constituintes à distância são um problema para a produção e compreensão dos afásicos
de broca (Berndt e Caramazza, 1980; Bradley, Garrett e Zurif, 1980; Caramazza e Zurif,
1976; Goodglass, Gleason e Hyde, 1970; Heilman e Scholes, 1976; Parisi e
Pizzamiglio, 1970; Grodzinsky e Santi, 2008).
Apesar de haver reparos aos achados de Broca, foram muitas as contribuições
atribuídas a ele, e entre as mais importantes são: (i) a tentativa de localização da
faculdade da articulação da linguagem na terceira circunvolução do giro frontal inferior
esquerdo (Área de Broca48); (ii) o estabelecimento da distinção entre compreensão e
produção, o que põe por terra a visão da Hipótese do Campo Agregado de Flourens,
sendo esta, talvez, a mais marcante de suas conclusões, historicamente falando; (iii) a
constatação da assimetria funcional e morfológica dos dois hemisférios; (iv) a listagem
dos tipos de palavras que faltavam na fala dos pacientes; (v) a constatação de que a
recuperação parcial ou total do afásico depende em larga medida dos exercícios pós
lesão.
Em 1874, dentro do mesmo espírito localizacionista de Broca, o anatomista,
psiquiatra e neuropatologista polonês radicado na Alemanha, Carl Wernicke, publicou
“O Complexo Sintomático da Afasia: um estudo psicológico sobre Base Anatômica”.
Nesse trabalho, Wernicke descreve o caso de dois pacientes que sofreram um AVC, mas,
diferentemente dos pacientes de Broca, tinham sua fala razoavelmente fluente, embora
de conteúdo vazio. Além disso, os pacientes não conseguiam entender linguagem falada
ou escrita, ou seja, tinham claramente um distúrbio de compreensão, que afetava até a
monitoração da própria fala. Após a morte desses pacientes, na dissecção cerebral,
Wernicke percebeu que eles tinham uma lesão no ponto de encontro entre os lobos
parietal e temporal, na região posterior do hemisfério esquerdo. Essa área é circundada
pelo córtex auditivo e também por áreas que integram as sensações auditivas, visuais e
somáticas em percepções complexas. É nessa região do córtex associativo que se
localiza a área descoberta por Wernicke, embora essa área tenha experimentado grande
inconsistência localizacional na literatura, às vezes incluindo os giros supramarginal,
189
angular e regiões posteriores do giro temporal superior. Mas, de uma maneira geral, a
área de Wernicke aparece relacionada à percepção da fala e, quando lesionada, à afasia
sensorial.
Wernicke, lançando mão de seus próprios achados e dos de Broca, passou a
defender um modelo cognitivo conexionista de linguagem, que se respaldava em três
áreas principais: um centro de produção (área de Broca), uma área de compreensão
(área de Wernicke) e uma área conceitual, cuja localização ele não conhecia, mas cuja
existência inferia. A conexão entre os três centros, por meio de feixes de substância
branca, como o fascículo arqueado, garantia o fluxo de informações essencial para a
linguagem.
Em 1885, com a colaboração de seu aluno, Lichtheim, o Modelo Clássico de
Wernicke-Lichtheim tornou-se a teoria Neurolinguística padrão por mais de 100 anos.
Nesse modelo, cada função normal mais alta é explicada em termos de uma via neural
subjacente que inclui os sistemas de entrada/saída, funções relacionadas, vias usadas
para outras funções e previsão de síndromes patológicas dependendo do local onde um
dano possa ocorrer.
É claro que no século XXI é inconcebível pensar que um local do cérebro seja
responsável por toda a sintaxe e outro por toda a fonologia. Os testes de imagem
funcional oferecem fartas evidências de que qualquer tarefa cognitiva ativa redes
complexas de circuitos especializados por quase todo cérebro, que apenas agora
começam a ser mapeados com maior precisão. A tarefa ainda é incomensurável.
Dividindo o problema
Chomsky (2011: 27) diz que
Nas palavras de Russell, as verdades experienciais não são conhecidas por

terem qualquer caráter intrínseco que os eventos físicos não possam ter, já
que não sabemos de nenhum caráter intrínseco que possa ser incompatível
com as propriedades lógicas que a física atribui aos eventos físicos. A partir
dessas perspectivas, então, o problema lógico não existe.
No entanto, o problema lógico, que é um outro nome que se dá ao

reducionismo ou ao Problema de Broca, na prática existe, sim. O primeiro desafio para
quem decide abraça-lo é justamente a interdisciplinaridade mencionada anteriormente:
como sair da teoria linguística para biologia? Poeppel e Embick (2005), pioneiros em
190
incursões interdisciplinares entre linguística teórica e neurociência, identificam dois
problemas que talvez possam ser classificados como duas subdivisões do Problema de
Broca: (i) o Problema da Incompatibilidade de Granularidade e (ii) O Problema da
Incomensurabilidade Ontológica entre os objetos de estudo da Linguística e os da
neurociência.
O Problema da Incompatibilidade de Granularidade aborda o fato de que os
objetos de estudo da linguística se encontram em um nível de sutileza bem maior do que
aqueles já atingidos por pesquisa em neurociência da linguagem (Poeppel e Embick
2005; Embick e Poeppel, 2015). Mas o que significa isso na prática? Para exemplificar,
examinemos com detalhe como a teoria linguística explicita contrastes verbais
importantes como os que estão em (2) e (3):
(2) A mulher caiu.

(3) A mulher sorriu.
Aparentemente, as sentenças (2) e (3) são bastante semelhantes. Começam com

um sintagma nominal (SN) – a mulher – seguido de um verbo intransitivo. Porém, um
exame mais atento revela que em (2), o SN a mulher experienciou o evento. Caiu
alguma coisa ou alguém que experienciou a queda. Assim, o SN a mulher, não pode
ser sido gerado onde ele está em (2). Como experienciador da queda, o SN a mulher
foi gerado onde ele é interpretado, imediatamente após o verbo, como complemento ou
argumento interno de cair (cf. 4). Depois, o argumento interno é então movido para a
posição de sujeito por movimento sintático (cf. 5).
(4) Caiu a mulher.

(5) A mulher caiu _________.
Já em (3), o único argumento do verbo sorrir é o sujeito e realmente o agente

da ação de sorrir. E aqui cessam os fatos de contraste para uma análise observacional
imediata.
Contudo, aprofundando a análise sob a ótica da versão de Regência e Ligação
da Gramática Gerativa, Luigi Burzio propõe que, em (2), como o verbo não tem
capacidade de atribuir papel temático à mulher, já que em sua posição final mulher não
é agente de cair, o verbo também não pode atribuir caso acusativo, e por essa razão
191
específica, esse tipo de verbo é classificado como inacusativo. A generalização foi
capturada nos seguintes termos:
Um verbo sem argumento externo não tem habilidade de atribuir caso acusativo. E
um verbo que não consegue atribuir caso acusativo não pode atribuir papel
temático ao argumento externo. (Burzio, 1986: 18)
Diferentemente do inacusativo, o verbo inergativo em (3) pode atribuir papel

temático ao argumento externo, que em seguida recebe caso nominativo da Flexão que
está em T (tempo), no nó acima do SV. Essas seriam as propriedades da Generalização
de Burzio que capturam a distinção entre verbos inacusativos e inergativos como se
pode verificar nas árvores em (2a) e (2b) e (3a) e (3b).
Figuras 2a e 2b – Derivação de uma sentença com verbo inacusativo em dois momentos. No

momento (1a), o verbo inacusativo atribui papel temático para o SN complemento. Em (1b), o
complemento já licenciado semanticamente sobe para a posição de sujeito, deixando um
vestígio em seu lugar (t); o verbo pega os traços de número e pessoa do sujeito alçado e a
desinência de tempo.
Figuras 3a e 3b – Derivação de uma sentença com verbo inergativo em dois momentos. No

momento (2a), o verbo inergativo atribui papel temático para o SN sujeito. Em (2b), o sujeito já
está licenciado semanticamente e o verbo sobe para T para pegar os traços de número e pessoa
do sujeito e a desinência de tempo.
192
Complementando a análise estrutural através das árvores, há um teste prático
para se certificar de que um verbo é inacusativo. Basta colocar o verbo suspeito no
particípio passado e depois tentar usá-lo como adjetivo modificando um nome. Por
exemplo, façamos o teste com os verbos derreter, pagar, gritar e dormir. Enquanto
podemos ter sorvete derretido e funcionário pago, não conseguimos sucesso com
*criança gritada ou *idoso dormido. Então, derreter e pagar são inacusativos,
enquanto gritar e pagar são inergativos.
Apesar de o conjunto de fatos que compõe a Generalização de Burzio ter
influenciado a literatura por mais de 20 anos, outros casos complexos envolvendo
línguas, como Tenetehára49 (Duarte, 2017), analisados à luz da versão mais recente da
Teoria Minimalista, apontam em outras direções. Tenetehára é uma língua ergativa, e
isso quer dizer que nessa língua o sujeito de verbos transitivos são marcados com o caso
ergativo, e o sujeito de verbos intransitivos ou o objeto direto de verbos transitivos, com
o caso absolutivo. Ao que tudo indica, nessas línguas ergativas, sujeitos de verbos
inacusativos acabam de fato pegando o caso acusativo, o que concorreria para a
necessidade de uma reanálise da Generalização de Burzio.
O autor conclui que, em algumas línguas, a incapacidade de um verbo atribuir
o caso acusativo pode estar dissociada da propriedade desse verbo atribuir papel
temático ao seu argumento externo. A Generalização de Burzio não seria, então, um
Principio Universal, mas um parâmetro de uma gramática humana possível (Duarte,
2017). Ou seja, a granularidade da teoria linguística permitiu uma sofisticação na
explicação das diferentes propriedades de verbos inacusativos e inergativos e foi
também capaz de refinar essas distinções parametricamente.
193
Mas sempre buscando-se ir além, como esses mesmos fatos poderiam ser
observados e descritos no cérebro? Usando uma metodologia de neuroimagem
funcional, com grande resolução espacial na ordem de milímetros, Shetreet, Friedmann
e Hadar (2009) se lançaram na tarefa de encontrar os locais onde inacusativos,
inergativos e transitivos diretos no hebraico são processados no cérebro. Os
pesquisadores aplicaram um experimento em 18 adultos cujo monitoramento cognitivo
foi feito por um scanner de ressonância magnética funcional (fMRI). Nessa técnica, o
paciente entra dentro de um grande ímã em forma de cilindro que é posicionado em
torno da parte do corpo que deve ser mapeada, nesse caso o cérebro.
Durante as tarefas cognitivas, por exemplo, ao interpretar sentenças, ora
inacusativas, ora inergativas e ora transitivas, há demanda sanguínea em direção às
áreas cerebrais envolvidas na atividade.50 Quando a máquina é acionada, ela liga um
campo magnético 10.000 a 30.000 vezes mais forte do que o campo magnético da Terra,
e esse magnetismo rastreia a hemodinâmica do cérebro provocando um alinhamento
artificial dos prótons de hidrogênio que estão na circulação cerebral das regiões
cerebrais acionadas.
Ao ser desligado, o campo magnético se desfaz e os prótons começam a perder
seu alinhamento forçado, se balançando como pêndulos até voltarem para a posição em
que se encontravam antes de o campo magnético ser acionado. Ao voltarem para suas
posições originais, eles emitem ondas de rádio. O scanner capta esses sinais e um
computador os transforma em imagem que mapeia as regiões que se desgastaram com a
tarefa linguística e agora requerem um maior aporte sanguíneo para repor as energias.
As neuroimagens são baseadas na localização precisa e na força dos sinais
recebidos. O resultado geralmente é mostrado através da subtração das áreas ativadas.
Por exemplo, pega-se a imagem da área ativada quando o participante leu as sentenças
com o verbo inacusativo. Diminui-se essa área da área ativada quando o participante leu
as sentenças com o verbo inergativo. Como tudo que for comum entre as ativações para
as duas condições será cancelado pela subtração, o resto da operação faz transparecer o
local ativado relativamente às sentenças com o verbo inacusativo. Nesse caso, ilustrado
a seguir (Fig.4), vemos a imagem da atividade relacionada ao processamento das
sentenças com verbos inacusativos depois que foi subtraída daquela relacionada aos
verbos inergativos e transitivos ([inacusativo > inergativos] ∩ [inacusativo > transitivo],
ou seja subtrai-se atividade hemodinâmica relacionada aos verbos inacusativos daquela
194
relacionada aos verbos inergativos, conjugada à subtração da atividade hemodinâmica
relacionada aos verbos inacusativos daquela relacionada aos verbos transitivos).
Figura 4: Hemisfério esquerdo com duas áreas de ativação – GIF e GTM – relativas ao produto
das diferenças conjugadas entre a ativação dos inacusativos menos a dos inergativos e entre a
ativação dos inacusativos menos a dos transitivos diretos. Os inacusativos apresentaram duas
áreas de ativação (adaptado de Shetreet, Friedmann e Hadar, 2009: 9).
Não foi possível distinguir entre as áreas ativadas no processamento de

inergativos e transitivos. Porém, o contraste com os inacusativos resultou na imagem da
ativação de duas áreas da Figura 4: as sentenças inacusativas ativaram o giro frontal
inferior esquerdo (GFIe) e o giro temporal médio (GTMe). Por analogia com outros
testes, os autores hipotetizaram que a GFIe se relaciona com o movimento sintático que
moveu o SN da posição de objeto para sujeito na condição inacusativa. Também por
analogia, o GTMe foi interpretado como sendo ativado pela computação morfológica
que adequa o verbo aos traços de morfologia (traços fi) do nome (3ª p.s.).
Contudo, a baixa resolução temporal (na casa dos segundos) dos testes
hemodinâmicos não oferece acurácia para que se verificar a cronologia das
computações. Não se pode acompanhar a previsão teórica de que primeiro o SN seria
alçado para a posição de sujeito e depois, naquela posição, seus traços seriam copiados
em T, de forma que quando o verbo subir para T ele possa se amalgamar com as peças
morfológicas adequadas ao número e pessoa do sujeito (cf. 1a e 1b).
Ainda assim, foi muito positivo poder contar com a acurácia espacial do teste
(na casa dos milímetros) que indicou que os inacusativos recrutaram mais esforços
cognitivos do que os inergativos e que o processamento desses inacusativos necessitou
da ativação de duas áreas distintas e bem delimitadas no hemisfério esquerdo. No
mínimo, a informação serviu para corroborar hipóteses teóricas de que há diferenças
estruturais profundas que separam a derivação de inacusativos e de inergativos,
195
exatamente como havia sido postulado pela Generalização de Burzio. Seria desejável
agora também testar uma língua ergativa como o Tenetehára com essa metodologia de
imagem, para verificar se é possível captar fisiologicamente o efeito paramétrico
descrito em Duarte (2017).
No cotejamento dos trabalhos apresentados fica claro que a granularidade que a
linguística teórica já atingiu ainda é um objetivo distante no horizonte da Neurociência.
Porém, tem sido mais e mais comum a conjugação de técnicas para aumentar a
capacidade de análise experimental. Um teste complementar a Shetreet, Friedmann e
Hadar (2009) usando uma técnica eletrofisiológica como a extração de potenciais
relacionados a eventos (EEG-ERP), que tem ótima resolução temporal em
milissegundos, poderia esclarecer a cronologia das computações das sentenças com
verbos inacusativos em diferentes línguas e, portanto, é uma agenda de pesquisa
adequada para os próximos anos.
O segundo Problema apontado por Poeppel e Embick é O Problema da
Incomensurabilidade Ontológica entre os objetos de estudo da Linguística e os da
Neurociência. Esse compreende um mapeamento de natureza mais delicada. De fato, é
difícil reduzir operações linguísticas simples, como atribuição de papel temático e Caso,
estudado pela teoria linguística, a algum componente neurofisiológico como um tipo de
neurônio, junções neuronais, sinapses, dendritos, ou a aspectos da atividade elétrica
como amplitude ou latência das ondas. Os primitivos neurofisiológicos para a
linguagem por certo ainda não são discrimináveis nesse ponto do conhecimento atual e
tampouco são unificáveis ou reduzíveis aos primitivos das teorias computacionais ou
derivacionais (Embick e Poeppel, 2015).
Contudo, desde o início do século XXI, mais especialmente a partir do início da
segunda década, o número de estudos com imagens relativas ao processamento de
linguagem tem crescido exponencialmente e vem alcançando maior nitidez nas
diferentes alças de processamento relacionadas a concatenações linguísticas de menor e
de maior complexidade computacional. Dentre os estudos mais importantes, o grande
destaque é Berwick et al. (2013), uma ampla revisão dos progressos mais recentes, que
traz entre os autores o próprio Chomsky, na sua mais comprometedora incursão nas
neurociências.
Nesse trabalho os autores identificam que a linguagem humana é produto de
várias operações computacionais de concatenação (merge) que se dão no hemisfério
esquerdo no entorno da fissura de sylvius (cf. Figura 5). Até aí não há muita diferença
196
do Modelo Clássico de Wernicke e Lichtheim e também ainda não se resolve o
Problema da Incomensurabilidade Ontológica.
A novidade é que no modelo atual identificam-se tipos diferentes de
processamento de linguagem envolvendo diferentes circuitarias. Nas computações mais
simples que subjazem à compreensão de palavras soltas, sem hierarquia de
constituintes, o processamento segue uma alça ventral que liga a porção anterior do giro
temporal superior (área 22), pertencente ao córtex auditivo, à parte triangular do giro
frontal inferior (área 45). Essa ligação é encontrada em vários animais e também está já
ativa em bebês humanos ao nascimento. Além disso, essa alça fica ativa durante
traduções de palavras (Elmer, 2016). No artigo, lança-se a hipótese de que essa via
exista no cérebro humano e que lá tenha permanecido fixa desde a origem da
linguagem, aproximadamente há 100 mil anos.
As computações mais complexas e exclusivamente humanas envolvem duas
alças dorsais. Segundo os autores, essas vias não estão presentes em outras espécies, e
nem estão nos bebês humanos ao nascimento. Contudo, se desenvolvem prontamente
durante o curso da aquisição de linguagem. Através de uma das alças dorsais, a porção
posterior do giro temporal superior (área 22), pertencente ao córtex auditivo, se liga à
parte opercular do giro frontal inferior (área 44), que é exatamente a área de broca. O
processamento de formas sintáticas complexas, que se juntam assimetricamente tem
lugar nessa via. A outra via dorsal é a da articulação de linguagem e liga a área auditiva
(22) ao córtex pré-motor (área 6), que controla os movimentos do aparelho fonador.
Figura 5: Regiões perisylvianas relacionadas à linguagem e conexões de fibra no hemisfério

esquerdo do cérebro humano (adaptado de Berwick et al., 2013: 94).
197
O novo modelo do processamento de linguagem do século XXI traz
consequências imediatas para a área. Baseado nele começa a surgir um novo programa
de investigação da interação dessas áreas através de testes revolucionários.
Alguns desses testes foram desenhados para monitorar as áreas ativadas
durante a aprendizagem de línguas naturais (L2) por adultos. A tradição de estudos
sobre aquisição de L2 verifica a efetividade, as dificuldades e as transferências
experienciadas por aprendizes adultos de L2. A novidade desses estudos em questão é
que, levando a sério as previsões da Gramática Gerativa, de que as regras das línguas
naturais seguem um conjunto específico de princípios da GU, os pesquisadores se
propõem a monitorar o cérebro do aprendiz de L2 usando a ressonância magnética,
enquanto ele é confrontado com a tarefa de aprender uma língua que tem uma regra não
GU (Tettamanti et al., 2002).
Essa é uma forma muito direta de usar a neurociência para resolver o Problema
de Broca e validar as previsões gerativistas. Se é um dado da espécie que a região
persylviana se ativa com processamento sintático e hierárquico de linguagem, o que
acontece quando o participante é exposto a uma regra linguística apreensível mas que
não é uma regra existente em uma língua natural?
Por exemplo, nas línguas humanas não existem regras que se baseiam na
posição absoluta de uma palavra na sentença, posição essa aferida através da contagem
de palavras da direita para esquerda ou da esquerda para direita. Aplicando uma regra
do tipo “o auxiliar é inserido como a quarta palavra da sentença da esquerda para
direita”, geram-se sentenças como as da tabela a seguir:
198
1a 2a 3a 4a 5a 6a 7a Gramatical não gram.
João falou Que vai comprar carro hoje X

João me Falou vai que sair hoje X
João me Falou que vai casar hoje X
Nos protocolos, sessões de microversões de uma língua estrangeira foram

apresentadas aos participantes; algumas regras dentro da GU e outras não GU como a
regra da inserção de auxiliar na quarta posição exemplificada pela tabela anterior.
Subsequentemente à etapa de familiarização com as regras, foi requisitado que os
participantes monitorados pela ressonância se engajassem em um julgamento de
gramaticalidade nessas línguas.
Diferentes versões desse experimento foram testadas (cf. Tettamanti et al.,
2002; Musso et al., 2003; Moro et al., 2001; Moro et al., 2013; Monti et al., 2009,
2012; Friederici et al., 2006). O resultado conciso e espetacular dessas aventuras é que
regras sintáticas que não sejam baseadas em princípios hierárquicos e recursivos ou que
sejam baseadas em propriedades transitórias determinadas exclusivamente por
estatística ou ordem superficial não ativam a rede neuronal perisylviana dedicada à
sintaxe que tem a área de broca como seu núcleo principal.
Palavras finais
Não há mais dúvidas de que a área de Broca está envolvida no processamento

sintático. Além de demarcar o perímetro das áreas especificamente linguísticas das não
linguísticas, que aliás não apareceram sobrepostas em nenhum dos mapeamentos, esses
estudos recentes são os primeiros a contrastar diretamente, através do engajamento da
área de broca, regras da GU com regras que violam esses princípios.
É flagrante o progresso que se obteve com esses novos caminhos mesclando
Teoria Gerativa e neurociência. As pesquisas citadas revelam caminhos para incluir
irremediavelmente a neurocartografia da linguagem e o Problema de Broca no cerne do
pensamento chomskyano, já que a área de Broca está envolvida de forma exclusiva no
processamento de regras da Gramática Universal e está excluída de processamentos não
GU.
Além disso, o novo modelo mapeado por técnicas de neuroimagem sustenta

também as bases da biolinguística. Chomsky explica a tarefa de aquisição de linguagem
199
como uma cooperação entre dotação genética e exposição a dados paramétricos, e o
novo modelo de processamento construído com dados de experimentos em
Neurociência consegue delimitar que uma das alças dorsais que envolve broca é
desenvolvida durante a aquisição e adaptando o cérebro parametricamente à língua alvo.
Note que a nova anatomia funcional não é mais como no modelo de Wernicke-
Lichtheim. Para dar conta dos achados dos testes citados precisa-se contar com versões
mais modulares da linguagem como a proposta pela Gramática Gerativa. Se aprender
regras linguísticas genuínas provoca um maior engajamento da área de broca, o
mecanismo de localização funcional sutil que discrimina entre regras GU e não GU
depende que se assuma que o cérebro é anatomicamente especializado para a

computação de linguagem com diferentes níveis de complexidade.
Um novo passo a ser dado claramente envolve testar todas a previsões desses
protocolos em crianças, o que ainda não foi feito, demarcando assim um programa fértil
de pesquisas para os próximos anos.
Referências
BENTON, A. L. Aphasia: Historical perspectives. In: SARNO, M. T. (Ed.). Acquired Aphasia. New York:
Academic, 1981, pp. 1-25.
BERNDT, R., CARAMAZZA, A. A redefinition of Broca's aphasia: Implications for a neuropsychological
model of language. Applied Psycholinguistics, 1, pp. 225-278, 1980.
BERWICK, R. C. et al. Evolution, brain, and the nature of language Trends Cogn Sci,17(2), pp. 89-98,
2013.
BLANKEN G, WALLESCH, C. W.; PAPAGNO C. Dissociations of language functions in aphasics with
speech automatisms (recurring utterances). Cortex 26, pp. 41-63 1990.
BRADLEY, D.; GARRETT, M.; ZURIF, E. Syntactic deficits in Broca's aphasia. In: CAPLAN, D. (Ed.).
Biological studies of mental processes. Cambridge, MA: MIT Press, 1980).
BRICMONT, J.; FRANCK, J. (Eds.). (). Chomsky Notebook. Columbia University Press, 2010.
BROCA, P. Remarks on the seat of the faculty of articulate language followed by an observation of
aphemia. Some papers on the cerebral cortex, trans. G. von Bonin. Springfield, Ill.: Thomas, 1861.
______. Localization of speech in the third left frontal convolution. 1865. In: BERKER, E. A.; BERKER, A.
H.; SMITH, A. Archives of Neurology, 43(10), pp. 1065-1072, 1986.
BURZIO, L. Italian Syntax. Dordrecht, Holland: D. Reidel publishing Company, 1986.
CARAMAZZA, A.; ZURIF, E. Dissociation of algorithmic and heuristic processes in language
comprehension: Evidence from aphasia. Brain and Language, 3, pp. 572-582, 1976.
CASTAIGNE, P.; LHERMITTE, F.; SIGNORET, J. L.; ABELANET R. Description et etude scan-nographique du
cerveau de Leborgne: la découverte de Broca. Rev Neurol., 1980.
200
CHOMSKY, N. Preface In: MORO, A. The Boundaries of Babel: The Brain and the Enigma of Impossible
Languages (Current Studies in Linguistics Book 46) The MIT Press. Kindle Edition, 2015.
______. The Mysteries of Nature: How Deeply Hidden? In: BRICMONT, J.; FRANCK, J. (Eds.). Chomsky
Notebook. Columbia: Columbia University Press, 2011.
______. Beyond explanatory adequacy. Cambridge, Massachusetts: MIT Working Papers in Linguistics,.
(MIT Occasional Papers in Linguistics, 20), 2001.
______. The Minimalist Program. Cambridge, Massachusetts: The MIT Press,. 1995.
______. Language and thought. Rhode Island: Moyer Bell, 1994.
______. A minimalist program for linguistic theory. In: HALE, K.; KEYSER, S. J. (Eds.). The view from
building 20: essays in linguistics in honor of Sylvain Bromberger. Cambridge, Massachusetts: The
MIT Press,. p. 1-52. (Current Studies in Linguistics, 24), 1993.
______. Knowledge of language Its Nature, Origin, and Use. In: Convergence Series. New York:
Praeger Publishers, , 1986.
DRONKERS, N. F. et al. Paul Broca’s historic cases: high resolution MR imaging of the brains of
Leborgne and Lelong. Brain 130, pp.1432-41, 2007.
DUARTE, F. B. The Split-S System and the Source of The Absolutive Case in Tenetehára. Revista
LinguíStica, v. 13, pp. 317-367, 2017.
ELMER, S. Broca Pars Triangularis Constitutes a “Hub” of the Language-Control Network during
Simultaneous Language Translation. Frontiers in Human Neuroscience, 2016.
EMBICK, D.; POEPPEL, D. Towards a computational(ist) neurobiology of
language: Correlational, integrated, and explanatory neurolinguistics. Language, Cognition and
Neuroscience, 30(4), pp. 357-366, 2015.
FRIEDERICI, A. D. et al. “The Brain Differentiates Human and Non-human Grammars: Functional
Localization and Structural Connectivity”. Proceedings of the National Academy of Sciences 103,
pp. 2458–2463, 2006.
GOODGLASS, H.; GLEASON, B.; HYDE, M. R. Some dimensions of auditory language comprehension in
aphasia. Journal of Speech and Hearing Research, 13, pp. 595-606, 1970.
GRODZINSKY, Y.; SANTI, A. The battle for Broca's region. Trends Cogn Sci. (12), pp. 474-80, 2008.
GREWENDORF, G. On Linguistics and Politics: Chomsky Interview with Günther Grewendorf.
Protosociology, v. 6, 1994.
HEILMAN, K.; SCHOLES, R. The nature of comprehension in Broca's, conduction and Wernicke's aphasics.
Cortex, 12, pp. 258-265, 1976.
KANN, J. A translation of Broca’s original article on the location of the speech center. Journal of Speech
and Hearing Disorders, 15, pp. 16-20, 1950.
LEBRUN, Y. Portraits in aphasia: Armand Trousseau (1801–1867). European Journal of Disorders of
Communication, 28:1, pp. 103-108, 1993.
LUZZATTI, C.; WHITAKER, H. Jean-Baptiste Bouillaud, Clau Francois Lallemand, and the role of the
frontal lobe: location and mislocation of language in the early 19th century. Archives of Neurology,
58(7), pp. 1157-1162, 2001.
201
MONTI, M.; PARSONS, L.; OSHERSON, D. “The Boundaries of Language and Thought in Deductive
Inference”. Proceedings of the National Academy of Sciences, 106(30), pp. 12554-12559, 2009.
MONTI, M.; PARSONS, L.; OSHERSON, D. Thought beyond language: neural dissociation of algebra and
natural language. Psychol. Sci. [2] 2012.
MORO, A. et al. Syntax and the Brain: Disentangling Grammar by Selective Anomalies. Neuroimage 13
(1), pp. 110-118, 2001.
MORO, A. The Boundaries of Babel: The Brain and the Enigma of Impossible Languages (Current
Studies in Linguistics Book 46). The MIT Press. Kindle Edition 2013, p. 254.
MUSSO, M. et al. Broca’s Area and the Language Instinct. Nature Neuroscience 6, pp. 774-781. 2003
PARISI, D.; PIZZAMIGLIO, L. Syntactic comprehension in aphasia. Cortex, 6, pp. 202-215, 1970.
POECK, K.; DE BLESER, R.; KEYSERLINGK DF. Neurolinguistic status and localization of lesion in phasic
patients with exclusively consonant-vowel recurring utterances. Brain 107, pp. 199-217, 1984.
POEPPEL, D.; EMBICK D. Defining the relation between linguistics and neuroscience. In: CUTLER, A. (ed.).
Twenty-first century psycholinguistics: Four cornerstones. Lawrence Erlbaum, 2005.
SELNES, O.A.; HILLIS A. Patient Tan revisited: a case of atypical global aphasia?Hist Neurosci 9, p.. 233-
237, 2000.
SIGNORET, J. L. et al. Rediscorevy of Leborgne’s brain: anatomical description with CT scan. Brain Lang
22, pp. 303-319, 1984.
SHETREET, E., FRIEDMANN, N., HADAR, U. The neural correlates of linguistic distinctions: Unaccusative
and unergative verbs. Journal of Cognitive Neuroscience, 22(10), pp. 2306-2315, 2009.
TETTAMANTI, M. et al. Neural Correlates for the Acquisition of Natural Language Syntax. NeuroImage.
17 (2), pp. 700-709, 2002.
O PROBLEMA DE WALLACE-DARWIN
Vitor A. Nóbrega
202
Os dois grandes problemas envolvendo o desenvolvimento da competência
linguística humana definem-se, em grande medida, por um descompasso entre
complexidade e tempo. Vimos, no capítulo “O Problema de Platão”, que a principal
questão associada à ontogenia da linguagem – i.e., ao desenvolvimento da linguagem
em um indivíduo – está em explicar o rápido processo de aquisição da linguagem pela
criança, considerando-se a escassez de informações disponíveis no ambiente. Por outro
lado, a principal questão atrelada à filogenia da linguagem – i.e., ao desenvolvimento da
linguagem na história evolutiva da espécie – está em esclarecer o surgimento de um
caractere complexo, constituído por diferentes habilidades, tendo em vista sua
manifestação recente. Essa última questão será o tema deste capítulo: o problema lógico
da emergência da linguagem, ou melhor, o Problema de Wallace-Darwin.
Para abordá-lo, organizamos nossa discussão do seguinte modo. Primeiramente,
apresentamos o raciocínio subjacente ao Problema de Wallace-Darwin. Reunimos, logo
em seguida, uma coletânea de registros fósseis e arqueológicos que justificam sua
validade. Com essas informações em mente, analisamos os reflexos do Problema de
Wallace-Darwin na teorização linguística. Veremos que o suposto desenvolvimento
recente da Faculdade da Linguagem exige uma redução das habilidades unicamente
humanas para essa competência, o que promoveu, nos últimos anos, uma sintetização
radical do papel da Gramática Universal. Por fim, exploramos uma das hipóteses mais
bem aceitas pelo empreendimento gerativista para elucidar os impasses colocados pelo
surgimento da linguagem, notadamente, a hipótese de Hauser, Chomsky e Fitch (2002).
O problema lógico da emergência da linguagem
Muito antes de Charles Darwin publicar, na segunda metade do século XIX, os

trabalhos seminais sobre a teoria da evolução através de seleção natural, cientistas de
diversas disciplinas já indagavam quais teriam sido as circunstâncias que levaram à
emergência da linguagem humana na evolução. A questão é de grande interesse não
apenas pelo papel da linguagem no desenvolvimento da cognição e do comportamento
humanos, mas também pela natureza aparentemente sui generis dessa inovação
evolutiva, que se distingue por seu caráter autapomórfico – i.e., por se configurar como
um caractere biológico exclusivo à espécie (Chomsky, 1980, 1988 [ESTA DATA NÃO
CONSTA DAS REFERÊNCIAS], 2000, 2017) – e por seu provável desenvolvimento recente,
cuja fixação, deduzida a partir dos primeiros registros arqueológicos explicitamente
203
simbólicos, ocorreu por volta de 80.000-100.000 anos atrás (Henshilwood et al., 2002;
Henshilwood et al., 2004; Bouzzougar et al., 2007).
Quando examinamos a complexidade da linguagem humana de um ponto de
vista evolutivo, percebemos que sua singularidade e sua manifestação recente desafiam
uma explicação em termos de seleção natural, fato que se associa à descontinuidade
observada entre as capacidades cognitivas humanas e a de animais não humanos.
Evolução através de seleção natural exige fundamentalmente modificações graduais que
partem de um caractere precursor, somado a uma série de outros caracteres
intermediários, decorrentes de pressões adaptativas, os quais dão origem paulatinamente
a um órgão complexo (Dawkins, 2006);51 Entretanto, não se observam na natureza
espécies que evidenciam uma gradação intelectual entre animais não humanos e os
humanos modernos, capazes de indicar não apenas graus moderados de uma
competência linguística, como também de criatividade artística, abstração e moralidade.
Esse descompasso foi notado, pela primeira vez, por Alfred R. Wallace,
cofundador da teoria da seleção natural, que percebeu que “a seleção natural somente
poderia ter capacitado nossos ancestrais com um cérebro um pouco superior àquele de
um primata” (1869: 392). Nesse contexto, as faculdades intelectuais humanas, em
especial, a competência para a linguagem, figuram como exemplares de caracteres que
contrariam as expectativas teóricas de Darwin. Em outras palavras, o problema
constatado por Wallace é o seguinte: se complexidade decorre de um processo gradual e
se a seleção natural somente responde às pressões adaptativas impostas pelo ambiente
aos organismos, seria esperado que a espécie humana apresentasse divergências
cognitivas pontuais com relação a seus ancestrais não humanos, o que, ao que tudo
indica, não é o caso (Tattersall, 2008, 2012, 2016; Klein, 2009; Laland, 2017).
Tal impasse acabou sendo rotulado por Bickerton (2014: 1) como o Problema de
Wallace. Esse problema requer uma explicação para a lacuna cognitiva existente entre
animais humanos e não humanos, algo que determine a fonte da capacidade intelectual
humana. Mais especificamente, o Problema de Wallace busca desvendar por que a
cognição humana configura-se como uma extensão evolutiva inesperada, uma vez que
ela excede as habilidades mentais que a espécie necessitaria para sobreviver. Além da
aparente ausência de precursores, Wallace (1870) não conseguia vislumbrar quais
seriam as vantagens adaptativas da “natureza intelectual e moral humanas”, ou seja,
quais motivos teriam impulsionado a seleção de uma linguagem complexa, de
criatividade artística, de abstração e de concepções morais. Para o autor, a cognição
204
humana compõe-se de competências que vão muito além do que seria exigido pela
natureza para a manutenção da espécie.
Nas palavras de Wallace:
Como poderia a ‘seleção natural’, ou a sobrevivência dos mais aptos na luta

pela existência, favorecer o desenvolvimento de poderes mentais tão
inteiramente removidos das necessidades materiais dos homens selvagens, e
que mesmo agora, com nossa civilização relativamente desenvolvida, ainda
[...] parecem ter relação mais com o futuro da raça do que com seu status
atual? (Wallace, 1870: 351-352).
Intrínseco ao Problema de Wallace é o intervalo de tempo que demarca as

primeiras expressões de raciocínio simbólico. Como mencionamos, a competência para
a linguagem é geralmente descrita como um desenvolvimento recente, dado que as
primeiras expressões regulares de um comportamento mediado simbolicamente
concentram-se entre 80.000-100.000 anos atrás. Esse recorte temporal é um piscar de
olhos tanto com relação ao tempo geológico quanto com relação aos 6-7 milhões de
anos da história evolutiva humana. A aparente brevidade do surgimento da linguagem
nos sugere que a seleção natural não teria tempo suficiente para promover a
complexidade de seus componentes. Tal descompasso entre complexidade e tempo nos
faz questionar como a competência linguística se tornou um caractere biológico passível
de emergir, uma inconsistência que ficou conhecida como o Problema de Darwin
(Boeckx, 2009; Fujita, 2009; Hornstein, 2009).
Embora esses problemas tenham sido caracterizados separadamente pela
literatura, eles podem ser circunscritos a um único dilema, a saber:
(1) Problema de Wallace-Darwin

De que maneira a complexidade atribuída à competência linguística humana foi
alcançada na evolução tendo em vista a aparente pobreza de precursores e o
curto intervalo de tempo para o seu desenvolvimento?
Juntos eles descrevem o problema lógico da emergência da linguagem.

É importante frisar que estamos interessados na evolução da competência
linguística e não nas mudanças ocorridas na história de uma língua particular, como o
árabe ou o japonês. Como destaca Chomsky em entrevista a Bambini et al. (2012: 222),
“evolução envolve mudanças no caráter genômico de um organismo. As línguas não são
205
organismos, elas não apresentam genomas, elas não evoluem. As línguas mudam [...], o
que evolui é a capacidade linguística dos usuários de uma língua”. Assim, toda
discussão que versa sobre o surgimento da competência linguística está interessada em
esclarecer quais foram os eventos evolutivos que proporcionaram o aparecimento de
uma aptidão biológica para a linguagem, a qual permite que a espécie humana – em
oposição às demais espécies – adquira, produza e compreenda uma ou mais línguas.
Nosso objeto de investigação, portanto, é a emergência da Faculdade da Linguagem
(FL).
Antes de examinar o percurso evolutivo da FL, é imperativo caracterizá-la como
uma categoria científica pertencente ao mundo natural. Chomsky (2000: 75) recorre à
assunção de que a mente é parte integrante do mundo natural, e que, por essa razão, ela
deve ser estudada igualmente a qualquer outro sistema biológico. Dada a natureza
inerentemente mental da competência linguística, Chomsky argumenta que a FL pode
ser definida como um órgão biológico, análogo, por exemplo, aos sistemas imunológico
e digestivo. Ao ser alçada à categoria de órgão de um indivíduo humano, a FL passa a
designar um subcomponente de um organismo complexo e apresenta integridade interna
suficiente para ser analisada da mesma forma que os demais órgãos (Martin e
Uriagereka, 2000). Tal conjectura nos permite vincular o estudo sobre a emergência da
FL à metodologia empregada pelas teorias naturalistas na investigação de qualquer
sistema biológico.
Para se chegar a uma explicação minimamente adequada sobre o surgimento
desse órgão para a linguagem, o Problema de Wallace-Darwin antecipa que a FL não
deve corresponder a um órgão internamente complexo, constituído de um conjunto de
módulos e princípios exclusivos à linguagem; caso contrário, ela seria um caractere
anômalo no mundo natural, tendo em vista sua manifestação recente.52 Além disso, não
seria razoável admitir que a FL configura-se como uma inovação evolutiva sem
precedentes, uma vez que inovações evolutivas normalmente resultam de mecanismos
ou de sistemas preexistentes (West-Eberhard, 2005; Moczek, 2008). Tal expectativa nos
leva a presumir que a FL decorre de mecanismos e/ou de sistemas disponíveis no mundo
natural previamente à emergência da competência linguística. Essa premissa nos
estimula a buscar precursores filogenéticos para a FL em diferentes espécies de animais
não humanos e em outros domínios cognitivos, capazes de nos indicar uma potencial
cumulatividade em seu aparecimento.
206
Darwin (1871), por exemplo, procurou explicar o surgimento da competência
linguística com base no pressuposto elementar da teoria da seleção natural:
descendência gradual a partir de pequenas modificações. Guiado pelo princípio de que a
natureza não dá grandes saltos evolutivos, o autor conjecturava que o desenvolvimento
da linguagem envolve um percurso gradual, continuísta e cumulativo. Para Darwin, a
competência linguística corresponde a um caractere derivado do canto dos pássaros.
Mais especificamente, o autor argumentava que machos dotados de um canto mais
elaborado foram selecionados sexualmente pelas fêmeas, uma força seletiva que
promoveu gradativamente um fortalecimento e um aperfeiçoamento do aparelho vocal
(1871: 57). O uso contínuo do aparelho vocal teria levado a mente a desenvolver
pensamentos complexos, os quais foram, então, desmembrados em palavras,
culminando na linguagem.
Darwin (1871: 103) tentou justificar ainda o aparecimento de outras faculdades
intelectuais, tais como criatividade artística, abstração e moralidade, caracterizando-as
como uma consequência do uso contínuo de uma linguagem altamente desenvolvida.
Devido às limitações científicas da época, ele não pôde fornecer evidências empíricas
para corroborar suas hipóteses. Essas assunções nos mostram que, para Darwin, as
observações de Wallace não deveriam ser vistas como um empecilho para a teoria da
seleção natural; logo, a evolução da FL, bem como de outras faculdades cognitivas, não
eram um problema para ele. Isso não significa que os questionamentos de Wallace
tenham sido efetivamente resolvidos. Hoje em dia, a tarefa para aqueles que buscam
desvendar a emergência da FL consiste em determinar em que medida a competência
linguística humana é produto de um processo gradual e continuísta, como hipotetizou
Darwin (1871), ou se ela corresponde a um grande salto evolutivo, como cogitou
Wallace (1869, 1870).
Veremos, no que segue, que Chomsky é um dos principais defensores dessa
segunda posição. Para Chomsky, a emergência da competência linguística não está nos
domínios da adaptação, como especulou Darwin, mas nos domínios da exaptação, em
que componentes já disponíveis na natureza, compartilhados com outras espécies, são
recrutados para novas funções.53 Chomsky defende que a maioria dos componentes da
FL foram exaptados. Ele sugere adicionalmente que o genótipo humano contém um
caractere inovador, cuja expressão dá origem ao que ele chama de Gramática Universal
(GU). A GU, possivelmente resultado de uma mutação genética, corresponde ao
mecanismo combinatorial que promove a infinitude discreta da linguagem – i.e., a
207
capacidade de gerar infinitas expressões fazendo uso de meios finitos. Esse seria o único
ingrediente humano da FL. Seu aparecimento teria ocasionado uma reorganização física
e mental que cooptou sistemas cognitivos preexistentes, os quais acabaram adquirindo a
função de externalizar e de interpretar as expressões formadas. Tal reorganização
configura-se como um evento evolutivo abrupto, responsável por propiciar um grande
salto cognitivo na espécie.
As primeiras expressões de raciocínio simbólico
Quando exatamente a competência linguística emergiu é um grande mistério.

Essa incerteza está associada ao fato de que a linguagem não fossiliza, uma vez que a
cognição não deixa marcas nos registros fósseis (Lewontin, 1998). Para esclarecer essa
questão, temos a nosso alcance apenas evidências indiretas, em especial, os registros
materiais deixados pelas diferentes espécies hominínias. Sabemos que, para que a
competência linguística possa se desenvolver, um indivíduo deve ser minimamente
dotado de raciocínio simbólico, ou seja, deve ser capaz de decompor o mundo natural
em um conjunto de símbolos abstratos passíveis de serem manipulados. É com base
nessa conjectura que comumente se atribui a emergência da competência linguística ao
aparecimento sistemático dos primeiros registros arqueológicos explicitamente
simbólicos, como, por exemplo, as expressões artísticas rupestres. A lógica subjacente a
essa inferência pode ser descrita do seguinte modo: dado que raciocínio simbólico e
linguagem estão interligados, a produção de artefatos simbólicos serve como uma
evidência para a disponibilidade de uma competência linguística. Porém, o que os
registros fósseis e arqueológicos nos revelam?
Temos conhecimento de que os primeiros hominínios surgiram na África por
volta de 6-7 milhões de anos atrás. Entretanto, é somente há aproximadamente 3.3
milhões de anos que encontramos os primeiros registros materiais deliberadamente
produzidos por seus membros: as ferramentas de pedra (Harmand et al., 2015).
Curiosamente, as técnicas de elaboração dessas primeiras ferramentas mantiveram-se
inalteradas por praticamente 1.5 milhão de anos, tendo sido replicadas pelas diferentes
espécies hominínias que se sucederam. É somente entre 1.5-1.8 milhão de anos atrás
que uma nova forma de tecnologia lítica aparece nos registros arqueológicos: os
machados de mão (Lepre et al., 2011). Embora essas novas ferramentas fossem mais
refinadas, indicando um grau de sofisticação cognitiva, suas técnicas inovadoras não
208
levaram à produção subsequente de outras ferramentas líticas mais elaboradas. Pelo
contrário, essas técnicas permaneceram praticamente invariáveis por mais outro milhão
de ano, enquanto espécies hominínias surgiam e se extinguiam.
Ao observar esses momentos de estase no surgimento de novos artefatos,
Tattersall (2008, 2012, 2016) aponta uma assimetria entre inovação anatômica e
inovação tecnológica. Embora seja possível notar uma sistematicidade no
desenvolvimento do cérebro, associada ao aparecimento de novas espécies hominínias,
não há, em contrapartida, evidências para um desenvolvimento cognitivo cumulativo, o
que se verifica no caráter episódico e dessincronizado do aparecimento de novas
tecnologias líticas. O aumento do cérebro tornou esses primeiros hominínios mais
competitivos, no entanto, como assinala Tattersall, esse aumento não está associado ao
surgimento de raciocínio simbólico ou de graus intermediários de raciocínio simbólico.
É somente há 80.000-100.000 anos, 100.000 anos após o Homo sapiens se fixar como
uma entidade anatômica distinta (White et al., 2003), que podemos observar os
primeiros registros arqueológicos explicitamente simbólicos sendo produzidos
regularmente.
Por exemplo, há 100.000 anos, em sítios arqueológicos do mediterrâneo e do sul
da África, foram encontradas conchas de gastrópodes coloridas com ocre vermelho e
perfuradas para serem utilizadas como miçangas em ornamentos corporais
(Henshilwood et al., 2004; Vanhaeren et al., 2006; Bouzzougar et al., 2007). Tal
indicativo de ornamentação corporal serve como uma forte evidência para a presença de
raciocínio simbólico, pois o uso de ornamentos implica, em diversas sociedades
humanas, status social e grau de ocupação na hierarquia de um grupo (D’Errico e
Vanhaeren, 2009). Um segundo exemplo são as inscrições geométricas gravadas em
placas de ocre encontradas na caverna de Blombos, na África do Sul, que datam de
75.000-100.000 mil anos atrás (Henshilwood et al., 2009). Exames das intersecções das
linhas cruzadas presentes nessas placas indicam que elas não foram produzidas como
resultado de cruzamentos aleatórios, mas que as linhas foram feitas, primeiramente, em
uma direção, e, em seguida, em outra. Essas descobertas nos sugerem que raciocínio
simbólico e, por extensão, a competência linguística teriam emergido há
aproximadamente 80.000-100.000 anos.
No entanto, um estudo genômico sobre a primeira cisão populacional da
linhagem sapiens nos faz reconsiderar essas datas. Gronau et al. (2011) revelam que,
por volta de 125.000 anos atrás, a linhagem sapiens se dividiu em dois grupos
209
populacionais que se dispersaram para regiões distintas, nomeadamente, os grupos
Khoe-San e Niger-Cordofanos. Essa dispersão promoveu um isolamento genético das
populações descendentes. Huijbregts (2017: 281), ao contrastar esse estudo genômico
com as datas dos registros arqueológicos acima, observa um paradoxo: uma vez que os
registros arqueológicos indicativos de uma consciência simbólica são posteriores à
divergência das linhagens sapiens, e considerando-se que os dois grupos descendentes
desenvolveram habilidades linguísticas idênticas, devemos pressupor que a emergência
da competência linguística é anterior à divergência populacional, ou seja, anterior a
125.000 anos.
Para solucionar esse paradoxo, Huijbregts (2017: 287) propõe que a
competência linguística deve ter emergido na reorganização genética que deu origem à
entidade física H. sapiens, por volta de 175.000-200.000 anos atrás. Essa capacidade se
espalhou pela população, mas não foi externalizada de imediato, o que se justifica pela
ausência de registros materiais simbólicos nos primeiros 100.000 anos da presença dos
H. sapiens. Sendo assim, para Huijbregts, a competência linguística emergiu
silenciosamente, como uma linguagem do pensamento – ecoando Chomsky (2011,
2015, 2016) –, tendo sido fixada tardiamente, próximo ao momento em que começamos
a encontrar os primeiros registros simbólicos. Atualmente, essas são as principais
evidências que embasam a conjectura saltacionista de Chomsky .54
No Quadro 1, resumimos a sequência de eventos evolutivos destacados nesta
seção.
Quadro 1. Principais eventos evolutivos envolvidos na emergência da FL.
Eventos Datas (em anos atrás)

Primeiros hominínios bípedes na África 6-7.000.000
Primeiras ferramentas líticas ~3.300.000
Primeiros fósseis atribuídos ao gênero Homo 2.5-2.000.000
Início da segunda indústria lítica 1.5-1.8.000.000
Primeiras evidências do H. sapiens na África 175-200.000
Primeira cisão populacional da linhagem sapiens ~125.000
Conchas perfuradas para ornamentação corporal ~100.000
Inscrições em placas de ocre no sul da África 75-100.000
Início do êxodo do H. sapiens para fora da África 60-70.000
210
Tendo em mente esses fatos, podemos, a partir de agora, explorar como
Chomsky buscou satisfazer as exigências colocadas pelo Problema de Wallace-Darwin.
Minimizando o papel do genótipo humano
A assunção de que a FL é um órgão biológico nos deixa reféns de uma

concepção de sua organização interna que seja coerente com as restrições impostas pelo
Problema de Wallace-Darwin. Dessa maneira, toda teoria sobre a FL deve ser guiada
não apenas por princípios de adequação descritiva e explicativa (Chomsky, 1965[ESTA
DATA NÃO CONSTA DAS REFERÊNCIAS]), como também por um princípio de adequação
evolutiva, condizente com o desenvolvimento da linhagem humana (Fujita, 2009). Um
dos primeiros passos para garantir a elaboração de uma teoria evolutivamente adequada,
tendo em vista o caráter recente da competência linguística, é assegurar que as
habilidades unicamente humanas da FL, exclusivas ao genótipo da espécie, tenham um
papel mínimo em seu desenvolvimento, pois “quanto menos for atribuído à informação
genética (no nosso caso, a GU) para se determinar o desenvolvimento de um organismo,
mais viável se torna o estudo de sua evolução” (Chomsky, 2007: 4).
Como já pôde ser observado no capítulo “O Programa Minimalista” (PM), o PM
promoveu uma revisão considerável das principais assunções teóricas desenvolvidas

pelo empreendimento gerativista. Um dos impactos mais notáveis dessa revisão está no
modo como caracterizamos a GU. Nas abordagens pré-minimalistas, a GU era descrita
como um sistema cognitivo inato, internamente complexo, determinado geneticamente,
exclusivo à espécie humana e autônomo com relação aos demais sistemas cognitivos
(Chomsky, 1981, 1986, 1988). Essa perspectiva sobre a GU tinha por objetivo diminuir a
influência do ambiente como fonte primária para o estabelecimento de um
conhecimento linguístico complexo em um curto intervalo de tempo, o chamado
problema lógico da aquisição da linguagem, como vimos no capítulo “O Problema de
Platão”.
Assim, com o intuito de esclarecer o descompasso entre o conhecimento
adquirido rapidamente no processo de aquisição da linguagem e a insuficiência de
informações fornecidas pelo ambiente, Chomsky (1968: 79) propõe que a GU compõe-se
de “uma estrutura inata que é rica o suficiente para explicar a disparidade entre
experiência e conhecimento”. O raciocínio subjacente a esse argumento é
fundamentalmente o seguinte: quanto maior for o número de características inatas
211
atribuídas à competência linguística humana, menor será a dependência do ambiente
para o desenvolvimento dessa capacidade em um indivíduo. Tal assunção descreve a
posição inatista de Chomsky, a qual atrela a competência linguística à dotação genética
da espécie.
A dotação genética, por sua vez, tinha como expressão fenotípica uma GU rica,
que conferia ao indivíduo um conjunto de módulos com funções específicas, cuja
interação processava-se de modo intricado (Chomsky, 1981, 1988). Entre eles, podemos
citar a Teoria X-Barra, a Teoria Temática, a Teoria do Caso e a Teoria da Ligação. Tal
arraigamento genético, associado à alta especificidade dos módulos que compunham a
GU, tornavam a FL um caractere exclusivamente humano. Além disso, as
particularidades funcionais desses módulos, compostos por operações exclusivas à
linguagem, faziam com que a FL fosse definida como uma capacidade integralmente
determinada pelo genótipo da espécie. Da mesma forma, a alta especificidade dos
módulos afastava a possibilidade de que partes da competência linguística pudessem ser
identificadas em outros domínios cognitivos.
É possível notar que, ao longo dos anos, uma estrutura interna cada vez mais
elaborada foi sendo atribuída à GU com o objetivo de reduzir as tarefas indutivas – i.e.,
derivadas da experiência – que a criança deveria desempenhar no processo de aquisição
da linguagem. Chomsky (2007: 3) rotulou esse posicionamento com relação à GU de
abordagem “de cima para baixo”, pois a questão central, nesse momento, era determinar
“quão rica a GU deveria ser para explicar a aquisição da linguagem em um curto
intervalo de tempo”. Contudo, na transição para o PM, há uma inversão desse raciocínio
ao se buscar demonstrar que grande parte da complexidade associada à linguagem não é
inerente à GU. Passa-se a questionar, a partir de então, “quão pouco pode ser atribuído à
GU e ainda sim ser possível explicar a variedade de línguas obtidas” (Chomsky, 2007:
4).
Grosso modo, a guinada teórica promovida pelo PM nos leva a abandonar uma
abordagem para a GU “de cima para baixo” e a assumir uma posição reducionista,
analisando-a “de baixo para cima”, ou seja, atribuindo a ela o mínimo necessário para se
explicar a aquisição da linguagem. Ao sintetizar a GU, há inegavelmente uma
diminuição da influência da determinação genética no desenvolvimento do
conhecimento linguístico, fato que permite que mecanismos não específicos à
linguagem possam ser considerados nos procedimentos empregados para se fixar uma
língua. A noção “de baixo para cima” recupera a conjectura colocada no âmbito do PM
212
de que a FL é um sistema ótimo para satisfazer as condições de legibilidade impostas
pelos sistemas externos com os quais ela interage, notadamente, o sistema associado à
externalização – o sistema sensório-motor (S-M) – e o sistema associado à interpretação
– o sistema conceitual-intencional (C-I).
Assim sendo, com a abordagem “de baixo para cima”, o PM passa a representar a
GU como um sistema cognitivo simples. Essa tentativa de reduzir a influência da GU, ou
seja, a influência do genótipo humano no desenvolvimento da linguagem, pode ser
percebida mais explicitamente no modelo dos três fatores (Chomsky, 2005: 6). Nesse
modelo, Chomsky assinala que três fatores propiciam o desenvolvimento da
competência linguística em um indivíduo:
(2) Modelo dos três fatores

a. Primeiro Fator: dotação genética (GU);
b. Segundo Fator: experiência;
c. Terceiro Fator: princípios não específicos à FL.
Notamos que a influência da dotação genética reduz-se a no máximo um terço.

Seu papel é tornar a aquisição possível e, ao mesmo tempo, delimitar o número de
línguas atingíveis. O segundo fator corresponde aos estímulos do ambiente que, uma
vez convertidos em experiência, fazem com que a GU seja modelada em uma
determinada língua. O terceiro fator, por sua vez, representa restrições biofísicas
associadas à regulação do crescimento de qualquer organismo no mundo natural. No
que concerne à linguagem, o terceiro fator circunscreve-se a duas categorias: eficiência
computacional e princípios de processamento de dados e de regulação estrutural, como
vimos no capítulo “O Problema de Descartes”. Qualquer uma dessas categorias resulta
de leis naturais, não específicas à linguagem, e sua atuação internamente à FL assegura
sua determinação como um caractere biológico ótimo para os propósitos que visa
desempenhar.
Em linhas gerais, o terceiro fator recupera a tentativa de Alan Turing de
evidenciar que muitas propriedades dos organismos não resultam de seleção natural,
mas decorrem do modo como o mundo físico funciona. Uma vez que a FL/GU é descrita
como uma categoria pertencente ao mundo natural, como apontamos anteriormente,
devemos assumir que ela deve ser analisada como qualquer outro sistema biológico, sob
os quais os princípios biofísicos do terceiro fator também estão em jogo (Gould, 2002).
213
Vemos, portanto, que a estratégia subjacente ao modelo dos três fatores é reduzir a
complexidade da GU transferindo um conjunto de propriedades presumivelmente
determinadas pelo genótipo da espécie (i.e., primeiro fator) a princípios não específicos
à linguagem (i.e., terceiro fator).
Percebemos ainda que a complexidade da linguagem anteriormente atribuída à
GU torna-se aparente quando incorporamos a abordagem “de baixo para cima” ao
modelo dos três fatores. A competência linguística deixa de ser descrita como uma
consequência integralmente determinada pelo genótipo da espécie, cuja manifestação
fenotípica diz respeito a um sistema internamente complexo. Em vez disso, ela passa a
ser caracterizada como o produto da interação entre uma determinação genética mínima
– a GU – e leis biofísicas que regem o mundo natural. Essa sintetização da GU cristaliza-
se na Tese Minimalista Forte (TMF) (Chomsky, 2001: 1), que, em sua formulação geral,
estipula que a linguagem humana nada mais é do que uma solução ótima para satisfazer
as condições de legibilidade impostas pelas interfaces com os sistemas S-M e C-I:
(3) Tese Minimalista Forte

A tese minimalista mais forte deve assegurar que a linguagem é uma solução
ótima para condições de legibilidade.
Como consequência dessa nova abordagem para a GU, os módulos postulados

anteriormente passam a ser explicados sob a forma de condições impostas pelas
interfaces com os sistemas externos. Com a TMF, podemos dizer que a GU reduz-se a um
sistema combinatorial recursivo, responsável por formar expressões hierarquicamente
estruturadas, e a princípios de eficiência computacional que asseguram a legibilidade
dessas expressões pelos sistemas interpretativos. Em decorrência dessa sintetização, a
GU pode ser reduzida a uma simples equação, como sugere Chomsky (2010: 46):
(4) GU: Recursividade + Interfaces = Linguagem
Essa mudança de perspectiva acerca da representação da GU torna a teoria

linguística mais próxima dos critérios de adequação evolutiva. Uma vez que a inovação
ocorrida na espécie circunscreve-se, possivelmente, à equação em (4), temos em mãos
uma hipótese coerente com o que se sabe sobre o desenvolvimento evolutivo humano e,
214
por conseguinte, plausível para esclarecer os impasses colocados pelo Problema de
Wallace-Darwin.
Reconstruindo a Faculdade da Linguagem
Ao contrastar a discussão da última seção com o que vimos na primeira seção,

percebemos que as estratégias de sintetização da GU empreendidas pelo PM estão
diretamente alinhadas às considerações colocadas pelo Problema de Wallace-Darwin.
Fica evidente que a sintetização da GU é de interesse não apenas das investigações sobre
a ontogenia da linguagem, como também de sua filogenia. Aliás, como apontamos
anteriormente, a redução dos mecanismos da GU e a influência exercida pelos princípios
do terceiro fator fazem com que o papel do genótipo humano – i.e., das competências
exclusivas à espécie – seja limitado. Tal limitação torna o assunto da emergência da
linguagem mais palatável e passível de ser explorado.
A redução da GU é fundamental quando consideramos a hipótese de que o
surgimento da competência linguística representa um evento relativamente recente. Sua
sintetização nos mostra que a inovação evolutiva ocorrida na espécie, responsável por
dar origem ao caractere para linguagem, foi geneticamente mínima, muito embora seu
fenótipo corresponda paradoxalmente a um sistema complexo; o que se verifica, por
exemplo, na descontinuidade cognitiva estabelecida entre animais humanos e não
humanos. Tendo em vista a limitação do genótipo humano, a complexidade observada
fenotipicamente deve, por hipótese, estar associada a componentes da FL que não são
exclusivos à espécie e à própria linguagem. Para identificá-los, é preciso definir quais
são os componentes elementares da FL.
Com base nos avanços teóricos obtidos pelo empreendimento gerativista nos
últimos 60 anos, Berwick e Chomsky (2016) fornecem uma definição concisa para esse
caractere, partindo de sua propriedade elementar: a assunção de que a competência
linguística humana compreende um sistema de associações entre som e significado,
conectados através de uma estrutura sintática. Os autores rotulam tal propriedade de
Propriedade Básica, descrita no trecho a seguir:
A linguagem é um sistema computacional finito capaz de produzir uma

infinidade de expressões, cada uma das quais com uma interpretação definida
nos sistemas semântico-pragmático e sensório-motor (informalmente,
pensamento e som) (Berwick e Chomsky, 2016: 1).
215
Assumindo-se a validade dessa definição, podemos admitir que a FL constitui-se
minimamente de três componentes elementares: (i) um sistema combinatorial recursivo
– instanciado teoricamente pela operação Merge, descrita no capítulo “O Programa
Minimalista” –, (ii) um sistema S-M e (iii) um sistema C-I. Para determinar quais desses
componentes não são exclusivos à espécie, Berwick e Chomsky (2016: 2) recomendam
a abordagem “dividir para conquistar”. Sua metodologia é simples: em um primeiro
momento, fragmenta-se o caractere biológico sob análise em componentes mais
primários, tal como fizemos anteriormente, e, em um segundo momento, contrastam-se
suas propriedades principais com propriedades paralelas constatadas no comportamento
e na expressão genética de animais não humanos.
Hauser, Chomsky e Fitch (HCF, 2002) desenvolveram grande parte dessa tarefa.
Aplicando o método comparativo, os autores perceberam que muitas das propriedades
que compõem os sistemas S-M e C-I são atestadas em animais não humanos e, portanto,
são anteriores ao surgimento da linguagem. Por exemplo, os autores revelam que
características articulatórias e perceptuais, tais como partes da anatomia do aparelho
vocal, controle motor, percepção rítmica e imitação vocal são amplamente encontradas
em outros vertebrados. O mesmo paralelo é observado nas capacidades conceituais e
interpretativas, já que aquisição de representações conceituais, identificação de objetos,
planejamento, entre outras habilidades, são atestadas no comportamento de diferentes
espécies. Porém, opostamente ao que se observa com os sistemas interpretativos, as
propriedades do sistema combinatorial – em especial, sua recursividade – parecem ser
exclusivas à espécie, e, por conseguinte, corresponderiam à inovação evolutiva
manifestada pelo genótipo humano (veja também Berwick et al., 2011).
Com base nessas observações, HCF (2002: 1570-1571) cindem a FL em duas
categorias distintas, notadamente: (i) uma FL no sentido estrito (FLN, FL in the narrow
sense), que inclui propriedades únicas à espécie e à linguagem humanas – em outras
palavras, a GU –, e (ii) uma FL no sentido amplo (FLB, FL in the broad sense), que inclui
as propriedades que foram exaptadas para a linguagem, compartilhadas com outras
espécies, bem como propriedades recrutadas de outros domínios cognitivos. Para os
autores, a FLB inclui a FLN. Sendo assim, foi somente através da integração entre a FLB e
a FLN que as capacidades preexistentes dos sistemas S-M e C-I passaram a ser mediadas
por um sistema combinatorial recursivo (2002: 1571). Essa integração teria dado origem
216
à competência linguística humana. É válido mencionar que tal integração caracteriza-se
como um evento evolutivo abrupto, responsável pelo grande salto cognitivo da espécie.
Como resultado da incorporação da FLB com a FLN, podemos verificar que
grande parte da complexidade observada no fenótipo linguístico não está codificada no
genoma humano, mas decorre dos componentes periféricos da FLB, notadamente
daqueles que subjazem aos sistemas S-M e C-I. Essa hipótese é capaz de explicar
satisfatoriamente grande parte do Problema de Wallace-Darwin. Por outro lado, o que
haveria de unicamente humano na linguagem reduz-se aos mecanismos computacionais
da recursividade (2002: 1573). Notem que essa conclusão dialoga diretamente com a
TMF descrita em (4). Em resumo, ao reduzir a GU a um mecanismo combinatorial e às
interfaces com os sistemas interpretativos, e, paralelamente, ao demonstrar que os
sistemas interpretativos correspondem a competências cooptadas de sistemas cognitivos
anteriores ao surgimento da linguagem, a complexidade da competência linguística
torna-se aparente, uma assunção que esclarece as inquietações teóricas de Wallace.
Neste capítulo, exploramos o modo como o empreendimento gerativista,

representado nas ideias de Chomsky, abordou o Problema de Wallace-Darwin. Vimos
que os registros materiais deixados por diferentes espécies hominínias nos sugerem que
o surgimento de raciocínio simbólico e, por extensão, da FL correspondem a um evento
evolutivo recente. Tais fatos nos impedem de atribuir ao genótipo humano – i.e., à GU –
a complexidade observada internamente à FL. Com o advento do PM, a assunção de uma
GU mínima e a inclusão de princípios biofísicos em seu funcionamento tornam a
complexidade do caractere para a linguagem aparente. Além disso, HCF (2002) nos
mostram que grande parte dos componentes da FL decorrem de exaptações,
notadamente, os sistemas interpretativos S-M e C-I. Portanto, embora sincronicamente a
FL se apresente como um sistema complexo, os avanços na teoria gerativa e em
trabalhos interdisciplinares nos indicam que sua complexidade não se configura como
uma incongruência do mundo natural, mas decorre diretamente do modo como ele
funciona.
Referências
217
BAMBINI, V.; CHESI, C.; MORO, A. A conversation with Noam Chomsky. Phenomenology and mind, n. 3,
pp. 166-178, 2012.
BERWICK, R.; CHOMSKY, N. Why only us? Language and evolution. Cambridge, MA: MIT Press, 2016.
______ et al. Songs to syntax: the linguistics of birdsongs. Trends in Cognitive Science, v. 15, pp. 113-
121, 2011.
BICKERTON, D. More than nature needs: Language, mind, and evolution. Cambridge, MA: Harvard
BOECKX, C. The nature of Merge: Consequences for language, mind, and biology. In: PIATTELL-
PALMARINI, M.; URIAGEREKA, J.; SALABURU, P. (Orgs.) Of minds and language: A dialogue with
Noam Chomsky in the Basque Country. Oxford: Oxford University Press, 2009, pp. 44-57.
BOUZZOUGAR, A. et al. 82,000-year-old shell beads from North Africa and implications for the origins of
modern human behavior. Procedings of the National Academy of Sciences of the United States of
America (PNAS), v. 104, pp. 9964-9969, 2007.
CHOMSKY, N. Language and Mind. Nova York: Harcourt, 1968.
. Rules and representations. Nova York: Columbia University Press, 1980.
______. Lectures on Government and Binding. Dordrecht: Foris, 1981.
______. Knowledge of language. Nova York: Praeger, 1986.
______. Minimalist inquiries: The framework. In: MARTIN, R.; MICHAELS, D.; URIAGEREKA, J. (org.),
Step by step: Essays in minimalist syntax in honor of Howard Lasnik. Cambridge, MA: MIT Press,
2000, pp. 89-155.
______. Derivation by phase. In: KENSTOWICZ, M. (Org.) Ken Hale: A life in language. Cambridge, MA:
MIT Press, 2001, pp. 1-52.
______. Three factors in language design. Linguistic Inquiry, v. 36, n. 1, pp. 1-22, 2005.
______. Approaching UG from below. In: SAUERLAND, U.; GAERTNER, M. (Orgs.). Interfaces +
Recursion = Language? Berlim: Mouton de Gruyter, 2007, pp. 1-30.
______. Some simple evo devo theses: how true might they be for language? In: LARSON, R. et al.
(Orgs.). The evolution of human language. Cambridge: Cambridge University Press, 2010, pp. 45-
62.
______. Language and other cognitive systems. What is special about language? Language Learning and
Development, v. 7, n. 4, pp. 263-278, 2011.
______. Problems of projection: Extensions. In: D I DOMENICO, E.; HAMANN, C.; MATTEINI, S. (Orgs.).
Structures, strategies and beyond. Studies in honour of Adriana Belletti. Amsterdam: Benjamins
Publishing Company, 2015, pp. 1-16.
______. What kind of creatures are we? Nova York: Columbia University Press, 2016.
______. Language architecture and its import for evolution. Neuroscience & Biobehavioral Reviews, v.
81, pp. 295-300, 2017.
DARWIN, C. The descent of man, and selection in relation to sex. London: John Murray, 1871.
DAWKINS, R. The god delusion. Londres: Black Swan, 2006.
218
D’ERRICO, F.; VANHAEREN, M. Earliest personal ornaments and their significance for the origin of
language debate. In: BOTHA, R.; KNIGHT, C. (Orgs.) The cradle of language. Oxford: Oxford
University Press, 2009, pp. 16-40.
FODOR, J. In critical condition: Polemical essays on cognitive science and the philosophy of mind.
Cambridge, MA: MIT Press, 1998.
FUJITA, K. A prospect for evolutionary adequacy: Merge and the evolution and development of human
language. Biolinguistics, v. 3, n. 2-3, 2009, p. 128-153.
GOULD, S. J. The structure of evolutionary theory. Cambridge, MA: Harvard University Press, 2002.
______; VRBA, E. S. Exaptation – a missing term in the science of form. Paleobiology, v. 8, pp. 4-15,
1982.
GRONAU, I. et al. Bayesian inference of ancient human demography from individual genome
sequences. Nature Genetics, v. 43, pp. 1031-1034, 2011.
HARMAND, S. et al. 3.3-million-year-old stone tools from lomekwi 3, West Turkana, Kenya. Nature, v.
521, pp. 310-316, 2015.
HAUSER, M.; CHOMSKY, N.; FITCH, W. T. The faculty of language: What is it, who has it, and how did it
evolve? Science, v. 298, pp. 1569-1579, 2002.
HENSHILWOOD, C. et al. Emergence of modern human behavior: Middle Stone Age engravings from
South Africa. Science, v. 295, pp. 1278-1280, 2002.
______ et al. Middle Stone Age shell beads from South Africa. Science, v. 304, p. 404, 2004.
______ et al. Engraved ochers from the Middle Stone Age levels at Blombos Cave, South Africa. Journal
of Human Evolution, v. 57, pp. 27-47, 2009.
HOFFMANN, D. L.; STANDISH, C. D. et al. U-Th dating of carbonate crusts reveals Neandertal origin of
Iberian cave art. Science, v. 359, n. 6378, pp. 912-915, 2018.
______; ANGELUCCI, D. E., et al. Symbolic use of marine shells and mineral pigments by Iberian
Neandertals 115,000 years ago. Science, v. 4, n. 2, 2018.
HORNSTEIN, N. A theory of syntax. Cambridge: Cambridge University Press, 2009.
HUIJBREGTS, M. Phonemic clicks and the mapping asymmetry: how language emerged and speech
developed. Neuroscience & Biobehavioral Reviews, v. 81, pp. 279-294, 2017.
KLEIN, R. G. The human career: Human biological and cultural origins. Chicago: The University of
Chicago Press, 2009.
LALAND, K. N. Darwin’s unfinished symphony. Princeton: Princeton University Press, 2017.
LEPRE, C. J. et al. An earlier origin for the Acheulian. Nature, v. 477, pp. 82-85, 2011.
LEWONTIN, R. C. The evolution of cognition: Questions we will never answer. In: SCARBOROUGH, D.;
STERNBERG, S. (Orgs.). An invitation to Cognitive Science: Methods, models, and conceptual issues.
Cambridge, MA: MIT Press, 1998, v., pp. 107-132.
MARTIN, R.; URIAGEREKA, J. Some possible foundations of the Minimalist Program. In: MARTIN, R.;
MICHAELS, D.; URIAGEREKA, J. (Orgs.), Step by step: Essays in minimalist syntax in honor of
Howard Lasnik. Cambridge, MA: MIT Press, 2000, pp. 1-30.
MOCZEK, A. P. On the origins of novelty in development and evolution. BioEssays, v. 30, n. 5, pp. 432-
447, 2008.
219
TATTERSALL, I. An evolutionary framework for the acquisition of symbolic cognition by Homo sapiens.
Comparative Cognition & Behavior Reviews, v. 3, pp. 99-114, 2008.
______. Masters of the planet. Nova York: Palgrave Macmillan, 2012.
______. Language origins: an evolutionary framework. Topoi, 2016, pp. 1-8.
VANHAEREN, M. et al. Middle paleolithic shell beads in Israel and Algeria. Science, v. 312, pp. 1785-
1788, 2006.
WALLACE, A. R. Sir Charles Lyell on geological climates and the origin of species. Quarterly Review, v.
126, pp. 359-394, 1869.
______. Contributions to the Theory of Natural Selection. Basingstoke: Macmillan and Co., 1870.
WEST-EBERHARD, M. J. Developmental plasticity and the origin of species differences. Procedings of the
National Academy of Sciences of the United States of America (PNAS), v. 102, pp. 6543-6549,
2005.
WHITE, T. D. et al. Pleistocene Homo sapiens from Middle Awash, Ethiopia. Nature, v. 423, pp. 742-747,
2003.
220
O FUTURO DA LINGUÍSTICA E O LEGADO CHOMSKYANO

Eduardo Kenedy
Neste capítulo final, esboçamos uma rápida reflexão sobre os possíveis

desenvolvimentos da Linguística a partir do legado chomskyano. Trata-se de um
exercício meramente especulativo porque não temos como prever o futuro da ciência
(obviamente, ninguém pode fazê-lo) e também porque não se pode ainda definir a real
extensão do “legado” chomskyano. Aos 90 anos de idade, Chomsky continua
intelectualmente ativo e de certo ainda acrescentará novidades à produção científica que
nos deixará como herança.55
Como o leitor teve a oportunidade de verificar ao longo deste livro, Chomsky,
no cômputo de sua vasta produção acadêmica, abordou uma série de questões
científicas. Tais questões foram especialmente analisadas nos capítulos dedicados aos
cinco grandes problemas a serem investigados pela teoria linguística:
a. O Problema de Humboldt, ou de que se constitui o conhecimento

gramatical de uma pessoa?
b. O Problema de Platão, ou como esse conhecimento gramatical se
desenvolve durante as primeiras fases da vida de um bebê/uma criança?
c. O Problema de Descartes, ou como esse conhecimento gramatical é
posto em uso pelo falante/ouvinte?
d. O Problema de Broca, ou quais são os recursos neurofisiológicos do
cérebro que sustentam o conhecimento gramatical de um indivíduo?
e. O Problema de Wallace-Darwin, ou como explicar, nos termos
evolutivos da espécie humana, o surgimento da faculdade da linguagem?
221
De certa maneira, o desenvolvimento do programa gerativista coincidiu
cronologicamente com essa sequência de questões. Vimos, por exemplo, que os
primeiros artigos e trabalhos monográficos gerativistas (em especial, as publicações
iniciais do próprio Chomsky nos anos 1950) se debruçaram essencialmente sobre o
Problema de Humboldt (veja o capítulo “Estruturas Sintáticas e a reinvenção da teoria
linguística”). De fato, a natureza do conhecimento gramatical é o tema central de The
logical structure of linguistic theory, de Estruturas sintáticas e de Aspectos da teoria da
sintaxe – obras-chave das primeiras fases do empreendimento gerativista. Com o passar
dos anos, o programa gerativista passou a ser conduzido por outras mentes brilhantes da
Linguística, incialmente nos EUA, depois na Europa, no Brasil e finalmente no restante
do mundo interessado em ciência da linguagem. Com a rápida difusão das ideias de
Chomsky entre linguistas, psicólogos cognitivos, psicolinguistas e neurocientistas, as
demais questões do empreendimento gerativo passaram a ser refinadas e pesquisadas de
maneira mais específica.
Assim é que, olhando para o passado, entendemos que a exploração do
Problema de Humboldt conduziu à pesquisa posterior sobre o Problema de Platão,
especialmente em função do desenvolvimento da proposta de Princípios e Parâmetros
nos anos 1980 (cf. Chomsky, 1981a, b, além do capítulo “Teoria da Regência e Ligação
e a proposta de Princípios e Parâmetros”). Desde então, trabalhos rigorosos em
aquisição da linguagem não são levados a cabo sem que alguns postulados-chave do
programa gerativista sejam considerados, seja para reforçá-los, seja para refutá-los.
Em anos mais recentes e com o avanço da tecnologia empregada em pesquisas
experimentais, a agenda gerativista pôde enfrentar de maneira mais robusta os
Problemas de Descartes e de Broca, em especial após a década de 1990, a chamada
“década do cérebro” (cf. Chomsky, 2018b). Não obstante, foi apenas no começo deste
século que vimos o amadurecimento da “Sintaxe Experimental”, área da pesquisa
gramatical essencialmente preocupada com o problema de Descartes (cf. Sprouse,
2007; Kenedy, 2007; Maia, 2012, 2015; Roeper, 2012).
Finalmente, no curso das duas primeiras décadas do século XXI, Chomsky tem se
ocupado mais detidamente com uma questão por muitos considerada insolúvel, o
Problema de Wallace-Darwin. Afinal, como contemplar, de um ponto de vista
chomskyano, a emergência da linguagem na longa história da espécie sapiens do gênero
homo? Tal pergunta deu origem a um novo programa de investigação no escopo
222
gerativista: a Biolinguística (cf. Chomsky, 2018a). A resposta darwinista mais aceita
pela comunidade biolinguista até o presente assume que a faculdade da linguagem tenha
emergido provavelmente como uma mutação em um único indivíduo, há cerca de 80 mil
anos. Vários indícios paleontropológicos de fontes independentes apontam para um
mesmo fato: houve uma revolução cultural e cognitiva no gênero homo por volta dessa
data (cf. Klein e& Edgar, 2005; Wilson, 2013; Harari, 2015). Tal mutação,
possivelmente expressa com a operação de Merge (cf. Berwick e Chomsky, 2017),
possibilitou a esse primeiro indivíduo a representação simbólica que lhe deu uma
vantagem adaptativa com relação aos demais. Aceitar essa resposta nos obriga, contudo,
a violar uma “máxima” do clássico quadro de evolução darwiniana: natura non facit
saltum. No caso da linguagem, entretanto, podemos de fato estar frente a um salto
evolutivo (cf. Berwick e Chomsky, 2017; Chomsky, 2018a, além dos capítulos “O
Programa Minimalista” e “O Problema de Wallace-Darwin). Esse é um dos principais
tópicos para a pesquisa futura nessa área da ciência.
Como ressaltamos neste livro, Chomsky exerceu forte influência no
desenvolvimento de diversos domínios do conhecimento, como a Matemática, a
Filosofia, a Biologia, a Linguística, a História, a Sociologia e as ciências políticas. Seu
legado provavelmente persistirá longamente nessas áreas e, em especial, na Linguística.
Dentro dessa área em específico, registramos hoje a influência do pensamento
chomskyano em diferentes campos de atuação: fonologia, morfologia, léxico, sintaxe,
semântica, aquisição da linguagem, processamento linguístico, variação e mudança
linguísticas, história das línguas, ensino de língua materna, ensino de língua estrangeira,
linguística computacional, evolução da linguagem...
No contexto da História, da Filosofia e da ciência, Chomsky já tem lugar
reservado no panteão de grandes pensadores sobre a linguagem. O objetivo deste livro
foi apresentar uma introdução abrangente à obra desse que é considerado o maior
linguista da atualidade e possivelmente o linguista mais influente de todos os tempos. O
futuro nos dirá qual será seu efetivo legado para os estudiosos das próximas décadas e
dos próximos séculos.
Referências
223
BERWICK, R. B.; CHOMSKY, N. Por que apenas nós: linguagem e evolução. São Paulo: Editora da Unesp,
2017.
CHOMSKY, N. Lectures on government and binding. Dordrecht: Foris, 1981a.
______. Principles and parameters in syntactic theory. In: HORNSTEIN, N.; LIGHTFOOT, D. (Eds.).
Explanation in linguistics: the logical problem of language acquisition. Harlow: Longman, 1981b.
______. Réquiem para o sonho americano: os dez princípios de concentração de renda e poder. Rio de
Janeiro: Bertrand Brasil, 2017a.
______. Quem manda no mundo? São Paulo: Planeta do Brasil, 2017b.
______. Sobre mentes e linguagem. ReVEL, vol. 16, n. 31, 2018a.
______. Que tipo de criatura nós somos? Petrópolis: Vozes, 2018b.
HARARI, Y. N. Sapiens: uma breve história da humanidade. Porto Alegre: L&PM, 2015.
KENEDY, N. A hipótese da antinaturalidade de pied-piping em orações relativas. Rio de Janeiro, QUAL
ANO?] Tese (Doutorado) – UFRJ.
KLEIN, R. G.; EDGAR, B. O despertar da cultura. Rio de Janeiro: Jorge Zahar, 2005.
MAIA, M. Sintaxe Experimental: uma entrevista com Marcus Maia. ReVEL, v. 10, n. 18, 2012.
______. Sintaxe experimental. In: OTHERO, G. A.; KENEDY, E. Sintaxe, sintaxes: uma introdução. São
Paulo: Contexto, 2015.
ROEPER, T. Sintaxe Experimental: uma entrevista com Thomas Roeper. ReVEL, vol. 10, n. 18, 2012.
SPROUSE, J. A program for experimental syntax. Doctoral dissertation, University of Maryland, 2007.
WILSON, E. O. A conquista social da terra. São Paulo: Companhia das Letras, 2013.
224
OS AUTORES
Organizadores
GABRIEL DE ÁVILA OTHERO é professor do Departamento de Linguística,

Filologia e Teoria Literária e do Programa de Pós-Graduação em Letras da
Universidade Federal do Rio Grande do Sul (UFRGS). É doutor e mestre em Linguística
pela PUCRS; com pós-doutorados pela UFRGS e pela Universidade Estadual de Campinas
(Unicamp). É autor, pela Contexto, dos livros Teoria X-barra: descrição do português e
aplicação computacional (2006), Sintaxe, sintaxes: uma introdução (juntamente com
Eduardo Kenedy, 2015) e Para conhecer Sintaxe (também em parceria com Eduardo
Kenedy, 2018). Traduziu quatro livros de Noam Chomsky publicados no Brasil:
Estruturas sintáticas, edição comentada (com Sergio Menuzzi), A ciência da linguagem
(com Sergio Menuzzi e Luisandro M. de Souza), Por que apenas nós? Linguagem e
evolução e Que tipo de criatura nós somos? (ambos em parceria com Luisandro M. de
Souza).
EDUARDO KENEDY é doutor e mestre em Linguística pela Universidade Federal do

Rio de Janeiro (UFRJ) e licenciado em Letras pela Universidade Federal Fluminense
(UFF). Na UFF, é professor do Departamento de Ciências da Linguagem e membro
permanente do Programa de Pós-graduação em Estudos de Linguagem, filiado à linha
de pesquisa Teoria e Análise Linguística, com ênfase em psicolinguística e linguística
gerativa. Fundou o Laboratório do Grupo de Estudos e Pesquisas em Linguística
Teórica e Experimental (GEPEX-UFF), atuando como orientador de trabalhos sobre
processamento linguístico, sobre sintaxe gerativa e sobre psicolinguística translacional
para a Educação. Em 2013, recebeu da Faperj o prêmio Jovem Cientista do Nosso
Estado. É bolsista de produtividade em pesquisa do CNPq, nível 2, desde o ano de 2017.
Pela editora Contexto, publicou Curso básico de Linguística Gerativa (2013), Sintaxe,
sintaxes: uma introdução (2015) e Para conhecer Sintaxe (2018) (estes dois
225
coorganizados com Gabriel de Ávila Othero), além de ser o coautor nas obras Manual
de Linguística (2008) e Psicolinguística, piscolinguísticas: uma introdução (2015).
Autores
ANIELA IMPROTA FRANÇA concluiu o doutorado em Linguística pela

Universidade Federal do Rio de Janeiro (UFRJ) em 2002, tendo estagiado no Cognitive
Neuroscience of Language Lab da Universidade de Maryland, EUA, no Instituto de
Neurologia da UFRJ e no Ambulatório de AVC da Universidade Federal Fluminense
(UFF). É professora associado do Departamento de Linguística da UFRJ, coordenadora da
pós-Graduação em Linguística (2015-2017) e membro efetivo do Programa Avançado
de Neurociência (PAN-UFRJ). Desde 2006 coordena o Laboratório de Acesso Sintático
(ACESIN), formando alunos de iniciação científica, mestrado e doutorado em teoria
linguística, e em pesquisa psicolinguística e de neurociência da linguagem. Atuou como
coordenadora do GT de Psicolinguística da Anpoll (Associação Nacional de Pós-
graduação de Pesquisa em Letras e Linguística) no biênio 2008-2010. É pesquisadora
do CNPq, cientista do Nosso Estado da Faperj e membro da Rede Nacional de Ciência
para Educação (Rede CpE).
CILENE RODRIGUES possui graduação em Letras pela Universidade de Brasília

(1995), mestrado em Linguística pela Universidade de Brasília (1998) e doutorado em
Linguística/Teoria Formal da Gramática pela University of Maryland (2004). É
professora e pesquisadora da PUC-Rio (Lapal – Laboratório de Aquisição e
Processamento da Linguagem e INCog – Grupo de Pesquisa Interdisciplinar em
Neurociências e Cognição). Em cognição tem interesse em gramática em desordens
mentais e questões de especificidade de domínio. Em teoria linguística, tem interesse
em sintaxe experimental e em sintaxe comparada, especialmente em recursividade,
dependência sintaxe-semântica, a nano-sintaxe e a interpretabilidade dos pronomes nas
interfaces da gramática.
226
DANNIEL CARVALHO possui graduação em Letras pela Universidade Federal de
Alagoas (2004) e doutorado em Letras e Linguística pela Universidade Federal de
Alagoas (2008), com período sanduíche na Queen Mary, Univeristy of London, onde
desenvolveu também estágio de pós-doutoramento (2014-2015). É professor associado I
da Universidade Federal da Bahia e membro permanente do Programa de Pós-
Graduação em Língua e Cultura. É líder do Grupo de Pesquisa A Sintaxe-Phi das
Línguas Naturais, certificado pelo Diretório de Grupos de Pesquisa do CNPq desde
2010. Atualmente é associado do Grupo de Estudos Linguísticos do Nordeste,
colaborador da Universidade Federal de São Paulo, colaborador da Universidade
Federal Rural de Pernambuco, pesquisador da Universidade Federal de Alagoas e
coordenador do GT Teoria da Gramática da Associação Nacional de Pós-Graduação e
Pesquisa em Letras e Linguística. Desenvolve pesquisas na área da Linguística, com
ênfase em Teoria e Análise Linguística, atuando principalmente nos seguintes temas:
linguística lavanda, gênero e seus aspectos gramaticais e sociais, o sistema de definitude
das línguas naturais, traços-phi e seu impacto na morfossintaxe das línguas naturais,
sistema pronominal do português e suas interfaces morfossintáticas e sintático-
semântica.
MARCUS LUNGUINHO é graduado em Letras/Língua Portuguesa e respectiva

literatura pela Universidade de Brasília (1998-2002) com mestrado em Linguística
também pela Universidade de Brasília (2005). Doutor em Linguística pela Universidade
de São Paulo (2011). Durante o doutorado foi visiting student no Department of
Linguistics and Philosophy do Massachusetts Institute of Technology (MIT). Atualmente
é professor do Departamento de Linguística, Português e Línguas Clássicas da
Universidade de Brasília. Sua pesquisa se insere no quadro teórico da Teoria Gerativa
em sua versão Minimalista e se volta à descrição e à análise de fenômenos
morfossintáticos do domínio verbal e do domínio nominal. No domínio verbal, seus
interesses são: 1) verbos auxiliares e suas propriedades morfossintáticas (perspectiva
sincrônica e diacrônica), 2) gramaticalização de verbos, 3) seleção de auxiliares, 4)
dependências morfossintáticas, 5) sintaxe dos domínios não-finitos, 6) tipologia de
particípios (adjetivais, perfectivos, passivos e inovadores), 7) propriedades de sentenças
passivas, 8) verbos modais, 9) verbos aspectuais e 10) alternâncias sintáticas. No
domínio nominal, seus interesses são: 1) vocativos e a articulação sintaxe-pragmática,
227
2) organização sintática das relações de posse (possessivos, possuidores internos e
possuidores externos ao DP), 3) fenômenos de quantificação e modificação e 4)
mecanismos de concordância interna ao DP.
MARCUS MAIA é doutor em Linguística pela University of Southern California – USC

(1994). Realizou estágio de pós-doutorado na área de Processamento da Linguagem
como pesquisador visitante na City University of New York – CUNY (2003-2004).
Atualmente é Professor Titular de Linguística do Departamento de Linguística e do
Programa de Pós-graduação em Linguística da Faculdade de Letras da Universidade
Federal do Rio de Janeiro. Foi coordenador do Programa de Pós-graduação em
Linguística entre 2010 e 2015. Representou o Centro de Letras e Artes da UFRJ no
Conselho Superior de Pós-graduação (CEPG/UFRJ), por dois mandatos, entre 2009 e
2015. É bolsista de Produtividade em Pesquisa, nível 1C (CNPq) e Cientista do Nosso
Estado (Faperj) no triênio 2015-2018. Foi professor visitante no Departamento de
Línguas, Literaturas e Culturas e no Language Acquisition Research Center (LARC), da
University of Massachusetts, Amherst, no primeiro semestre de 2012. Foi pesquisador
visitante no Departamento de Linguística da Massey University, Nova Zelândia, em
setembro/outubro de 2015 e no segundo semestre de 2017 e no Departamento de
Espanhol e Português da University of Toronto, Canadá, em novembro de 2015. Fundou
e coordena o Laboratório de Psicolinguística Experimental (LAPEX), grupo de pesquisa
da UFRJ, registrado no CNPq, em 2001. Coordenou o Grupo de Trabalho de
Psicolinguística da Anpoll no biênio 2006-2008. Membro fundador da Rede Nacional
de Ciência para a Educação (Rede CpE). Atua nas áreas de Psicolinguística, Teoria e
Análise Linguística e Línguas Indígenas Brasileiras, desenvolvendo pesquisas e
orientando projetos sobre processamento sintático e lexical, sintaxe experimental, teoria
da gramática, psicolinguística e educação, línguas indígenas brasileiras.
MARIA CRISTINA FIGUEIREDO SILVA possui graduação em Linguística e

Português pela Universidade de São Paulo (1985), mestrado em Linguística pela
Universidade Estadual de Campinas (1988) e doutorado na Université de Genève
(1994). É professora atualmente da Universidade Federal do Paraná (UFPR). Atua em
Teoria e Análise Linguística, especificamente dentro do quadro da Gramática Gerativa,
228
pesquisando temas como: o sujeito nulo em português brasileiro, a comparação entre o
português brasileiro e o português europeu, questões de morfologia gerativa e, mais
recentemente, o fenômeno da ordem das palavras na interface fonologia-sintaxe.
MARIANA TERRA TEIXEIRA é doutoranda em Linguística no Programa de Pós-

Graduação em Letras da Pontifícia Universidade Católica do Rio Grande do Sul
(PUCRS), com bolsa CNPq. Mestre em Linguística pela Pontifícia Universidade Católica
do Rio Grande do Sul (PUC-RS), com bolsa Capes. Graduada em Letras Licenciatura
Português/Espanhol pela Universidade Federal do Rio Grande do Sul (UFRGS). Foi
bolsista de iniciação científica PIBIC/CNPq-UFRGS durante a graduação. Pesquisa na área
da neurociência cognitiva, voltada ao processamento da linguagem. Bastante interessada
nos seguintes temas: processamento da linguagem, bilinguismo, processamento
sintático da linguagem (produção e compreensão), linguística formal, sintaxe, semântica
e suas interfaces.
MAXIMILIANO GUIMARÃES é Professor Associado de Linguística da

Universidade Federal do Paraná (UFPR). Ele é bacharel em Letras pela Universidade
Federal da Bahia (1995), mestre em Linguística pela Universidade Estadual de
Campinas (1998) e doutor em Linguística pela University of Maryland (2004). Sua área
de atuação como professor e pesquisador é Teoria da Gramática, trabalhando no quadro
teórico da Gramática Gerativo-Transformacional, tendo como principais temas (i) teoria
e análise sintática, (ii) teoria e análise fonológica, (iii) aquisição de linguagem, inatismo
e argumentos de pobreza de estímulo. As más línguas dizem por aí que Maximiliano
Guimarães é um chomskyano radical fundamentalista. Isso é uma mentira deslavada.
Todos os alunos dele sabem que quem ele mais admira nos estudos da cognição de
linguagem é Jerry Fodor. No que concerne aos temas sócio-político-econômicos,
Maximiliano Guimarães não cai naquele nonsense pueril anticapitalista de Chomsky.
RUTH LOPES tem bacharelado em Letras – tradução – pela Pontifícia Universidade

Católica de São Paulo (1982), mestrado em Linguística Aplicada aos Estudos da
Linguagem também pela Pontifícia Universidade Católica de São Paulo (1988) e
229
doutorado em Linguística pela Universidade Estadual de Campinas (1999). Fez eeu
primeiro pós-doutorado na University of Maryland at College Park (2001-2002), o
segundo, em 2010, na University of Massachusetts (Amherst) e o terceiro e quarto,
respectivamente em 2013 e 2017, na University of Chicago. É professora associada II
(MS 5.2) da Universidade Estadual de Campinas, tendo feito a livre-docência em 2012
com o trabalho “Nos contornos da sentença: ensaios sobre aquisição da linguagem”. Sua
pesquisa concentra-se em aquisição de sintaxe e fenômenos de interface sintaxe-
semântica a partir da teoria gerativo-transformacional e em sintaxe do português
brasileiro.
SERGIO MENUZZI é graduado em Letras pela UFRGS (1987). Possui mestrado em

Linguística pela Unicamp (1992), no qual foi orientado por Rodolfo Ilari e Carlos
Franchi. Obteve doutorado em Linguística pela Universidade de Leiden (Holanda,
1999), com orientação de Johan Rooryck e Frits Beukema. Fez pós-doutorado em 2012,
na UFPR, sob supervisão de Maria Cristina Figueiredo Silva. Foi professor do Programa
de Pós-Graduação em Letras da PUC-RS (1997-2005), do Departamento de Linguística
da Unicamp (2005-2006) e do Departamento de Linguística da UFRGS (2006-2010).
Atualmente, é professor do Departamento de Letras Clássicas e Vernáculas da UFRGS (a
partir de 2010). Membro do conselho editorial das revistas Probus (Elsevier), RELIN
(UFMG), Alfa (Unesp), entre outras. Tem experiência na área de Linguística, subárea de
Teoria e Análise Linguística, com ênfase em temas relacionados a: (a) interfaces entre
sintaxe, semântica e pragmática; (b) comparação de modelos formais e funcionais de
gramática; (c) gramática da língua portuguesa.
SIMONE GUESSER possui graduação em Letras-Português pela Universidade

Federal de Santa Catarina (2003), mestrado em Linguística pela Universidade de Siena
(2007) – reconhecido como mestrado em Linguística e Semiótica pela USP –, pós-
graduação em Ciências Cognitivas (Universidade de Siena, 2008) e doutorado em
Informática, Lógica Matemática e Ciências Cognitivas (Universidade de Siena, 2011) –
reconhecido como doutorado em Linguística e Semiótica pela USP. Seus interesses de
pesquisa incluem teoria e análise gramatical – com foco na sintaxe do português
brasileiro e demais línguas românicas –, aquisição da linguagem e relação entre teoria
230
gramatical e ensino. É tutora do PET-Letras/UFRR, coordenadora do LEGAL/PPGL-UFRR
(Laboratório de Estudos sobre Gramática e Aquisição da Linguagem) e coordenadora

do Grupo de Trabalho em Teoria da Gramática da Anpoll (Associação Nacional de Pós-
Graduação e Pesquisa em Letras e Linguística) no biênio 2018-2020.
VITOR NOBREGA é doutor em Linguística pela Universidade de São Paulo (USP). É

graduado em Letras, com habilitação em Português e Linguística, e mestre em
Linguística pela mesma Universidade. Sua investigação atual tem como foco a
emergência do léxico humano na evolução, mais notadamente a caracterização dos
possíveis precursores evolutivos envolvendo os mecanismos cognitivos subjacentes às
habilidades de manipulação de conteúdos conceituais e funcionais pela espécie humana,
bem como a atribuição de significados idiossincráticos a objetos linguísticos de variadas
extensões. Suas principais áreas de atuação são a morfologia, a sintaxe e a linguística
evolucionária, com trabalhos que se concentram na descrição e análise de aspectos
morfológicos e morfossintáticos das línguas naturais. Seus principais temas de interesse
são: derivação, composição, expressões idiomáticas, polissemia, não
composicionalidade, estrutura sintática do sintagma nominal, modificação, comunicação
animal, linguística evolucionária e biolinguística.
Notas
1
Cf, https://www.nytimes.com/2016/04/09/science/in-science-its-never-just-a-theory.html
2
Para Harris, essas restrições deveriam ser expressas em termos de probabilidade matemática. Para uma
apreciação mais detalhada do estruturalismo no modelo de Harris, ver Matthews (1986, 1999), Nevin
(2002) e Goldsmith (2002).
3
Na “Mensagem dos Tradutores”, que inicia a edição brasileira do Estruturas sintáticas (Chomsky
1957[2015]), traduzida e comentada pelos autores deste capítulo e publicada pela editora Vozes em 2015.
4
Todas as referências ao Estruturas que faremos aqui remetem à tradução brasileira (Chomsky
2015[1957]), já mencionada na nota 1. Apesar de tardia, essa edição (publicada quase 60 anos depois da
publicação original nos Estados Unidos) é a única tradução brasileira disponível. Também há outra
tradução em português, publicada em 1980 em Portugal pela Edições 70 e que saiu com o título
Estruturas sintácticas.
5
Chomsky (1994) introduz o termo “língua-E”, ou “língua externa”, para se referir ao conjunto de
enunciados de fato produzidos por uma comunidade que, uma vez registrados – por exemplo, em
gravações ou em livros –, passam a ter existência independente das representações mentais dos falantes
que os produziram. Para Chomsky, era essa a noção de língua que era o objeto de estudo da Linguística
Estruturalista (cf. Chomsky, 1994: 38 e subsequentes). Já a Linguística Gerativa teria como objeto de
estudo a língua-I, que é “um elemento que existe na mente da pessoa que conhece a língua, adquirido por
quem aprende e usado pelo falante-ouvinte” (Chomsky, 1994: 41).
231
6
Chomsky distingue transformações obrigatórias de transformações opcionais. As primeiras devem
necessariamente ser aplicadas sob o risco de a derivação não resultar numa sentença gramatical da língua
(como a transformação do pulo do afixo); as segundas podem ou não se aplicar – o resultado da derivação
continuará sendo uma sentença bem formada (como acontece com as transformações interrogativa e
passiva, por exemplo). A existência desses dois tipos de transformações é problemática do ponto de vista
da aquisição da linguagem: como uma criança teria acesso a esse tipo de informação (saber se uma
transformação é opcional ou obrigatória)? A aquisição não foi uma das preocupações de Chomsky em
Estruturas, mas tem tido papel central nos desenvolvimentos posteriores da linguística gerativa. Ver,
nesse sentido, Lightfoot (1995 e 1999), por exemplo.
7
“Núcleo”, nesse trecho, refere-se ao “núcleo da língua”, isto é, o conjunto de sentenças nucleares – as
estruturas que podem ser geradas pelas regras sintagmáticas.
8 Agradeço primeiramente aos editores deste volume pela oportunidade de fazer parte deste projeto, em
que meu texto está tão bem acompanhado de outros a ele complementares. Registro também a
importância da interlocução que tive com Maria Cristina Figueiredo Silva quando escrevíamos nossos
textos em paralelo. Finalmente, sou grato a Gabriel Othero e Sérgio Menuzzi por terem disponibilizado
seu capítulo enquanto eu escrevia o meu.
9
Chomsky (1951) já objetivava um modelo integrado de morfofonologia com um esboço de álgebra
combinatória que viria a se desenvolver no aparato sintático do modelo LSLT. Insights sofisticados sobre
a relação forma-significado já se encontravam em Chomsky (1955, caps. I & IV; 1957, cap. 9). Mas foi
apenas na fase TP(E) que a integração de todas essas interfaces veio a se materializar em propostas
explícitas de arquitetura da gramática, como comento adiante.
10
Outra abstração igualmente contrária à natureza da linguagem humana e que também a concebe como
exterior ao indivíduo advém da herança saussureana de conceber a língua como uma entidade social.
Desde suas origens até hoje, a GGT rejeita fortemente essa abordagem. As primeiras críticas mais sólidas e
contundentes nesse sentido datam da fase TP(E), precisamente a partir de Chomsky (1964), e se estendem
e se elaboram ao longo das fases subsequentes da GGT, notadamente em Chomsky (1986) e Chomsky
(2000).
11
Nesta simplificação, ignoram-se outras transformações envolvidas em (1a) e (1b), sobretudo no que
concerne a morfologia verbal, incluindo a concordância sujeito-verbo. A rigor, não é exatamente o caso
de que (1b) é gerado diretamente a partir de (1a). Haveria uma sentença nuclear mais abstrata a partir da
qual ambas seriam derivadas: algo como (i):
(i) [S [SN o gerente] [SV [V [Aux passado] [Verb demit-]] [SN o funcionário desrespeitoso]]
12
Aqui, itens lexicais compreendem não só elementos terminais como leu e livros, mas também símbolos
não-terminais como N, V, SN, SV, etc.
13
Permito-me aqui a falha em excluir dessa exposição o importantíssimo papel que exerce a noção de c-
comando nesses processos de dependência de longa distância (entre muitos outros). Faço-o devido ao
limite de espaço, e porque esse conteúdo é contemplado no capítulo seguinte.
14
A rigor, o estudo sobre pronomes teria se iniciado na TPE, com Lasnik (1976), porém com uma
abordagem que mais tarde foi substituída pelo Princípio B, pois o papel dos pronomes nos padrões que o
autor estudava revelou-se acidental. Remeto o leitor a Rizzi (2017) para uma demonstração de que esse
estudo pioneiro de Lasnik foi um dos pontos altos da TPE, trazendo generalizações empíricas e análises
preciosas; e que ele foi sobretudo uma ponte de transição fundamental para os modelos de análise
contemporâneos de cognição de linguagem que nos permitem atingir os níveis de adequação superiores.
15
A derivação em (9) é uma entre várias outras derivações possíveis que são equivalentes, no sentido de
envolverem as mesmas regras aplicadas em ordens diferentes, produzindo ao final o mesmo MS, a mesma
EP, com as mesmas relações sintagmáticas e a mesma sequência terminal de itens lexicais. Para uma
discussão mais técnica, remeto o leitor a Guimarães (2017: 153-161) e obras lá referenciadas. Quanto à
sucessão de sequências em (10), especificamente, cabe dizer que essa derivação decorre da aplicação das
seguintes regras na seguinte ordem: (8a) » (8c) » (8b’) » (8a’) » (8a) » (8c) » (8b) » (8c) » (8d).
16
Para Chomsky (1965, cap. 2), inserções lexicais não seriam regras sintagmáticas puras, mas
transformações locais, que consideram o contexto de aparição de um vocábulo relativamente aos
vocábulos vizinhos. É daí que derivariam os graus de gramaticalidade, fruto de pequenos desvios dos
requerimentos canônicos de compatibilidade semântica entre os vocábulos combinados.
17
Diz-se que (16a) veicula uma informação sobre o gerente: ele demitiu o funcionário (desrespeitoso); ao
passo que (16b) veicula informação sobre o funcionário: o gerente o demitiu. Isso é um fato a ser tratado
pela teoria linguística geral, mas não é óbvio que diga respeito à sintaxe, e talvez nem à semântica, pois as
‘condições de verdade/falsidade’ são as mesmas para (16a) e (16b). Trata-se de um contraste de ‘ponto de
vista’ no âmbito do conteúdo informacional, mais provavelmente relativo à competência pragmática que
232
interpreta as representações semânticas de (16a) e (16b), de algum modo tomando o sujeito da ES como o
tópico default.
18
Agradeço a leitura atenta e aos comentários de alguém que não quer ter seu nome revelado e às
inúmeras conversas com Maximiliano Guimarães sobre este e outros temas. Agradeço ainda, além da
leitura atenta e dos comentários, a paciência infinita dos editores deste livro. Os erros remanescentes são,
é claro, de minha responsabilidade.
19
Knowledge of Language recebeu uma tradução portuguesa, intitulada O conhecimento da língua: sua
natureza, origem e uso, feita por Anabela Gonçalves e Ana Teresa Alves, sob a coordenação de Inês
Duarte, que também escreve um prefácio à edição, publicada pela Editora Caminho em 1994.
20
Esta seção acompanha de perto a discussão conduzida na seção 2.1 do artigo publicado por mim na
Revista LinguíStica da UFRJ, em número especial de comemoração aos 60 anos de publicação do livro
Syntactic Structures, em 2017 – disponível em https://revistas.ufrj.br/index.php/rl/article/view/13510.
21
O Teorema de PRO diz que esta categoria vazia não pode ser regida porque, caso o seja, existirá uma
categoria de regência para ela, e então teríamos uma contradição a resolver: como elemento [+anafórico],
PRO teria que ser ligado na sua categoria de regência, mas como elemento [+pronominal], teria que ser
livre nesse mesmo domínio. A única forma de escapar dessa contradição é não ter categoria de regência.
23
Esta seção se baseia na discussão presente no texto de Mioto e Figueiredo Silva (2007), publicado na
Revista DELTA.
24
Lembremos que a Teoria do Caso tem como princípio fundamental a exigência de que todos os
sintagmas nominais lexicalmente realizados recebam um Caso abstrato, que pode tanto ser um Caso
estrutural (como o Nominativo, o Acusativo ou o Oblíquo) quanto um Caso inerente (como o Genitivo,
por exemplo). Sentenças que contenham DPs com matriz fonética mas sem Caso são excluídas.
25
A definição clássica da Condição de Subjacência, segundo Mioto et al. (2013: 255) reza que o
movimento A-barra não pode atravessar mais de uma barreira por ciclo, onde barreiras são DPs e CPs (e
talvez IPs em algumas línguas).
26
O Princípio das Categorias Vazias (Empty Category Principle, ou ECP) é responsável pela distribuição
de categorias vazias não pronominais, exigindo que elas sejam apropriadamente regidas, isto é, regidas
pelo núcleo que lhes atribui papel temático ou regidas por antecedência.
27
O Princípio de Projeção garante que as propriedades de seleção de um dado núcleo sejam mantidas em
todos os níveis de representação.
28
Chamamos de pré-minimalistas os modelos da empreitada gerativista anteriores a Chomsky (1995).
29
Discussões mais detalhadas sobre a mudança de um modelo de Regência e Ligação para um modelo
minimalista podem ser encontradas em diversos trabalhos, tais como Ouhalla (1999), Kato (2002),
Bošković, (2013), Carvalho, Cerqueira, Mariano (2017), entre muitos outros.
32
Para uma discussão sobre o caráter primitivo dos traços no modelo minimalista, ver Carvalho (2012,
2017c, 2018).
33
Desenvolvimentos recentes do modelo minimalista consideram que pessoa, número e gênero são
apenas rótulos de categorias maiores formadas por traços mais específicos essenciais para a computação
sintática (cf. Harley e Ritter, 2002, Béjar, 2003, Carvalho, 2008, 2017a, 2017b, 2018).
34
Quando utiliza o termo “mente”, Chomsky está querendo fazer referência ao cérebro, considerando-o
de um modo mais abstrato. A esse respeito, ver Chomsky (2000, p. 50) e Chomsky (2016: 5).
35
Na verdade, na apresentação da regra (12b), o símbolo referente à oração encaixada deveria ser S’ que é
a expansão de S (uma sentença), por meio de sua combinação com o complementador que.
36
Princípio adaptado de Carnie (2006: 225). Esse princípio foi reformulado pela teoria gerativa para o
Princípio de Projeção Estendida?, que postula que as estruturas sintáticas são a projeção da estrutura
temática e de subcategorização dos predicadores, isto é, dos verbos, e que a posição de sujeito é
obrigatória.
37
Intensão é o conceito contido numa expressão linguística e opõe-se à extensão que se refere a um
conjunto de entidades no mundo.
38
Medidas off-line capturam a fase final do processamento ou o seu resultado, após o processamento
ocorrer. Por exemplo, uma tarefa de julgamento de gramaticalidade de frases coleta avaliações sobre as
frases, após as mesmas serem lidas ou ouvidas. Se, além dos índices de decisão, forem computados os
tempos médios de julgamento, a medida off-line é dita cronométrica. Uma medida on-line, por outro lado,
procura capturar o processamento durante a sua ocorrência. Por exemplo, no rastreamento ocular, obtêm-
se dados relativos aos tempos de fixação e aos movimentos oculares progressivos e regressivos durante o
processo da leitura.
39
Em metodologia científica, há dois tipos de erro. O erro do tipo I, conhecido como falso positivo,
ocorre quando se rejeita uma hipótese nula que é verdadeira. O erro do tipo II, conhecido como falso
negativo, ocorre quando se aceita uma hipótese nula que é falsa.
233
40
“A discussão desses temas tem sido frequentemente obscurecida na literatura pela falência em se
distinguir a competência do desempenho; De modo amplo, seria distinguir o que nós sabemos do que nós
fazemos. O desempenho envolve muitos fatores, a competência sendo apenas um. A distinção é
contestada, mas desnecessariamente” (Chomsky, 2015: 95).
41
Chomsky (1957) propõe a ideia de que um conjunto de estruturas simples irredutíveis seria produzido
pelas regras de estrutura frasal da gramática. O resultado da aplicação dessas regras seriam sequências
nucleares (kernel strings) sobre as quais se aplicariam regras transformacionais que seriam, então,
etiquetadas (tags) – veja o capítulo “Estruturas Sintáticas e a reinvenção da teoria linguística”, neste
volume.
42
Poder-se-ia reexaminar tanto as teorias gerativas sob avaliação pelos experimentos do DTC quanto os
próprios experimentos para ver se os experimentos de fato desconfirmaram as teorias e se as teorias
estavam bem motivadas por outros dados. Mas, deixando de lado a história, os linguistas realmente não
têm escolha senão abraçar a teoria derivacional da complexidade, já que ela é essencialmente apenas um
nome para a metodologia padrão na ciência cognitiva e na Neurociência cognitiva. Todas as outras coisas
sendo iguais, quanto mais complexa for uma representação – quanto mais longas e complexas forem as
computações linguísticas necessárias para gerar a representação – mais tempo deve levar para um sujeito
realizar qualquer tarefa que envolva a representação e mais atividade deve ser observada no cérebro do
sujeito em áreas associadas à criação ou acesso à representação e à execução da tarefa (Marantz, 2005:
439).
43
Isto permanece inteiramente padrão em psicolinguística, e é uma presunção central de muitos trabalhos
na área da Neurociência coggnitiva da linguagem, especialmente dos estudos usando fMRI.
This remains entirely standard in psycholinguistics, and is a core assumption of much work in the
cognitive neuroscience of language, especially studies using fMRI. (Phillips, 2012).
44
Discutindo a falta de confiabilidade dos métodos de julgamento de gramaticalidade informais, Cowart
cunha o termo “Hey Sally”, para referir-se ao uso de intuições do próprio linguista ou de alguém que
encontra casualmente (cf. Cowart, 1997: 2).
45
Um terceiro estudo, que não revisamos aqui por limitação de espaço, encontra evidências de
recursividade em construções de controle obrigatório em Pirahã (cf. Rodrigues, Salles e Sândalo, 2018).
46
Adaptado de Chomsky (2015: 46): Instinctively, eagles that fly swim.
47
Doença crônica provocada por uma disfunção da glândula pituitária e que se caracteriza pelo
crescimento anormal das extremidades do corpo (mãos, pés, rosto); moléstia de Marie.
48
Em 1909, o alemão Korbinian Brodmann publicou um mapa citoarquitetônico do cérebro que é
frequentemente chamado de “numeração de Brodmann” demarcando diferentes tecidos histológicos e
nesse mapa, a área de Broca recebeu os números 44 a 45, respectivamente para a “seção opercular” e
“seção triangular” da área de Broca.
49
Tenetehára é uma língua indígena brasileira, pertencente à família Tupi-Guarani, e falada pelos Tembé
do Maranhão e do Pará e pelos Guajajara do Maranhão, totalizando cerca de 7000 falantes.
50
A ativação neuronal leva a um aumento no consumo de ATP (adenosina trifosfato), o que implica um
aumento na demanda por glicose e oxigênio. Para suprir a necessidade desses substratos básicos, ocorre
uma elevação do nível de perfusão sanguínea local. Isso quer dizer que um aumento localizado de
atividade neuronal leva a um aumento local no volume e no fluxo de sangue.
51
Adaptação diz respeito a um determinado caractere que evoluiu como resposta a um problema
socioecológico.
52
Essa premissa parte da hipótese de que a formação de módulos implica um alto grau de complexidade.
Sendo assim, dado que a FL corresponde hipoteticamente a um caractere recente, a assunção de módulos
não seria biologicamente plausível em um curto intervalo de tempo, o que nos leva a reconsiderar sua
organização interna. Como destaca Fodor (1998: 210), módulos contêm informações altamente
especializadas, destinadas a resolver problemas específicos. Tal grau de elaboração exige, em termos
adaptativos, um tempo considerável para sua fixação, o que contradiz os fatos observados até o
momento sobre o desenvolvimento da competência linguística.
53
Exaptação diz respeito a uma adaptação biológica recrutada para desempenhar funções distintas
daquelas de sua origem (Gould e Vrba, 1982). Por exemplo, as penas das aves surgiram originalmente
para agir como isolamento térmico, tendo sido exaptadas, posteriormente, para o voo.
54
Descobertas recentes nos indicam que o Homo neanderthalensis, ou seja, os neandertais, estavam
produzindo artefatos simbólicos em diferentes sítios arqueológicos do continente europeu em datas
paralelas àquelas associadas aos materiais simbólicos produzidos pelos sapiens no sul da África. Há
evidências de que os neandertais foram os primeiros artistas a produzirem pinturas rupestres, um
registro material explicitamente simbólico. Isso nos leva a presumir que os neandertais eram igualmente
dotados de uma consciência simbólica (Hoffmann, Standish et al., 2018; Hoffmann, Angelucci et al.,
234
2018) e, por consequência, presumivelmente dotados das bases para se desenvolver uma competência
linguística. Esses novos desdobramentos terão um impacto significativo nessa área de investigação nos
próximos anos.
55
Seu último livro publicado em linguística, até o fechamento deste nosso livro, foi Por que apenas nós?
Linguagem e evolução, em coautoria com Robert C. Berwick, em 2015, e traduzido para o português em
2017 (cf. Berwick e Chomsky, 2017). Além dele, Chomsky publicou, desde 2015, outros três títulos (que
já contam com tradução para o português), cf. Chomsky (2017a, b, 2018b), além de ter ministrado
inúmeras palestras, inclusive no Brasil (talvez a mais recente no Colóquio ForMA, na Unicamp, em
2018).
235

Chomsky e A Reinvenção Da Linguística

Enviado por

Direitos autorais:

Formatos disponíveis

Chomsky e A Reinvenção Da Linguística

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Chomsky e A Reinvenção Da Linguística

Enviado por

Direitos autorais:

Formatos disponíveis

Chomsky: a reinvenção da Linguística

Gabriel de Ávila Othero

Ao fim desta segunda década do século XXI, Noam Chomsky é considerado o

Finalmente, nós, organizadores, assinamos um capítulo de fechamento, em que

A ciência e os 7 erros do senso comum

Frequentemente, ao apresentar as pressuposições e as hipóteses teóricas de seu

em ciência, a palavra teoria não se aplica de maneira leve, não significando

O filósofo da ciência, Karl Popper, por vez, oferece a seguinte definição:

As teorias são redes, lançadas para capturar aquilo que

A definição dada por Popper enfatiza a contribuição da capacidade humana de

Observação empírica ⇔ Generalização/Fenômeno ⇔ Hipótese ⇔ Teoria

A observação dessa hierarquia é igualmente importante também para entendermos

En aquel Imperio, el Arte de la Cartografía logró tal Perfección que el Mapa

O que Jorge Luis Borges capturou sensivelmente em versos é a não utilidade

O surgimento de um novo paradigma científico nos estudos da linguagem

Em meados do século XX, questões que atualmente são atreladas a funções

(1) a. Toda manteiga derrete a 150 graus.

(2) a. Todas os anéis que eu estava usando na festa eram de prata.

(4) a. A bandeira do flamengo é vermelha e preta.

Repare que essa argumentação é também evidência contra a visão estruturalista

(5) a. John is easy to please

John é entendido como o objeto de please em (5a) e como o sujeito em (5b). Se

Os rumos da Gerativa: expansão de domínios de investigação

Uma maneira de medir a produtividade de um programa de pesquisa é

Gabriel de Ávila Othero

Na edição de 2002 de Estruturas sintáticas, David Lightfoot inicia a

Sua pesquisa [no Laboratório de Pesquisas Eletrônicas do MIT] não era

O livro teve imediata repercussão, muito graças a uma resenha influente de

O trabalho de Chomsky era inovador e apresentava uma Linguística muito

Minha introdução formal no campo da linguística foi em 1947, quando Zellig

Chomsky tinha um sólido background em filologia (especialmente por

O que é uma gramática

No breve prefácio do Estruturas, já encontramos uma advertência importante,

Este estudo trata da estrutura sintática tanto em sentido lato (oposto à

Ao contrário do que muitos estruturalistas defendiam, Chomsky não acreditava

(1) O Pedro sabe por que o João estava chorando?

[o] objetivo fundamental na análise linguística de uma língua L é separar as

Surge então um novo “método” de investigação linguística: o julgamento

Meu trabalho Estruturas sintáticas (Chomsky, 1957) começa com

Em Estruturas sintáticas, Chomsky menciona como exemplo de modelo

Obviamente, a introdução do segundo elemento de um conector descontínuo

[d]esenvolveremos um terceiro modelo, transformacional, para a estrutura

Ou seja, essa transformação permite gerar de modo correto sequências de

posiciona os afixos nas formas verbais na superfície da frase. [...] o efeito da

Esse procedimento derivacional envolvendo transformações (opcionais e

É importante observar que a gramática é significativamente simplificada

todas as sentenças da língua ou pertencerão ao núcleo da língua, ou serão

Explorando questões fundacionais

Seguindo o Estruturas, encontramos, no capítulo 6, uma espécie de “parênteses

Ao tentar desenvolver procedimentos de descoberta de gramáticas, somos

A proposta de Chomsky é mais modesta – mas é a que veio a prevalecer a partir

[...] acredito que seja completamente insustentável a ideia de que a teoria

Chomsky retorna às transformações do inglês no capítulo 7, com o objetivo

Nosso objetivo é limitar o núcleo de tal forma que as sequências terminais

Chomsky segue o capítulo 7 discutindo uma série impressionante de

Acho que o propósito desta tradução é sacudir a poeira porventura acumulada

O capítulo 8 de Estruturas é um capítulo curto, em que Chomsky procura

O que estamos sugerindo é que aquilo que chamamos de “compreender uma

Parece claro, então, que existem correspondências inegáveis, ainda que

(6a) { [o aluno]1 disse { que [o professor]2 criticou a [si próprio]2/1/3 }}