projeto de pesquisaecaths1.s3.amazonaws.com/seminariosdeaquisicao/256540668... · web viewprojeto...
TRANSCRIPT
UNIVERSIDADE FEDERAL DA PARAÍBACENTRO DE CIÊNCIAS HUMANAS, LETRAS E ARTES
PROGRAMA DE PÓS-GRADUAÇÃO EM LINGUÍSTICA - PROLING
PROJETO DE PESQUISA
PROCESSAMENTO, AQUISIÇÃO E REPRESENTAÇÃO LEXICAL DE FORMAS MORFOLOGICAMENTE COMPLEXAS
EM PORTUGUÊS BRASILEIRO
Professor Responsável: José Ferrari NetoProfessor Doutor Adjunto I de Linguística e Língua Portuguesa
João Pessoa, 1º semestre de 2010
PROJETO DE PESQUISA
PROCESSAMENTO, AQUISIÇÃO E REPRESENTAÇÃO LEXICAL DE FORMAS MORFOLOGICAMENTE COMPLEXAS
EM PORTUGUÊS BRASILEIRO
2
SUMÁRIO
Dados do projeto................................................................................................................4
Projeto................................................................................................................................6
1. Introdução......................................................................................................................6
2. Justificativa..................................................................................................................10
3. Referenciais teóricos...................................................................................................13
4. Referenciais experimentais..........................................................................................37
5. Objetivos......................................................................................................................39
5.1. Objetivo geral...........................................................................................................39
5.2. Objetivos específicos................................................................................................40
6. Metodologia.................................................................................................................41
7. Cronograma.................................................................................................................45
8. Bibliografia..................................................................................................................46
9. Resultados esperados...................................................................................................49
10. Cronograma Financeiro.............................................................................................51
3
DADOS DO PROJETO
I. Professor responsável
José Ferrari NetoProfessor Adjunto I de Linguística e Língua PortuguesaMatrícula SIAPE: 1572304Curriculum Lattes: http://lattes.cnpq.br/7211922429806274 (anexo)
II. Professores envolvidos
José Ferrari Neto (LAPROL/UFPB)Márcio Martins Leitão (LAPROL/UFPB)
III. Título
Processamento, Aquisição e Representação Lexical de Formas Morfologicamente Complexas em Português Brasileiro.
IV. Área
Teoria e Análise Linguística.
V. Linha de pesquisa
Aquisição da Linguagem e Processamento Linguístico
VI. Descrição
Este projeto visa caracterizar aspectos da competência lexical de falantes adultos e de crianças em fase de aquisição inicial do Português Brasileiro (PB). Por competência lexical entende-se o conhecimento que um falante possui sobre o léxico de sua língua. Essa competência compreende o conhecimento de uma lista de itens lexicais e das relações entre eles, o conhecimento de sua estrutura interna e o conhecimento subjacente à capacidade de formar novos itens, rejeitar formações lexicais agramaticais e ainda de processar esses itens, reconhecendo seus elementos constituintes e sua estrutura interna. O presente projeto assume que uma caracterização adequada da competência lexical de um falante de PB requer a análise de aspectos ligados à Morfologia dessa língua, especialmente no que se refere à organização e à caracterização da componente morfológica da gramática e da sua relação com sistemas de processamento lingüístico. Dentre os aspectos da competência lexical que merecem ser investigados citam-se os concernentes ao léxico, sua caracterização e seu lugar em modelos de língua e de processamento lingüístico, a organização e representação dos itens lexicais nele armazenados, o modo como se dá o acesso a eles, a descrição dos mecanismos gramaticais que permitem a formação de novos itens, além do desenvolvimento e aquisição desses mecanismos por um falante de PB. Para proceder a essa investigação, o projeto ora apresentado pretende analisar como se dá o processamento, a aquisição e a representação lexical de formas morfologicamente complexas, em especial aquelas que são produto do mecanismo gramatical de derivação
4
morfológica, em seus vários tipos, e produto de flexão morfossintática, como gênero e número.
Uma vez que a investigação aqui sugerida tem por objetivo pesquisar questões relativas ao processamento lingüístico, representação lexical e aquisição da linguagem, é necessário que se adotem teorias respectivas a essa áreas, as quais são formuladas no âmbito da Psicolinguística Experimental e Desenvolvimental, quanto no âmbito da Teoria Linguística gerativista. Assim, deseja-se conduzir a investigação aqui proposta à luz do modelo teórico da Morfologia Distribuída (Halle & Marantz, 1993, 1994; Harley & Noyer, 1999), buscando a articulação dessas teorias linguísticas com modelos psicolinguísticos de acesso e representação lexical, em especial os de Levelt (1994), Bock & Levelt (1994) e Levelt et al. (2001).
O esforço para se promover tal articulação justifica-se pelo fato de que questões ligadas à competência linguística, em geral, e da competência lexical, em particular, serem mais bem descritas, analisadas e compreendidas quando se consideram fatores concernentes à determinação e caracterização das unidades processáveis, o que estaria no domínio da Linguística, e à descrição da maneira como elas são identificadas, o que é responsabilidade da Psicolinguística. Em termos mais específicos, trata-se de evidenciar como o aparato processador (definido como o aparato cognitivo que implementa o processamento lingüístico), objeto dos modelos de processamento, é informado por uma gramática (concebida como um modelo teórico do conhecimento lingüístico de um falante), objeto de uma teoria de língua. Essa integração já vem sendo tentada no estudo da compreensão/produção de estruturas sintáticas, na forma esboçada no Modelo Integrado de Competência Linguística (Corrêa & Augusto, 2007) e no estudo dos erros de produção linguística (speech errors) conduzido por Pfau (2009), sendo que um dos objetivos gerais deste projeto é o de delinear a mesma integração, desta vez dedicada ao estudo da competência lexical das relações entre léxico, gramática e processamento.
Lançando mão de análise de dados de produção e de técnicas experimentais on-line e off-line específicas para a determinação das capacidades procedimentais de adultos e de crianças, pretende-se caracterizar a competência lexical de crianças e adultos falantes de PB, o que os permitiria decompor morfologicamente palavras derivadas e flexionadas, reconhecendo seus elementos mórficos constituintes, representando-os no léxico mental e acessando-os quando da produção, compreensão e criação de novos itens lexicais. Com isso, objetiva-se lançar alguma luz em questões como (i) até que ponto os mecanismos de derivação/flexão propostos pela Morfologia Distribuída e pela teoria linguística gerativista e aplicados à descrição da gramática do PB dão conta de questões referentes à produção/compreensão/formação lexical nessa língua ? (ii) como se dá a organização do léxico, isto é, como se acham nele representados e relacionados os morfemas e as palavras morfologicamente complexas, tanto do ponto de vista de um modelo de língua quanto de um modelo de processamento ? (iii) como articular uma concepção de léxico, inserida em um modelo formal de língua, com o léxico mental, caracterizado sob a ótica de teorias psicolinguísticas, no estudo de questões ligadas à competência lexical e sua aquisição ? Os experimentos a serem formulados e conduzidos serão aplicados com input oral e escrito em falantes de PB, de modo a reunir evidências empíricas a partir dos quais pretende-se elaborar uma teoria integrada da competência linguística voltada para questões concernentes à aquisição, desenvolvimento e uso da competência lexical.
5
PROJETO
1. Introdução
O presente projeto coloca-se na intersecção das linhas de pesquisa sobre a
componente morfológica da gramática das línguas humanas, em especial no que se
refere à constituição do léxico e de seus mecanismos internos, e sobre a relação dessa
componente com a questão do processamento lingüístico e da aquisição da linguagem,
no que tange aos seus aspectos lexicais. Assume-se, por diretiva geral, a crença na
possibilidade de uma aproximação entre as discussões empreendidas no âmbito da
teoria Linguística gerativista, sobretudo a que se concentra na definição do papel do
léxico na derivação de sentenças, e as pesquisas levadas a termo no campo das teorias
do processamento lingüístico, no que toca à construção de modelos de representação e
acesso lexical, desenvolvidas a partir de resultados experimentais sobre processamento
morfológico. Busca-se, com efeito, elaborar um modelo teórico da competência lexical
que articule teoria linguística e teoria psicolinguística, articulação essa tomada como
crucial para um bom entendimento de questões sobre a linguagem humana.
1.1. A questão da intersecção entre Linguística e Psicolinguística no estudo do léxico:
Léxico é o componente da gramática que contém todas as informações –
fonológicas, morfológicas, semânticas e sintáticas – que os falantes sabem sobre
palavras simples e/ou morfemas. Do ponto de vista psicolingüístico, é denominado
léxico mental e corresponde a um repositório de conhecimentos declarativos sobre as
palavras de uma língua. Estes conhecimentos podem ser de natureza fonológica,
semântica, morfológica e sintática, podendo também haver conhecimentos pragmáticos
e estilísticos sobre os itens lexicais. Do ponto de vista lingüístico, o léxico é uma lista de
elementos que são usados na formulação de sentenças. Consiste num conjunto de
informações acerca dos itens lexicais que são acessados e manipulados pela gramática.
Na teoria gerativa, tradicionalmente, o léxico é o repositório de “exceções”, isto é, das
propriedades idiossincráticas dos itens lexicais. (O léxico é tudo aquilo que não pode ser
gerado por regras).
6
As pesquisas em Linguística teórica e Psicolinguística nas últimas décadas
mostraram que o sistema de armazenamento e recuperação de itens lexicais é
extremamente complexo. Um grande número de questões permanece em aberto. Estas
questões dizem respeito à identificação das unidades que servem como entradas no
léxico mental, à sua organização interna, aos mecanismos de formação de palavras e aos
diferentes modos de acesso às representações lexicais na compreensão e produção de
sentenças e palavras.
Estudos sobre o processamento de palavras morfologicamente complexas em
modelos lingüísticos e psicolingüísticos têm se mostrado freqüentes e relevantes. Estes
estudos não cuidam da manifestação de palavras derivadas ou flexionadas em uma
cadeia de fala e/ou escrita, ou do seu reconhecimento nesses mesmos contextos, mas
sim do modo como podem ter sua estrutura concebida por um modelo internalizado de
língua (no sistema computacional responsável pela geração de enunciados lingüísticos)
e do modo como são processadas, representadas e acessadas em um modelo de léxico
mental. O primeiro caso está na esfera da Teoria Linguística e o segundo na área de
interesse da Psicolinguística.
Durante a década de 70, observou-se um progressivo afastamento entre as
propostas teóricas advindas destas duas áreas, após um período de relativa proximidade
(década de 1960), com a Psicolinguística se aproximando mais da Psicologia Cognitiva
e Inteligência Artificial, de modo que as questões sobre o papel da gramática da língua
no processamento forma ignoradas. Em outras palavras, a pesquisa psicolinguística
sobre acesso e representação abriu mão de um modelo teórico de língua, do que
resultaram modelos que não levavam em conta propriedades específicas das línguas
humanas. Tem-se, portanto, durante as décadas de 1970 e 1980 um ambiente no qual a
Psicolinguística, com seus modelos de representação e acesso lexical, ignora quase que
totalmente as diferentes propostas sobre estrutura e organização do léxico vindas da
Gramática Gerativa. Dentro desse quadro, é preciso lembrar que os primeiros modelos
de estruturação do léxico propostos sob uma perspectiva gerativista, como os de Halle
(1973), Jackendoff (1975) e Aronoff (1976), os quais se seguiram ao impulso causado
7
pela formulação da Hipótese Lexicalista1 (Chomsky, 1970), datam da fase em que
ambas as áreas encontravam-se afastadas, o que explica por que a teoria
psicolinguística, ao tratar das questões concernentes ao léxico, não leva em conta as
informações advindas da pesquisa linguística sobre a estrutura morfológica e a
organização e papel do léxico. Pelas mesmas razões, os modelos de léxico sugeridos
pela Linguística não observaram fatores ligados à memória e aos sistemas perceptuais
durante sua elaboração.
Mais recentemente, todavia, os dois campos do saber vêm tendendo a uma
reaproximação: questões ligadas ao processamento já começam a ter uma presença mais
significativa na teoria linguística. Essa reaproximação se tornou possível uma vez que o
modelo de língua defendido pelo Programa Minimalista (Chomsky, 1995), versão mais
recente da teoria linguística gerativista, defende que o produto de uma derivação
lingüística procede de uma articulação entre o sistema da língua e os denominados
sistemas de desempenho (sistemas conceptuais-intencionais, de um lado, e
articulatórios-perceptuais, de outro), os quais são levados e conta pela Psicolinguística
na formulação de modelos de processamento linguístico. Vê-se que a idéia que subjaz
ao Programa Minimalista é a de que a forma da gramática das línguas humanas é função
das restrições impostas pelos sistemas com os quais interage, uma idéia de há muito
aventada pela Psicolingüística (cf. Corrêa, 2005a). Em consequência, modelos têm sido
propostos com vistas a promover uma conciliação entre teoria linguística e teoria
psicolinguística no tratamento de questões ligadas ao processamento, aquisição e déficit
de linguagem (Corrêa, 2005a, 2005b, 2005c, 2006), e à integração das derivações de
sentenças nos moldes minimalistas em modelos de processamento, como é o caso do
Modelo Integrado de Competência Linguística (Corrêa & Augusto, 2007), além dos
problemas concernentes à relação entre gramática e parser (processador sintático)
conhecidos como linking problems (Phillips, 2003).
1 De acordo com Anderson (1982) “A essência da Hipótese Lexicalista e da maioria dos mais recentes trabalhos em sintaxe se baseia na hipótese de que a estrutura interna das palavras não é estabelecida por princípios sintáticos, nem mesmo acessível a esses princípios. [...] Do ponto de vista da sintaxe, as estruturas produzidas no léxico são essencialmente opacas: elas podem ter estrutura interna, mas essa estrutura não está sujeita à manipulação ou competência das regras de sintaxe, que tratam os itens lexicais como unidades integrais, atômicas. A essência da Hipótese Lexicalista, sob esse aspecto, está representada pela separação entre os componentes sintáticos e lexicais.”. Foi a partir do advento dessa hipótese que foi dado um grande impulso às pesquisas sobre o léxico e sobre a morfologia sob uma perspectiva gerativista.
8
No que se refere às questões ligadas ao léxico, no entanto, tal integração tem
sido mais timidamente. Os modelos de processamento morfológico e de
representação/acesso lexical propostos no âmbito da Psicolinguística são conduzidos em
grande medida dissociados de considerações sobre o modo como ocorrem as derivações
linguísticas sugerido pela Linguística. Por seu turno, modelos de léxico e descrição da
organização e funcionamento da componente morfológica da gramática são construídos
sem se considerar questões relativas à sua interface com sistemas perceptuais e de
memória. Dito de outro modo, as teorias lexicais da Linguística são conduzidas em um
nível de abstração que impede, em grande medida, a verificação empírica da realidade
psicológica de suas operações, ao passo que, do lado da Psicolinguística, o oposto é o
que se observa, com modelos sendo propostos tendo em vista apenas à explicação do
funcionamento dos sistemas de processamento, desconsiderando o papel da gramática,
enquanto modelo cognitivo de língua, no processo.
Um exemplo dessa dissociação pode ser vislumbrado ao se analisar o modelo da
componente morfológica da gramática conhecido como Morfologia Distribuída (Halle
& Marantz, 1993, 1994; Harley & Noyer, 1999). Esse modelo teórico apresenta o léxico
dentro de uma concepção formal de língua, contendo tão somente as informações
necessárias para a caracterização dos itens nele armazenados, em termos de suas
propriedades fonológicas, semânticas e formais, tornando possível, dessa forma,
determinar o modo como são usados nas operações de computação sintática necessárias
para a derivação linguística. O léxico, assim concebido, igualmente permite avaliar a
contribuição da semântica lexical para a interpretação de uma expressão linguística e
dar conta de processos fonológicos decorrentes da combinação entre esses elementos
numa expressão linguística. Por outro lado, teorias sobre o léxico mental esboçadas pela
Psicolinguística são concebidas de forma a tornar possível explicar fenômenos
pertinentes ao acesso e representação lexical, tais como priming fonológico e semântico
(efeitos de facilitação ocasionados pela frequência de uma dada forma fônica ou de um
dado sentido), falhas na recuperação da forma fônica ou do significado (agrupados sob o
nome de slip/tip-of-the-tongue phenomena, ou lapsos de língua), além de anomias e
agnosias verificadas em certos casos de afasia. Em um e outro caso, os critérios de
adequação empírica coligidos para a verificação da confiabilidade dos modelos são
9
distintos – o compromisso da Morfologia Distribuída é com a derivação das sentenças, e
somente com essa, enquanto as teorias de léxico mental comprometem-se com sistemas
conceptuais/perceptuais e de memória. Portanto, caso se buscasse, de fato, uma
articulação entre Linguística e Psicolinguística no estudo do léxico, um modelo como o
da Morfologia Distribuída teria de ser formulado com vistas a dar conta dos fenômenos
de acesso e representação lexical como os citados acima, bem como os modelos de
léxico mental teriam de ser capazes de explicar como se dá a sua relação com a
gramática da língua na produção/compreensão de enunciados lingüísticos e ainda no
processo de aquisição de linguagem.
Conforme apontam Corrêa & Augusto (2006), trata-se de uma questão empírica
saber se as propriedades definidas no léxico tal como concebido por um modelo formal
de língua (como é o caso da Morfologia Distribuída) possuem “realidade psicológica”,
isto é, se podem ser caracterizadas em termos de operações mentais conduzidas on-line,
sendo assim necessárias para a explicitação dos processos pertinentes ao acesso e
representação lexical, nos termos sugeridos pelos modelos de léxico mental. Infere-se
daí que, caso se deseje verificar até que ponto é possível considerar até que ponto uma
teoria do léxico proposta por um modelo formal de língua, como a da Morfologia
Distribuída, pode ser articulada com modelos de léxico mental sugeridos no âmbito da
Psicolinguística, é necessário aplicar procedimentos experimentais que objetivem
fornecer evidências empíricas sobre a viabilidade de uma tal articulação. É o que vem
sendo tentado em trabalhos recentes que objetivam prover essas evidências empíricas
por meio do estudo do mapeamento da atividade cerebral (França et al. 2008). O
presente projeto aposta nessa viabilidade ao investigar o processamento e a
representação lexical de palavras morfologicamente complexas, bem como a sua
aquisição.
2. Justificativa
A Psicolinguística, desde a sua consolidação como disciplina científica, em
meados da década de 1960, vem dividindo seus interesses em duas subáreas. A primeira
delas, denominada Psicolinguística Experimental, fixa como objetivos centrais a
identificação e caracterização dos processos mentais que subjazem à produção e
compreensão das frases em uma língua por um falante. Para tanto, ela recorre a diversas
técnicas experimentais, on-line e off-line, tais como a leitura automonitorada (self-paced
10
reading), a audição automonitorada (self-paced listening), a ativação e reativação de
itens (priming), o rastreamento ocular (eye-tracking), o julgamento imediato de
gramaticalidade (speeded grammaticality judgment task).2 Essas técnicas são capazes de
prover insights sobre a dinâmica do processo de produção e compreensão de sentenças,
permitindo, assim a testagem de hipóteses sobre as capacidades procedimentais de
adultos falantes de uma dada língua e levando, dessa forma, ao refinamento de modelos
teóricos do processamento linguístico. A segunda subárea, denominada Psicolinguística
Desenvolvimental, concentra-se no estudo do processo de aquisição e desenvolvimento
da linguagem. Aqui, há também o recurso a técnicas experimentais, como a fixação do
olhar, a escuta preferencial, a tarefa de seleção de imagens, etc.3 O objetivo é o de
determinar as habilidades precoces de processamento linguístico, tomadas como
fundamentais para o reconhecimento e extração de informações relevantes sobre a
língua em aquisição.
Por seu turno, a teoria linguística, notadamente a de orientação gerativista, vem
igualmente se dedicando à construção de modelos teóricos da competência linguística,
definida como o conhecimento internalizado que um falante possui sobre sua própria
língua, além de procurar caracterizar as propriedades gerais e universais que subjazem à
faculdade humana de linguagem. No que diz respeito à aquisição de linguagem, essa
desde os primórdios do gerativismo é considerada uma questão fundamental, a qual
orienta até mesmo a construção global da teoria. Assim, Linguística e Psicolinguística
estão de há muito comprometidas com os processos de produção, compreensão e
aquisição de linguagem, ainda que sigam os seus modos próprios de teorização e
verificação empírica.
No Brasil, tanto a Psicolinguística Experimental quanto a Desenvolvimental são
campos de investigação científica em franca expansão, a despeito das dificuldades que a
pesquisa nesses campos impõe. Desnecessário fazer comentários desse teor em relação
à Linguística gerativista, hoje um campo bastante consolidado no universo de pesquisa
acadêmica em nosso país. O que se procura destacar aqui é que a tendência, já
anteriormente citada, de uma convergência entre Linguística e Psicolinguística
2 Para uma revisão sobre métodos em Psicolinguística Experimental, ver Mitchell, 2004 e Maia & Finger, 2005.3 Para uma revisão sobre métodos em Psicolinguística Desenvolvimental, ver Sekerina et al., 2008 e Name & Corrêa, 2006.
11
encontra-se em um momento bastante favorável no Brasil, com vários centros de
pesquisa atuando na direção de conciliar teoria de língua e teoria de processamento no
estudo de aspectos da derivação e processamento lingüísticos. Nesse contexto, podem
ser citadas as pesquisas sobre a interface Linguística/Neurolinguística realizadas no
CLIPSEN-UFRJ4, a construção de um modelo integrado da aquisição, produção e
processamento linguístico do LAPAL-PUC/RJ5, e os estudos sobre o processamento de
frases levados a cabo no LAPEX-UFRJ6. O presente projeto pretende, por sua vez,
contribuir com a investigação sobre o processamento da linguagem feito no LAPROL-
UFPB7, estendendo o campo de atuação desse laboratório para questões de aquisição e
processamento lexical. Esse projeto fica, portanto, justificado, em primeiro lugar, tendo
em vista o momento de ebulição por que passa essa área de investigação científica no
ambiente acadêmico brasileiro.
Em segundo lugar, esse projeto justifica-se ao se observar uma certa carência de
pesquisas sobre a aquisição da morfologia em PB. No que toca á morfologia flexional,
podem ser apontados trabalhos focados na questão da morfologia verbal, como o de
Scliar-Cabral & MacWhinney (2008) e o de Lorandi & Lamprecht (2008), além do
estudo sobre a flexão de número conduzido por Gomes & Manoel (2010); no que toca à
morfologia derivacional, citam-se o estudo de Figueira (1999) e Lima (2006). Contudo,
esses trabalhos são orientados por perspectivas teóricas diversas, como o
Interacionismo, a Sociolinguística e a Teoria da Otimalidade, e provêm, no mais das
vezes, acuradas descrições longitudinais do desenvolvimento da morfologia com base
em dados de produção, não havendo, neles, uma preocupação fundamental com a
elaboração de uma teoria integrada de aquisição da morfologia, como a que se pretende
construir aqui. Assim, as pesquisas a serem desenvolvidas pelo projeto ora apresentado
visam suprir essa lacuna, com estudos focados na formulação de uma teoria de
aquisição de linguagem de base linguística e psicolinguística que visa a fornecer um
modelo teórico da aquisição da morfologia derivacional e flexional em PB.
Por fim, aponta-se como uma terceira e última justificativa para esse projeto a
necessidade de uma revisão da doutrina gramatical tradicional sobre a morfologia e os
processos de formação de palavras em PB. Com bem aponta Rocha (1999), a Gramática 4 Laboratório de Computações Lingüísticas, Psicolingüística e Neurofisiologia, sob a direção da Profa. Dra. Aniela Improta França 5 Laboratório de Processamento e Aquisição da Linguagem, sob a direção da Profa. Dra. Letícia Corrêa6 Laboratório de Psicolingüística Experimental, sob a direção do Prof. Dr. Marcus Maia7 Laboratório de Processamento da Linguagem, sob a direção do Prof. Márcio Leitão
12
Tradicional, de orientação normativa-filológica, têm ignorado as muitas contribuições à
Morfologia do PB que vêm sendo dadas pelo estruturalismo (Câmara Jr. 1970;
Sandmann, 1989, 1991, 1992) e pelo gerativismo (Basílio, 1980, 2008). Daí resulta que
boa parte daquilo que se ensina habitualmente sobre morfologia nas escolas de Ensino
Fundamental e Médio revela-se anacrônico e incompleto, não dando conta de toda a
variedade de fenômenos lingüísticos que se manifestam na flexão e derivação de
palavras, chegando até mesmo, muitas vezes, a induzir enganos e equívocos. Na medida
em que esse projeto pretende apresentar uma descrição mais completa e acurada dos
processos morfológicos de derivação e flexão em PB, com base em dados de produção,
a necessidade de sua efetivação fica mais uma vez justificada.
3. Referenciais Teóricos
Esta seção apresenta um resumo das principais teorias em que se embasa o
presente projeto. Em primeiro lugar, são apresentados os modelos de léxico
desenvolvidos pela Linguística gerativista, desde a década de 1970 até o Programa
Minimalista, além dos principais modelos de léxico mental esboçados pela
Psicolinguística nessa mesma época, com especial ênfase aos modelos de Levelt (1994),
Bock & Levelt (1994) e Levelt et al. (2001). Em seguida, mostram-se os contornos
gerais da teoria da Morfologia Distribuída, discutindo-se as questões ligadas à possível
integração entre esses referenciais teóricos na elaboração de uma teoria morfológica
voltada para o estudo do acesso, representação e aquisição das palavras
morfologicamente complexas em PB.
3.1. Modelos de Léxico na Teoria Linguística
Nas primeiras fases do desenvolvimento da teoria gerativa, o estudo da
linguagem se concentrou na sintaxe e na fonologia. Processos morfológicos flexionais
eram estudados no âmbito da descrição sintática da geração de sentenças, e alterações
morfofonológicas achavam-se sob o escopo de regras fonológicas de ajuste. Segundo a
teoria gerativa padrão (Chomsky, 1965), processos derivacionais gerais eram tratados
como processos sintáticos. Substantivos deverbais nada mais eram do que
superficializações de construções verbais da estrutura profunda. Somente os verbos
correspondem a entradas lexicais, não as formas nominalizadas a eles correspondentes.
Como se percebe, nesse momento não havia muito espaço para o estudo da morfologia e
13
do léxico, o qual era concebido como uma lista de elementos atômicos usados na
derivação de sentenças, ou como o repositório de coisas que não eram possíveis de ser
geradas por mecanismos sintáticos.
Essa situação começou a mudar a partir da década de 1970, com a proposta da
Hipótese Lexicalista (Chomsky, 1970), segundo a qual as formas nominais passam a
fazer parte do léxico. A sugestão foi a de que a morfologia teria uma autonomia em
relação à sintaxe dentro da teoria gerativa, e, consequentemente, surgiu a necessidade da
criação de um modelo teórico que descrevesse e explicasse da competência lexical do
falante. Assim, vários modelos de léxico lingüísticos foram criados, como os de Halle
(1973), Jackendoff (1973) e Aronoff (1976), ainda que sem considerar as sugestões
advindas da pesquisa psicolinguística sobre acesso e representação lexical.
Halle (1973) apresentou a primeira proposta teórica de um componente
morfológico autônomo dentro da Gramática Gerativa. O esquema geral de seu modelo
aparece ilustrado abaixo.
No modelo de Halle (1973), não é feita distinção entre flexão e derivação, sendo
que ambos os processos podem ser descritos pelas mesmas regras. Uma outra
característica desse modelo é que constam do dicionário (repositório lexical) todas as
14
Lista de morfemas
Regras de formação de
palavrasAtuam sobre a lista de morfemas
FiltroEspecifica quais palavras realmente pertencem à língua
Dicionário
EsquemaGeral doModelo
formas flexionadas, o que, certamente, consistiria em uma opção muito pouco
econômica.
Jackendoff (1975), procedeu a um estudo das nominalizações e procurou
estender às demais relações lexicais uma descrição generalizante, bem dentro do espírito
dominante do gerativismo à época, o qual buscava eliminar as redundâncias observadas
nas regras propostas no modelo padrão. Na proposta de Jackendoff, nos pares
verbo/forma nominalizada, cada elemento corresponde a uma entrada lexical separada
no léxico, o que ficou conhecido como Teoria da Entrada Lexical Plena, à semelhança
com a idéia de Halle (1973). Uma outra sugestão de Jackendoff foi a das chamadas
Regras de Redundância – regras que expressariam as regularidades fonológicas,
sintáticas e semânticas existentes entre os itens lexicais em questão (verbo/formas
nominalizadas). No que toca à questão da aquisição lexical, a idéia de Jackendoff foi a
de que quanto maior o número de informações novas relativas a um item lexical, maior
o custo para a aquisição desse item. Quando a informação já está contida em regra de
redundância, esse custo é praticamente nulo. As regras de redundância podem ser
morfológicas ou semânticas. Jackendoff assume, ainda, a mesma posição de Halle
quanto a questão derivação/flexão. Assim, formas flexionadas são listadas e
relacionadas por regras de redundância.
No modelo de Aronoff (1976), apresenta-se um modelo voltado para o problema
da produtividade lexical, no que difere de Jackendoff, que enfatiza às relações que o
falante estabelece entre os itens lexicais. Aronoff sugere uma morfologia baseada em
palavras, no que se aproxima de Jackendoff, mas oposta a Halle, que propõe uma
morfologia baseada em morfemas. Isso significa que a unidade básica de
armazenamento lexical é, para Aronoff e Jackendoff, a palavra, ao passo que, para
Halle, essa unidade é o morfema.
Para Aronoff, as regras de formação de palavras existentes no léxico só atuam
em bases que são palavras da língua. Já os morfemas, ao contrário das palavras, podem
não ter significado independente e fora das palavras específicas em que ocorrem. Um
dos exemplos de Aronoff para esta última afirmação é a de verbos do tipo refer, defer,
prefer, infer, confer, transfer (ou, no caso do português, seus correspondentes referir,
deferir, preferir, conferir, transferir). A questão levantada é se se pode atribuir um
15
significado constante ao morfema -fer. Aronoff argumenta que prefer não tem qualquer
ligação com confer ou com transfer. Portanto, embora o mesmo radical esteja presente
em todos estes verbos, seu sentido é diferente em cada um deles. Apenas as formas
derivadas irregulares teriam entrada no léxico. Formas derivadas plenamente regulares
poderiam ser geradas por regras. Uma forma lexicalizada pode sofrer alterações com o
uso (perda ou ganho de significados).
Uma regra de formação de palavras opera sempre sobre bases (palavras) que
pertencem a uma determinada categoria lexical, produzindo formas que pertencem,
também, a uma única categoria lexical. Se os produtos dessas regras são formas
semântica e fonologicamente transparentes, não são listadas no léxico. Se, no entanto, o
acréscimo de determinado afixo promover mudanças fonológicas ou semânticas, os
produtos terão de estar listados no léxico. Quanto mais regulares os produtos de uma
regra, maior a produtividade da regra (os exemplos dados por Aronoff são os da
deadjetivais em –ness e –ity). Quanto à controvérsia flexão x derivação, Aronoff
assinala apenas que a flexão é muito diferente da derivação, pois a flexão é
paradigmática, mas não a derivação.
Di Sciullo e Williams (1987) retomam, em sua proposta, a discussão sobre que
unidades devem estar estocadas no léxico. Jackendoff (1975) defende um modelo em
que todos os itens estão listados no léxico, enquanto Aronoff (1976) afirma que somente
itens lexicais irregulares estão listadas no léxico. Di Sciullo e Williams (1987) propõem
que o léxico é um conjunto de itens heterogêneos, como palavras, morfemas, padrões
entonacionais, etc. Todos esses elementos fazem parte do léxico porque não estão de
acordo com as regras da gramática. (“O léxico é como uma prisão: só contém os fora-
da-lei”). O léxico não tem estrutura e não é relevante para a gramática. Percebe-se, aqui,
uma retomada da teoria padrão (Chomsky, 1965) segundo a qual o léxico consiste de
uma lista não ordenada de entradas lexicais. Contudo, há uma aproximação com a
proposta de Aronoff 1976, no sentido em que as formas plenamente regulares não estão
listadas no léxico. Para Di Sciullo e Williams, não é possível estabelecer relações dentro
do léxico. Como o léxico não tem estrutura, seus elementos não manteriam entre si
qualquer relação que interesse a gramática. Não há qualquer razão para separar afixos
derivacionais de afixos flexionais, não há distinção, portanto, entre flexão e derivação.
A morfologia, como parte da gramática, leva em conta apenas aqueles elementos que
16
estão de acordo com as regras da língua. Os produtos das regras de formação de
palavras são plenamente regulares tanto no aspecto formal quanto no semântico. Nos
casos de irregularidades, a questão é se fazem parte ou não parte do léxico.
Anderson (1992) inicia a apresentação de sua proposta com uma indagação: qual
a unidade básica da Morfologia? O autor questiona a idéia de que a morfologia é o
estudo dos morfemas, como propõe o estruturalismo. Para Anderson, o conceito de
morfema conforme a visão estruturalista – forma mínima significativa – apresenta
diversos problemas. Um deles está relacionado à identificação de morfemas tipo zero,
subtrativos, substitutivos e outros de comportamento anormal. Outro problema é a
segmentação em uma unidade morfológica (o radical), ou seja, a delimitação entre
morfemas. Além disso, há dificuldades com relação à noção de morfemas cumulativos.
Apesar destes problemas, Anderson mostra-se contrário a uma morfologia baseada em
palavras, como proposto por Aronoff (1976). Para ele, não são as palavras, mas os
radicais, que funcionam como base nas regras de formação de palavras. Anderson
acentua que se trata de radicais e bases, e não de morfemas, afastando-se, assim de
Halle (1973), cuja proposta baseia-se em morfemas, e de Aronoff (1976), baseada em
palavras. Anderson retoma Jackendoff (1975) na medida em que considera as regras
derivacionais como relações especificáveis entre os elementos do léxico, sendo uma
espécie de regras de redundância. Para Anderson, todos os itens lexicais da língua
fazem parte do léxico e as regras de formação de palavras funcionam para especificar as
relações sistemáticas que existem entre eles. Além disso, as regras podem ser
empregadas produtivamente para tornar disponíveis no léxico, itens nunca antes
manifestados. A postura de Anderson com relação a flexão é completamente diferente
da de Jackendoff, propondo uma separação entre os dois fenômenos e definindo flexão
como a parte da morfologia que interage com a sintaxe.
No que tange ao PB, Basílio (1980) apresenta uma teoria sobre a componente
morfológica da gramática (ou da competência lexical) que pode inicialmente ser
ilustrada conforme se segue:
Uma lista de entradas lexicais
17
A competência lexical do indivíduo é formada por
Um conjunto de regras por meio das quais os falantes analisam as formações já existentes na língua e formam novos itens lexicais. O falante chega a esse conjunto de regras a partir das relações que ele estabelece entre os itens pertencentes à lista de entradas lexicais.
Basílio é contrária tanto a uma morfologia baseada em palavras (como Aronoff,
1976) como a morfologia baseada em radicais (como Anderson, 1992). Sua proposta é a
da condição de transparência morfossemântica como marco da disponibilidade de um
elemento morfológico para servir de base na operação das regras de formação de
palavras. Basílio distingue ainda dois tipos de regras morfológicas, de acordo com o
esquema abaixo:
Regras de Formação de Palavras (RFP’s)
RegrasMorfológicas
Regras de Análise Estrutural (RAE’s)
Essa distinção permite tratar tanto das criações novas quanto das formações
fossilizadas no léxico.Todas as RFP’s têm sua contrapartida de análise estrutural, pois,
se temos uma regra produtiva, isso significa que os falantes reconhecem as
redundâncias a ponto de usa-las na formação de novas palavras. Entretanto, a recíproca
não é verdadeira. O falante pode ser capaz de analisar formas da língua por meio de
RAE’s sem, contudo, utilizar-se de uma RFP semelhante para produzir novos itens. Isso
explicaria a capacidade do falante de analisar itens lexicais de sua língua, sem, contudo,
utilizar-se da mesma regra para produzir novos itens. Nesse sentido, a autora consegue
abarcar os dois lados da competência lexical do falante: o lado da produção de novos
itens e o lado da interpretação das formas já existentes por meio de mecanismos de
RFP’s e RAE’s.
No tocante à questão da desvinculação de regras morfológicas e regras
semânticas, conforme proposto por Jackendoff. Basílio argumenta que, embora isso
possa ser feito no caso da nominalização, em outras relações lexicais, muitos sufixos
têm significados previsíveis e, portanto, não faz sentido a separação entre o componente
morfológico da regra e o semântico.
18
Basílio também se manifesta pela separação entre flexão e derivação. Na flexão,
as regras são plenamente produtivas e os paradigmas nítidos, fechados e sistemáticos. Já
na derivação, as regras são caracteristicamente semiprodutivas e os paradigmas
semissistemáticos.
Basílio (1987, 1990) traz alguns acréscimos à proposta de 1980, assumindo uma
posição mais radical, observando que não apenas existe uma associação
forma/significado nas RFP’s, mas também que a relevância do fator semântico é bem
maior do que se pensava. Basílio mostra a dimensão semântica em processos de
mudança de classe, como a substantivação de adjetivos e a formação de adjetivos a
partir de verbos. Basílio (1987, 1990) propõe uma distinção teórica entre condições de
produtividade, que definiriam construções lexicais possíveis; e condições de produção,
que correspondem a fatores que favorecem e propiciam, ou, ao contrário, impedem ou
dificultam a atuação de RFP’s em circunstâncias específicas.
Até aqui, pode-se agrupar as concepções de léxico propostas no âmbito da teoria
linguística em dois grupos, conforme abaixo:
Em anos mais recentes, novas teorias sobre o léxico foram sugeridas, as quais,
na medida em que concebem o léxico como uma lista não ordenada de itens usados na
derivação de sentenças, parecem pender para o primeiro grupo acima mostrado. Refere-
se aqui ao léxico tal como concebido no Programa Minimalista (Chomksy, 1995) e pela
19
O léxico na Teoria Linguística: duas posições diametralmente opostas.
O léxico é apenas uma lista não ordenada de
formas, sem interesse para a gramática
(Chomsky, 1965 e Di Sciullo/Williams 1987).
Para Di Sciullo e Williams, há itens que, pela
sua regularidade total, não estão no léxico,
fazem parte da gramática.
O léxico possui algum tipo de estrutura e por
isso a gramática deve-se ocupar do estudo da
estrutura do léxico (Halle, 1973; Jackendoff,
1975; Aronoff, 1976; Basílio, 1980, 1987,
1990 e Anderson, 1992).
Morfologia Distribuída (Halle & Marantz, 1993, Harley & Noyer, 1999). No
Minimalismo, o léxico é o repositório de todas as propriedades (idiossincráticas) dos
itens lexicais particulares, propriedades estas que incluem a representação da forma
fonológica de cada item, a especificação da sua categoria sintática e suas características
semânticas, certamente uma visão que remonta ao modelo padrão de 1965. Na
Morfologia Distribuída, a idéia não é a de que o léxico não é importante para a
gramática – na verdade, ela está inserido na própria gramática, uma vez que as
operações morfológicas de geração de itens lexicais são as mesmas operações
computacionais que atuam na derivação de sentenças. Ambos as teorias são discutidas
na seção que se segue.
3.1.1. O Léxico no Programa Minimalista
Chomsky (1995) compreende o léxico num sentido bem tradicional: como um
repositório de “exceções”, aquilo que não é uma conseqüência de princípios gerais.
Uma entrada lexical especifica as idiossincrasias desse item e as informações
minimamente suficientes para derivar a representação LF (logical form ou forma lógica,
parte da derivação que codifica os aspectos semânticos e que, por isso, é interpretada na
interface conceptual-intencional) e que permite à componente fonológica construir a
representação PF (phonetic form, ou forma fonética, parte da derivação que codifica os
aspectos fonológicos e que, por isso, é interpretada na interface perceptual-
articulatória). Uma entrada lexical contém informações como categoria gramatical a que
pertence o item, traços formais (necessários para a computação sintática, como os de
número ou caso) e traços semânticos. Fornece, ainda, informação exigida para as
computações posteriores, em particular, para as operações da componente fonológica
(incluindo também a morfologia). Dentro do espírito geral do Minimalismo, Chomsky
considera o léxico uma “codificação ótima” das propriedades lexicais exigidas pela
computação sintática, e chega a citar Jespersen ao dizer que “Nunca ninguém sonhou
com uma morfologia universal, na medida em que, tanto quanto se possa ver, a
morfologia é principalmente um repositório dos aspectos excepcionais das línguas
particulares”. Chomsky também cita o fato de que “existem teorias mais complexas que
espalham as propriedades. Pode-se propor, por exemplo, que os traços formais, as
instruções para as regras fonológicas e as instruções para a interpretação em LF
20
aparecem em subléxicos diferentes, acessíveis em pontos diferentes do processo
computacional.” Essa é a diretriz geral da Morfologia Distribuída.
3.1.2 A Teoria da Morfologia Distribuída
O modelo da Morfologia Distribuída, proposto por Halle & Marantz (1993),
rompe com a tradição de estudos morfológicos gerativos baseados na Hipótese
Lexicalista, retomando as propostas de Anderson (1992). Segundo a Morfologia
Distribuída, aquilo que tradicionalmente é chamado de morfologia não está concentrado
em um único componente da gramática, mas está distribuído entre diversos
componentes (cf. Halle & Marantz, 1993). As principais características do modelo (cf.
Harley & Noyer, 1999) são a inserção tardia, a qual afirma que as categorias sintáticas
são compostas por feixes de traços sem conteúdo fonológico, recebendo expressão
fonológica, através da inserção de itens de vocabulário apenas após a sintaxe; a
subespecificação, que afirma que as expressões fonológicas não carecem de estar
totalmente especificadas para os nós sintáticos nos quais podem ser inseridas; e, por fim
a estrutura sintática hierárquica all the way down (“até lá embaixo” em tradução livre),
a qual vincula os elementos da sintaxe e da morfologia dentro dos mesmos tipos de
constituintes.
Esse modelo teórico vincula os elementos da sintaxe e da morfologia dentro dos
mesmos tipos de constituintes. A Morfologia Distribuída é baseada em partes (piece-
based) no sentido de que elementos sintáticos e morfológicos são entendidos como
unidades discretas ao invés de como resultados de processos morfofonológicos. O
esquema geral do modelo de Halle & Marantz é apresentado a seguir (Harley & Noyer,
1999)
21
Não existe “léxico” na morfologia distribuída no sentido oriundo da gramática
gerativa das décadas de 1970 e 1980. Em outras palavras a Morfologia Distribuída
rejeita a hipótese lexicalista. As funções atribuídas ao léxico nas teorias mais recentes
são distribuídas através de vários outros componentes. Já que não há léxico na
morfologia distribuída, o termo “item lexical” não possui significação na teoria, nem as
expressões “aconteceu no léxico”, “lexical” ou “lexicalizado”. Aponta-se aqui as
acepções mais usuais de “léxico” e seus status na morfologia distribuída:
Lexical(izado) = Idiomatizado – Na Morfologia Distribuída tais expressões são idiomas e requerem uma entrada na Enciclopédia (encyclopedia Entry).
Lexical(izado) = Não construído pela sintaxe – A estrutura interna das expressões não é sempre um produto de operações sintáticas. Na Morfologia Distribuída, estruturas podem ser
22
produzidas na sintaxe e após a sintaxe em um componente chamado Morfologia. Entretanto, operações dentro da morfologia ainda manipulam essencialmente relações sintáticas estruturais.
Lexical(izado) = Não sujeito a processos fonológicos excepcionais. Na Morfologia Distribuída, a distinção entre fonologia lexical e pós-lexical é abandonada. Toda a fonologia ocorre em um simples módulo pós-sintático.
Na Morfologia Distribuída, o termo morfema se refere ao nó sintático (ou
morfológico) terminal e seu conteúdo, não à expressão fonológica deste terminal, o
qual é providenciado como parte de um item vocabular (vocabulary item). Morfemas
são, portanto, átomos da representação morfossintática. O conteúdo de um morfema
ativo na sintaxe consiste de traços sintático-semânticos retirados de um conjunto
disponibilizado pela GU.
A relação entre um string fonológico e uma informação sobre onde este string
pode ser inserido é denominada item de vocabulário. O conjunto de todos os itens
vocabulares é chamado de vocabulário. Os itens vocabulares provêem um conjunto de
sinais fonológicos disponíveis na linguagem para a expressão de morfemas abstratos.
Há ainda a distinção entre morfemas concretos, que são aqueles cuja expressão
fonológica foi fixada; e morfemas abstratos, que são aqueles cuja expressão fonológica
foi atrasada até após a sintaxe. Os morfemas também podem ser:
F-Morfemas: São definidos como morfemas para as quais não há escolha para a
inserção vocabular. Em outras palavras, F-Morfemas são aqueles
cujo conteúdo é suficiente para determinar uma única expressão
fonológica.
L-Morfemas: São definidos como aqueles para os quais há escolha no spell-out.
Por exemplo, em um L-Morfema que corresponde àquilo que
preteoricamente seria chamado de “nome” podem ser inseridos as
partes “dog”, “fish”, etc.
A distinção entre F-Morfemas e L- Morfemas corresponde aproximadamente à
distinção convencional entre categorias funcionais e lexicais.
23
O termo idioma é usado para se referir a qualquer expressão (mesmo uma
palavra simples ou uma subparte de uma palavra) cujo significado não é totalmente
previsível da descrição da sua estrutura morfossintática. F-Morfemas são tipicamente
não idiomas, mas L-Morfemas são sempre idiomas. A Enciclopédia contém as entradas
da Enciclopédia, estas relacionam os itens vocabulares aos significados. Em outras
palavras, a Enciclopédia é a lista dos idiomas de uma língua. A operação de Spell-out
insere itens vocabulares (partes fonológicas) nos morfemas. É também chamado de
“inserção vocabular” e trabalha diferentemente dependendo do tipo de morfema que
está sendo inserido (spelled-out), F-Morfema ou L-Morfema. Apesar disso, Spell-out
normalmente envolve a associação de itens vocabulares com morfemas abstratos.
Trabalhos recentes em Morfologia Distribuída têm se concentrado
primeiramente no spell-out de F-Morfemas. Em tais casos conjuntos de itens
vocabulares competem para inserção, sujeitos ao princípio Subset, o qual diz que:
“O expoente fonológico de um item vocabular é inserido em um morfema ... se o item preenche todos os traços gramaticais especificados no morfema terminal ou um subconjunto destes. A inserção não acontece se o item vocabular contiver traços não presentes no morfema. Onde muitos itens vocabulares encontram condições para inserção, o item que preencher o maior número de casos especificados no morfema terminal deve ser escolhido”.
Para L-Morfemas existe uma escolha que se refere a qual item vocabular é
inserido. Por exemplo, um morfema raiz em uma relação local apropriada com um
determinante pode ser preenchido por “gato”, “cão”, “cavalo”, etc. Harley & Noyer
(1998) propuseram que tais itens vocabulares não estão em competição, como estão os
itens inseridos nos F-Morfemas. Estes itens vocabulares podem ser livremente inseridos
no Spell-out sujeitos a condições de licenciamento. Licenciadores (licensers) são
tipicamente F-Morfemas em certas relações estruturais com a raiz onde o item
vocabular está inserido. “Nomes” são licenciados por determinantes; diferentes classes
de verbos, tais como inergativos, inacusativos, inacusativos e transitivos, cada qual é
licenciado por diferentes configurações estruturais.
A Morfologia Distribuída reconhece dois diferentes tipos de alomorfia: a
alomorfia supletiva, a qual ocorre onde diferentes itens vocabulares competem para
inserção em um F-Morfema. Por exemplo, nomes em holandês possuem (no mínimo)
24
dois sufixos de número plural, -em e –s. As condições para a escolha são parcialmente
fonológicas e parcialmente idiossincráticas. Já que –em e –s não são plausivelmente
relacionadas fonologicamente, eles devem constituir dois itens vocabulares em
competição; e a alomorfia morfofonológica – Ocorre onde um item vocabular simples
possui várias formas fonologicamente similares, mas onde a similaridade não é tal que a
fonologia possa ser diretamente responsável pela variação. Por exemplo: destroy – e
destruct – representam radicais alomórficos de um item vocabular simples. A
Morfologia Distribuída elabora a hipótese de que em tais casos há um simples alomorfe
básico e outros que são derivados por uma regra de reajustamento.
O modelo da Morfologia Distribuída reconhece por fim também a operação de
empobrecimento (impoverishment). É uma operação sobre os conteúdos dos morfemas
antes do Spell-out. Em trabalhos recentes em Morfologia Distribuída, o
empobrecimento envolve simplesmente o apagamento de traços morfossintáticos de
morfemas em certos contextos. Quando certos traços são apagados, a inserção de itens
vocabulares que requerem aqueles traços para inserção não pode ocorrer, e um item
menos especificado será inserido.
Em um balanço geral do que foi mostrado até aqui, pode-se dizer que as
primeiras teorias sobre o léxico incidiram na caracterização dos mecanismos
morfológicos constantes no léxico, tanto os de flexão quanto as regras de formação de
palavras. Palavras morfologicamente complexas seriam, então, resultado de operações
morfológicas que gerariam um item pronto para ser usado na derivação sintática. Essa
ênfase nas operações morfológicas foi feita em detrimento da uma maior especificação
da natureza e das propriedades dos itens lexicais armazenados no léxico – essa parece
ser uma preocupação mais evidente no Minimalismo. Entretanto, esse modelo teórico
confere, relativamente, pouca atenção às questões lexicais, concentrando-se mais na
caracterização das informações lexicais necessárias para a computação sintática. Nesse
sentido, a Morfologia Distribuída apresenta-se como um modelo mais completo, na
razão em que permite a formulação de hipótese tanto sobre a representação das unidades
lexicais (as quais se acham distribuídas por três listas de itens, a Enciclopédia, o
Vocabulário e a lista de traços morfossintáticos, chamada de Léxico Estrito) quanto
sobre as operações de construção de itens lexicais complexos, as quais não difeririam
das operações sintáticas.
25
Sendo, por outro lado, um modelo teórico estritamente comprometido com a
questão da geração de sentenças, a Morfologia Distribuída deixa de cuidar de uma série
de questões empíricas fundamentais. Não fica claro, por exemplo, como se dá o acesso
às formas estocadas nas listas, nem como esse acesso seria afetado por fatores ligados à
frequência e ao tipo de item, o que tem sido demonstrado pela pesquisa psicolinguística
sobre esse tema. Mesmo a representação lexical de formas morfologicamente
complexas não fica de todo evidente nesse modelo, na medida em que há pouca
evidência empírica de diferenças no tempo de recuperação na memória de trabalho entre
formas simples e formas complexas. Erros na recuperação de forma fônica e/ou
semântica de itens (os chamados slip/tip-of-the-tongue phenomena) também merecem
maior consideração nesse modelo, já que podem fornecer pistas sobre a organização das
informações fonológicas e semânticas no léxico.
Verdade é que algumas tentativas têm sido feitas nesse sentido, como os estudos
de França et al. (2008) sobre recuperação de formas morfologicamente complexas, e o
de Pfau (2006) sobre os erros de fala. Os resultados desses trabalhos têm sido bastante
animadores, o que aponta para a possibilidade de validação empírica das propostas
teóricas da Morfologia Distribuída. O presente projeto fixa-se na mesma direção, com a
diferença de objetivar, também, a elaboração de uma proposta teórica sobre a aquisição
e desenvolvimento dos mecanismos de construção morfológica, algo que não está
presente nem na Morfologia Distribuída, nem em outros modelos de léxico da teoria
linguística. Busca-se aqui, igualmente, uma convergência da Morfologia Distribuída
com modelos de léxico mental, como os discutidos a seguir.
3.2. Modelos de Léxico Mental na Teoria Psicolinguística
Na Teoria Psicolingüística, a discussão sobre a representação do número remete
à problemática da criação de modelos de representação de informações lexicais, bem
como o acesso a estas representações. No que tange à representação, discute-se a
existência de léxicos de acesso e de léxicos centrais. Uma outra questão crucial a ser
elucidada é saber qual a unidade básica de representação: morfema, palavra, ou ambos.
No que toca ao acesso às formas lexicais armazenadas, a discussão gira em torno do
acesso direto ou acesso indireto. Discute-se também a necessidade da decomposição
morfológica para o acesso lexical.
26
A representação dos itens lexicais no léxico mental é de grande importância na
pesquisa psicolingüística. Conforme apontado por Emmorey e Fromkin (1988), estudar
a natureza das representações estocadas no léxico mental é importante porque determina
em parte a natureza dos mecanismos de acesso. Duas hipóteses foram apresentadas
inicialmente: a full parsing hypothesis e a full listing hypothesis. Uma terceira seria
apresentada a seguir, a hybrid model hypothesis. De acordo com a full parsing
hypothesis, radicais e morfemas presos são representados independentemente no léxico
mental, sendo a unidade básica de armazenamento, portanto, o morfema. Os modelos
que assumem esta hipótese são os de Taft & Forster (1975), conhecido como Modelo
Serial de Busca, e o de Taft (1994), chamado de Modelo de Ativação Interativa.
A proposta de Taft & Forster (1975) classifica-se entre os modelos de acesso
indireto, uma vez que admite a existência de léxicos de acesso (visuais e/ou auditivos)
que intermedeiam o acesso ao léxico central – em decorrência disso, postula a
necessidade de léxicos fonológicos, grafológicos e semânticos a par do léxico central. O
acesso seria feito mediante decomposição morfológica, daí o modelo ser considerado
como morpheme-based (baseado em morfemas). Os itens lexicais estariam armazenados
no léxico, conforme este modelo, por ordem de freqüência do radical, começando com
os mais freqüentes. Experimentos feitos por Taft e Forster (1975) indicam que, no
acesso, os itens lexicais derivados são analisados em um parsing da esquerda para a
direita e decompostos. O prefixo, primeiro elemento a ser encontrado, é separado e o
radical buscado no léxico. Quando encontrado, haveria a recombinação do prefixo e do
radical para a verificação da legitimidade da combinação. Assim, o léxico de entrada é
composto por morfemas, livres e presos, uma vez que não é feita distinção entre radicais
livres e radicais presos. Todos estariam no léxico. O modelo operaria em duas etapas.
Na primeira ocorre a busca em ordem de freqüência do radical no léxico, começando
com os mais freqüentes; na segunda etapa, após ser encontrada a correspondência, não é
dado acesso ao item lexical por completo, mas a um marcador que revela onde o item
lexical está guardado. As previsões deste modelo são as de que palavras pseudofixadas
são processadas mais lentamente do que as prefixadas em virtude de uma decomposição
errônea e palavras prefixadas são processadas mais lentamente do que as não-
prefixadas, uma vez que aquelas exigem decomposição.
27
Taft (1994) apresenta um modelo cujas principais características são:
Cada elemento lexical possui um nível de ativação de acordo com a sua
freqüência, de modo que quanto maior a freqüência, maior o nível de ativação.
Quando um item lexical é muito freqüente, seu nível de ativação já é tão alto que
o reconhecimento é imediato.
Existência de níveis de entrada morfêmicos, ou seja, no qual todos os itens
lexicais são representados por seus morfemas. Assim, a decomposição é
obrigatória.
Um nível vocabular acima do morfêmico, em que os itens lexicais têm sua
representação integral.
Um nível mais alto de processamento, o conceitual, em que aspectos da
semântica da palavra estão representados.
Uma característica comum a estes modelos é que ambos não fazem distinção
entre derivação e flexão. Assim, palavras derivadas e palavras flexionadas gozariam do
mesmo status, apesar de os experimentos terem sido realizados sempre com palavras
derivadas. As previsões possíveis seriam as de que palavras monomorfêmicas (no caso,
compostas apenas pelo radical, sem a presença de marcas de plural ou outras quaisquer)
deveriam ser acessadas em menos tempo do que as palavras complexas; não haveria
efeito de freqüência de superfície, já que as palavras são acessadas por meio de seus
morfemas constituintes, e apenas estes seriam sensíveis à freqüência; por fim, o tempo
de acesso seria determinado pela freqüência cumulativa da raiz, uma vez que é o radical
que é usado para acessar o léxico central (cf. Baayen, Dijkstra e Schreuder, 1997).
A hipótese seguinte, a full listing hypothesis, afirma que existem entradas
lexicais para todas as palavras independentemente de sua estrutura morfológica. Assim,
a unidade básica de armazenamento segundo esta hipótese seria a palavra. O modelo
que assume esta visão é o de Butterworth (1983), que se classificaria entre os de acesso
full-form (palavra completa), ou seja, não compartilha a assunção da decomposição
morfológica obrigatória. A previsão deste modelo é de que a freqüência de superfície da
palavra, seja ela monomorfêmica ou não, é um dos fatores determinantes da velocidade
de acesso. Logo, quanto maior a freqüência, mais rápido é o acesso (cf. Baayen,
Dijkstra e Schreuder, 1997).
28
Modelos de processamento morfológico mais modernos têm proposto que ambas
as formas de representação, full parsing e full listing, e ambas as formas de acesso,
morpheme-based e full-form, estão disponíveis para o reconhecimento da palavra
(Laine, Vainio & Hyöna, 1999; Colé, Segui & Taft, 1997). O reconhecimento por
palavra completa (full form access) requer que o conjunto de letras que forma o input
tenha uma representação estocada no léxico. Esta rota está então disponível apenas para
uma palavra que esteja estocada como uma entidade simples, como por exemplo as
palavras monomorfêmicas. Por outro lado, um típico candidato para um acesso baseado
em morfemas (morpheme-based access) seria uma palavra polimorfêmica, que não é
muito freqüente, mas contém morfemas constituintes que aparecem freqüentemente.
Formas flexionadas, como as de plural em português ou inglês, seriam os melhores
exemplos. Em um estudo feito com falantes de árabe argelino, Mimouni, Kehaya &
Jarema (1998), apontaram evidências para a existência de uma dupla rota de acesso a
palavras árabes flexionadas em número (acesso full-form e morpheme-based).
A última das hipóteses é, portanto, a hybrid model hypothesis, segundo a qual
tanto a representação full listing quanto a full parsing estariam disponíveis para o
acesso. Morfemas, livres ou presos, seriam então as unidades básicas de representação
lexical. Esta hipótese foi proposta para dar conta dos efeitos de freqüência no
reconhecimento de palavras complexas, uma vez que palavras morfologicamente
complexas com alta freqüência são reconhecidas e/ou recuperadas como uma unidade
(com maior rapidez), ao passo que palavras complexas de baixa freqüência sofreriam
parsing morfológico (sendo acessadas com menor rapidez). Os modelos que adotam o
hybrid model são o Modelo de Endereçamento Morfológico Ampliado (Augmented
Addressed Morphology Model – AAM) de Caramazza, Laudani & Romani (1988) e o
Modelo MRM, de Baayen & Schreuder (1995).
A característica principal do modelo de Caramazza, Laudani & Romani (1988) é
que uma seqüência de letras ativa tanto a representação integral do item quanto a
representação de morfemas, pois, para os proponentes do modelo AAM, todos os itens
derivados conhecidos pelo falante estão representados no léxico de acesso, tanto por
meio de uma representação integral quanto por meio de representações de seus
morfemas constituintes. Caso a palavra a ser acessada seja freqüente ou conhecida, o
acesso se dá por forma cheia, enquanto o acesso por morfemas acontece quando a
29
palavra é rara, pouco conhecida ou ainda quando apenas os morfemas são freqüentes,
mas não o radical. O modelo AAM é conhecido por Cascaded-Dual-Route-Model: a
segunda forma de acesso só se disponibiliza ao ser completada a primeira.
O modelo parallel dual-route (Modelo MRM) foi proposto por Baayen &
Schereuder em 1995. De acordo com ele, palavras morfologicamente complexas são
processadas através de duas rotas que operam em paralelo (daí o nome do modelo): uma
rota direta que mapeia significados diretamente em uma base de representações de
acesso full-form e uma rota por decomposição morfológica, que identifica constituintes
durante os primeiros estágios da segmentação perceptual, computa composicionalmente
o significado da palavra complexa durante os estágios subseqüentes do processamento
lexical. Este modelo trabalha com 3 níveis de representações: nível das representações
de acesso (específicas da modalidade pela qual o input lingüístico é recebido – auditivo
ou visual); nível dos nódulos conceituais (conceitos que recebem expressão verbal na
língua) e nível das representações sintático-semânticas. Cada nódulo conceitual está
ligado a pelo menos uma representação de acesso, estando também ligados a
representações sintático-semânticas, de nível superior. Estas especificam propriedades
combinatoriais (subcategorização, estrutura argumental, etc.) bem como aspectos do
significado.
A proposta de Baayen & Schreuder enfatiza a computação do significado, eleito
por eles o papel principal da Morfologia. O desenho da proposta espelha a importância
da computação semântica para o processamento lexical, refletindo a habilidade de se
processar itens lexicais complexos nunca antes ouvidos ou vistos. Existem neste modelo
dois fluxos de ativação de representações: forma – sentido (forward) e sentido – forma
(backward).
O sistema opera da seguinte forma: ao se receber o input, ativa-se a
representação de acesso na modalidade correspondente à forma como o input foi
recebido. Esta representação de acesso, por seu turno, ativa o nódulo conceitual ao qual
está ligada, levando a seguir à ativação das representações sintáticas e semânticas
apropriadas. Paralelamente, a palavra é decomposta e seus morfemas constituintes
ativados. As especificações sintático-semânticas examinam se a combinação de
morfemas é aceitável; caso seja, o significado é computado e o item lexical processado.
30
O modelo assume que as representações de acesso ativam apenas o seu nódulo
conceitual correspondente (embora não especifique o quanto de informação é necessário
para a ativação), entretanto, num fluxo de ativação backward nódulos conceituais
semanticamente relacionados podem ser ativados. Portanto, a apresentação de palavras
com grande família morfológica leva à ativação de um grande número de nódulos
conceituais, ao passo que palavras com família morfológica reduzida ativam poucos
nódulos. Estudos que observaram a freqüência cumulativa e de superfície (Baayen,
Dijsktra & Schreuder, 1997; Schereuder & Baayen, 1997) fornecem evidências
favoráveis a esta idéia, que permite a previsão de efeitos de freqüência em formas
flexionadas e derivadas.
Modelos de acesso e representação de itens no léxico mental como os até aqui
apresentados classificam-se, como já dito, em modelos de acesso indireto, uma vez que
todos eles postulam a existência de léxicos de acesso específicos à modalidade, que
intermediariam o acesso ao léxico central. Os léxicos de acesso nos modelos indiretos
normalmente contêm morfemas, como é o caso do modelo de Taft & Forster (1975),
palavras (Butterworth, 1983) ou palavras e morfemas (modelos AAM, de Caramazza,
Laudani e Romani (1988) e MRM, de Baayen & Schreuder (1995)). No que diz respeito
ao léxico central, quase nenhum deles faz referência. Apenas Taft (1994) cria um nível
vocabular (no qual todas as entradas seriam representações integrais dos itens lexicais).
O modelo AAM não deixa claro se o léxico central abrange tanto representações dos
itens lexicais quanto representações dos morfemas constituintes. Uma outra crítica é que
os modelos de acesso indireto concentram suas análises nas palavras derivadas, em
detrimento das palavras flexionadas, talvez por serem realizados, em sua maior parte,
com palavras do inglês, língua pobre em flexões. Os únicos modelos que tratam
diretamente do acesso e da representação de formas flexionadas regulares são o AAM e
o MRM.
Não são muito freqüentes, na literatura psicolingüística, modelos que não
assumem a existência de léxico de acesso intermediando o acesso às representações
lexicais, os quais são chamados de modelos de acesso direto. Apenas dois deles
merecem algum destaque: o trabalho de Tyler, Waksler & Marslen-Wilson (1993) e o
de Marslen-Wilson e Zhou (1999). O primeiro nem bem pode ser considerado um
modelo de acesso direto, já que admite a existência de léxicos de acesso e do léxico
31
central; já o segundo representa um rompimento com a tradição psicolingüística de
privilegiar o acesso indireto, ao postular um modelo em que os acessos são feitos
diretamente ao léxico central.
O modelo proposto por Tyler, Waksler & Marslen-Wilson (1993) distingue
representação de acesso e entrada lexical. Para estes autores, uma entrada lexical é uma
representação central dos atributos sintáticos e semânticos de uma palavra, bem como
de suas propriedades fonológicas abstratas. Em contraste, uma representação de acesso
é um alvo perceptual para o acesso lexical ou no domínio visual ou no auditivo. Este
modelo investiga as questões relativas à organização das entradas lexicais em um léxico
central e os fatores determinantes desta organização.
O foco deste modelo são as representações de palavras derivadas sufixadas em
inglês. Os processos de derivação morfológica em inglês podem provocar alterações nas
propriedades semânticas, sintáticas e fonológicas nas palavras nas quais os afixos são
anexados. Exemplos destas alterações são os pares write/writer, onde ocorre mudança
nas propriedades sintáticas da palavra-base; departament/departure, no qual o radical da
palavra-base torna-se semanticamente opaco; e decide/decision, cujas propriedades
fonológicas da palavra-base foram alteradas na derivação. Transparência semântica e
fonológica têm sua importância no acesso, representação e organização do léxico central
verificadas por Tyler, Waksler e Marslen-Wilson em uma série de 3 experimentos de
priming morfológico.
O primeiro experimento averiguou a importância da transparência fonológica, os
outros dois cuidaram da transparência semântica. Os autores concluíram que a
transparência fonológica não é um fator importante na organização do léxico central,
com relação à transparência semântica, os resultados mostraram que não há efeito de
facilitação quando o derivado é semanticamente opaco, uma vez que não se associa o
item derivado ao primitivo. Nos casos em que ocorre transparência semântica nos
derivados foi encontrado efeito de facilitação, assim como em sinônimos, o que indica a
existência de relações semânticas na arquitetura do léxico central.
Em vista destes resultados, Tyler, Waskler & Marslen-Wilson propuseram um
modelo de léxico central no qual se postula a existência de dois tipos de representação:
32
uma para formas semanticamente transparentes e outras para formas opacas
semanticamente. A entrada lexical para formas do primeiro tipo, como govermental
consiste de um radical {govern-} ligado a um sufixo {-mental}. O mesmo radical
também pode funcionar como entrada lexical de uma palavra morfologicamente mais
simples, como govern. O reconhecimento da palavra governmental envolve acesso ao
radical e ao afixo associado. Ao contrário, palavras semanticamente opacas, como
departament seriam representadas no léxico central como uma palavra
morfologicamente simples, podendo se combinar com outros afixos (como em
interdepartamental), mas em si mesma sem estrutura interna. Em particular, não
dividem o mesmo radical com departure, que consiste de radical {depart-} mais sufixo
{-ure}. O modelo de Tyler, Waskler & Marslen-Wilson (1993) não contempla palavras
flexionadas, donde se conclui que a questão da representação de formas flexionadas no
léxico central não é discutida neste modelo.
Um outro modelo de léxico que assume acesso direto é o de Marslen-Wilson &
Zhou (1999), baseado em um estudo sobre alomorfia. Em verdade, é realmente o único
a postular tal modalidade de acesso. O foco do trabalho são as formas superficiais
divergentes do mesmo radical, as quais compartilhariam uma mesma representação
fonológica na entrada lexical, aplicadas apenas a alterações fonológicas regulares; no
caso de mudanças muito acentuadas (como nos pares catch/caught, think/thought, etc.)
afirma-se a necessidade de entradas lexicais distintas. Contudo, o modelo de Marslen-
Wilson e Zhou restringe-se ao estudo de formas derivadas e alomorfes, excluindo o
estudo de itens lexicais prefixados e palavras compostas, assim como quase nada é dito
ou previsto acerca das formas flexionadas, o que não permite sua aplicação imediata à
questão da representação de número.
Um problema em relação a estes modelos de léxico mental é que eles
prescindem de um modelo de língua, o que os leva a serem modelos um tanto
distanciados do modo das propriedades que uma língua natural. Outra questão é que eles
estão em grande parte descompromissados com a questão da aquisição, não
contemplando em suas teorizações nenhuma explicação sobre o modo como podem ser
adquiridos. Cabe ressaltar também o fato de que grande parte das pesquisas
experimentais realizadas para a confecção destes modelos não levarem em conta a
língua falada, trabalhando quase sempre com estímulos transcritos em língua escrita, o
33
que acaba por dificultar articulações com sistemas de processamento de sinal acústico.
Contudo, as descobertas empíricas desses modelos podem ser bastante úteis quando
articuladas com um modelo de língua, no sentido em que podem fornecer evidências
para a elaboração de modelos de léxico no âmbito da teoria linguística.
3.2.1 Os Modelos de Levelt (1989), Bock & Levelt (1994) e Levelt et al. (2001)
Levelt (1989), Bock & Levelt (1994) e Levelt et al. (2001) apresentam modelos
de léxico mental que, por suas características peculiares, merecem serem discutidos à
parte, já que se afiguram-se como os mais capazes de se prestarem a uma articulação
com modelos de língua. Nesses modelos, o léxico exerce um papel crucial no
processamento e na geração de itens lexicais, uma vez que se afigura como um
mediador entre a conceptualização e a codificação gramatical e fonológica. São as
propriedades gramaticais codificadas nas entradas lexicais dos itens e sua ordem de
ativação que permitem a elaboração de estruturas sintáticas particulares.
De acordo com estas propostas, a arquitetura do léxico mental pode ser vista
como um repositório de conhecimentos declarativos que os falantes possuem a respeito
das palavras de sua língua. Uma entrada lexical típica consiste de uma lista com quatro
tipos de traços, havendo relações internas entre eles: traços semânticos, sintáticos,
morfológicos e fonológicos. Assume-se a existência de traços pragmáticos, estilísticos
e afetivos também codificados na entrada lexical. As relações dos itens no léxico mental
podem ocorrer internamente ou externamente às entradas lexicais. As várias flexões de
um verbo, por exemplo, são itens que pertencem à mesma entrada lexical. Os traços de
pessoa, número, tempo, modo e aspecto tomam lugar na seleção de um item correto
dentro de uma entrada lexical. Admite-se que isto é geralmente o caso das flexões, mas
não das derivações, que são entradas lexicais diferentes (cf. Butterworth, 1983).
As relações entre as entradas lexicais são de dois tipos: intrínsecas e
associativas. As relações intrínsecas derivam dos quatro tipos listados para uma entrada.
Itens podem conectar-se no léxico mental porque dividem certos traços, como traços
significativos (formando assim os chamados campos semânticos), traços morfológicos
(no caso das famílias morfológicas), traços fonológicos (homonímias e paronímias, por
exemplo) e traços sintáticos (os quais ainda não possuem evidências empíricas
34
convincentes de sua existência no léxico mental, segundo o próprio Levelt). Relações
associativas são aquelas inicialmente mediadas por relações conceptuais complexas – é
o caso de itens lexicais como guerra e morte, verdade e beleza, ou também fenômenos
de antonímia tais grande e pequeno, direita e esquerda, etc.
Um ponto interessante desses modelos é a sua menção ao fato de os falantes
produzirem palavras enquanto falam. Embora considere o léxico mental um estoque
passivo de conhecimentos declarativos sobre palavras, Levelt (1989) afirma que os
falantes podem utilizar este conhecimento passivo de forma produtiva. Falantes de
certas línguas aglutinantes, como o finlandês e o turco, provavelmente possuem
armazenados no léxico mental apenas radicais e afixos, além de algumas palavras
morfologicamente complexas de uso rotineiro. Para fazerem uso deste léxico, turcos e
finlandeses devem ter acesso a um conhecimento lexical procedural – modos de
produzir novas palavras. Em outros termos, devem ter um componente lexical dedicado
à formação de itens lexicais. Modelos de léxico mental em geral tratam do léxico como
um estoque passivo de informações, não dando conta dos processos de formação de
novas palavras. Em outros casos, este conhecimento produtivo é colocado no âmbito da
gramática, fora, portanto, do léxico. Levelt (1989) afirma que línguas como o inglês
possui baixo índice de formação de novas palavras ao passo que em outras línguas este
índice pode ser bastante elevado. A conclusão a que ele chega é que falantes podem
produzir mais palavras do que apenas aquelas já estocadas no léxico mental e que
falantes têm a capacidade de construir novos itens enquanto falam.
Uma entrada lexical, segundo Levelt (1989), pode ser divida em duas partes. A
primeira conteria as informações de cunho fonológico e morfológico. A razão para
estarem juntas é que ambas são irrelevantes para a codificação gramatical que leva à
estruturação de sentenças. A segunda parte abrangeria as informações sintáticas e
semânticas, estas sim relevantes para a codificação. Esta última parte recebe o nome de
lema. Assim, entradas lexicais são constituídas de uma informação formal, chamada
forma lexical – que corresponde aos dados morfofonológicos – e um lema – que
corresponde aos dados sintático-semânticos. Cada lema aponta para sua forma lexical à
qual está associado. A informação semântica em um lema especifica quais condições
conceptuais têm de ser satisfeitas na mensagem para o lema de tornar ativado: é o
significado do lema. A informação sintática especifica as categorias sintáticas do item,
35
suas funções gramaticais e um conjunto de traços diacríticos variáveis ou parâmetros
(traços de tempo, aspecto, modo, pessoa, número, etc.).
O modo pelo qual os lemas são acessados constitui, a chave para as teorias de
produção da linguagem. Entretanto, os autores mesmos afirmam que muito pouco é
conhecido sobre o modo como os lemas são ativados. Levelt et al. (2001) apenas faz
menção ao fato de que, provavelmente, o processamento envolvido no acesso lexical
requer processamento paralelo, uma vez que a rapidez e a precisão observada na
recuperação de um item lexical dificilmente seriam possíveis em um processamento
serial.
A proposta de Levelt (1989), Bock & Levelt (1994) e Levelt et al. (2001)
pretende ser uma teoria geral da produção e compreensão de enunciados lingüísticos, e
em grande parte consegue seu intento. Entretanto, peca em não assumir um modelo de
língua, o qual permitiria, por exemplo, uma melhor definição do tipo de informação
sintática que deveria ser codificada em um lema. Essa deficiência pode ser suprida, na
medida em que a proposta assume que informações sobre os itens lexicais são
armazenadas separadamente, com as informações morfofonológicas, de um lado, e
sintático-semânticas, de outro, o que abre espaço para uma articulação com o modelo de
língua da Morfologia Distribuída, com suas listas de Vocabulário, Enciclopédia e
Léxico Estrito. Essa possibilidade será explorada por este projeto.
A proposta igualmente não contempla a questão da aquisição. Pouco é dito
acerca do modo como a criança segmenta o input lingüístico, a fim de reconhecer
porções relativas aos aspectos morfofonológicos (forma lexical) e sintático-semânticos
(lemas) dos itens lexicais, e acerca de como os traços semânticos, sintáticos e
morfofonológicos podem ser adquiridos. Também nada é dito sobre como as relações
entre os itens lexicais são construídas pela criança e sobre o que torna possível para a
criança aprender usar o conhecimento lexical de maneira produtiva, criando novas
palavras à medida que seu conhecimento lingüístico aumenta. Nesse ponto, testes
experimentais com crianças se fazem necessários, uma vez que se pretenda avaliar o
quanto a teoria da Morfologia Distribuída e a proposta de Levelt (1989), Bock & Levelt
(1994) e Levelt et al. (2001) podem servir da base para a elaboração de uma teoria da
aquisição de morfologia em PB.
36
4. Referenciais Experimentais
Os modelos teóricos da Linguística e da Psicolinguística resenhados na seção
anterior apresentam características distintas. Enquanto as propostas sobre o léxico
construídas sob uma perspectiva psicolinguística são sempre fundamentadas em testes
experimentais, os orientados por um ponto de vista linguístico são formulados com base
nas observações particulares que o lingüista faz dos dados de que dispõe. Essa
assimetria acaba por acarretar dificuldades na articulação entre as duas disciplinas, o
que prejudica uma compreensão mais integrada e global de certos fenômenos da
linguagem humana.
Como aponta Kenedy (2009), na história da Linguística apontam-se duas
tradições de análise e tratamento de dados: a análise de corpus e o recurso à intuição do
falante. A análise de corpus é a metodologia típica de correntes como o Estruturalismo e
a Sociolingüística, e apresenta a grande vantagem de permitir a fundamentação de
teorias com base em dados objetivos e quantificáveis, mas, por outro lado, tem a
desvantagem de, do ponto de vista cognitivo, não possibilitar o estabelecimento de
inferências sobre os processos mentais que subjazem à atividade linguística manifesta.
Já o recurso à intuição do falante é característica da abordagem mentalista da teoria
linguística gerativista desde o modelo padrão (Chomsky, 1965). Essa abordagem, que
aproximou a Linguística das chamadas ciências da mente (Gardner, 1985), apresenta a
vantagem de focar justamente dos processos mentais subjacentes ao comportamento
lingüístico observável; no entanto, ao lidar com dados privados e dificilmente
inspecionáveis, como a intuição ou os juízos conscientes sobre essa intuição, apresenta
uma limitação que certamente constitui-se em um problema metodológico da área. Uma
crítica possível a esse modo de se investigar é a circularidade com que, muitas vezes, a
teoria é construída – como, nessa abordagem, a intuição do falante pode ser, muitas
vezes, a intuição do próprio lingüista, tem-se que as intuições justificam a teoria e a
teoria explica as intuições, o que acarreta o surgimento de tantas teorias quantas sejam
as intuições nas quais elas se baseiam. De acordo com Cowart (1997), as análises
tradicionais do gerativismo, fundamentadas apenas em intuições, parecem ignorar a
grande variabilidade dos julgamentos de gramaticalidade dos falantes e não conseguem
assegurar que um julgamento tal ou qual seja desencadeado por algum fenômeno de fato
sintático, e não de outra natureza linguística ou mesmo extralinguística.
37
Como se percebe, ambos os métodos tradicionais de pesquisa em Linguística
apresentam acertos e limitações. Isso é suficiente para que nenhum dos dois seja
inteiramente descartado – o que se tem a fazer é trabalhar com os dois juntos, de forma
que as qualidades de um minorem os defeitos de outro, e vice-versa. Tanto um quanto
outro podem fornecer dados relevantes para uma compreensão mais integrada dos
fenômenos da linguagem humana.
As descrições baseadas em análise de corpus, por exemplo, são úteis na medida
em que evitam a elaboração de análises fundamentadas em um conjunto pequeno de
evidências linguísticas, escolhidas pelo lingüista dentre as que mais se ajustam à sua
proposta, em detrimento de muitas outras que, por não satisfazerem ao que é proposto,
são simplesmente deixadas de lado ou ignoradas. A partir do momento em que se dispõe
de uma grande quantidade de dados descritos e sistematizados, torna-se possível montar
teorias sobre dados mais objetivos e concretos, evitando-se assim uma certa
subjetividade na escolha dos materiais de análise. Perini (2006, 2008) vem apontando a
necessidade de se confiar mais nas descrições, definindo-as como “apresentação
sistemática dos fatos de uma língua”,o que não se confunde, segundo ele, com a
“elaboração e verificação de alguma teoria específica da linguagem”. Também Schülze
(1996) vem propondo uma metodologia de descrição dados lingüísticos a partir da
constatação de que, no gerativismo clássico, a preocupação com os aspectos
metodológicos tem sido negligenciada. Por essas razões é que se pretende, nesse
projeto, trabalhar com a descrição de pontos específicos da morfologia do PB, de modo
a poder melhor fundamentar as propostas teóricas sobre a competência lexical e sua
aquisição.
Ainda, é possível que com o acréscimo de uma terceira metodologia, a
experimental, os resultados obtidos com a análise de corpus e com o recurso à intuição
sejam ainda mais encorpados. O desenvolvimento recente da Psicolinguística
Experimental favoreceu a conciliação entre pesquisas de base empírico-experimental e
trabalhos dedicados ao estudo da linguagem do ponto de vista mentalista. O uso de
metodologia experimental pode, portanto, permitir a discussão de hipóteses sobre
fenômenos lingüísticos, a partir de dados de descrição ou da própria intuição do falante,
com base em evidências empíricas, abrindo espaço para uma discussão mais objetiva
acerca da natureza da linguagem humana como fenômeno cognitivo. Desse ponto de
38
vista, não parece incorreto afirmar que a metodologia experimental é capaz de superar
as limitações da análise de corpus e da intuição do falante, em especial quando se usam
as três, em conjunto.
Com efeito, a abordagem experimental no estudo da linguagem natural humana
vem-se tornando necessária mesmo para os estudos abstratos desenvolvidos no âmbito
da teoria linguística. No contexto de interação entre teoria linguística e psicolinguística
perseguido por este projeto, Corrêa (2005a) aponta que os estudos experimentais da
Psicolinguística podem ser correlacionados à teoria da gramática com o objetivo de
testar a realidade psicológica das abstrações dos linguistas, conferindo validação
empírica a um modelo cognitivo de língua. O presente projeto de pesquisa se insere, por
conseguinte, na linha psicolinguística de estudos experimentais e busca uma articulação
com um modelo de língua construído com base na intuição do falante no objetivo de
discutir a questão do processamento, representação, acesso e aquisição de palavras
morfologicamente complexas em PB.
5. Objetivos
Tendo em vista o exposto nas seções anteriores, no que tange aos aspectos
teóricos e experimentais da pesquisa em Linguística e em Psicolinguística, fixam-se
como objetivos gerais e específicos a serem alcançados pela pesquisa aqui proposta o
que abaixo se segue.
5.1. Objetivos gerais O objetivo geral deste projeto é o de promover uma integração entre teoria
linguística e teoria psicolinguística no estudo da competência lexical dos falantes de PB.
Dessa forma, pretende-se verificar até que ponto uma teoria do léxico proposta por um
modelo formal de língua, como a da Morfologia Distribuída, é passível de ser articulada
com modelos de léxico mental sugeridos no âmbito da Psicolinguística. Para tanto,
deseja-se investigar o processamento e a representação lexical de palavras
morfologicamente complexas, bem como a sua aquisição. Através de métodos
experimentais e de análise de dados de produção, pretende-se avaliar em que medida o
modelo de léxico esboçado pela Morfologia Distribuída pode ser tomado como base
para o entendimento dos fenômenos ligados ao acesso ao léxico mental, além de servir
39
como fundamento teórico para a elucidação de questões relativas à aquisição e
desenvolvimento da morfologia derivacional e flexional em PB.
5.2. Objetivos específicos
Os objetivos específicos previstos por este projeto são apresentados a seguir de
forma aleatória, sem atender a uma ordem de importância entre eles. Esses objetivos
são:
a) Fornecer validação empírica para as propostas de estrutura e funcionamento do léxico
sugeridas pelo modelo teórico da Morfologia Distribuída;
b) Apresentar uma descrição dos processos gramaticais de formação de palavras em PB,
seus mecanismos, características e propriedades, de forma promover um aumento do
conhecimento sobre a morfologia derivacional dessa língua;
c) Prover um modelo teórico integrado do léxico que possibilite a formulação e
testagem de hipóteses sobre os fenômenos de acesso e representação, tanto em termos
do que se exige por uma teoria de língua quanto por uma teoria do processamento
linguístico, valendo-se, para isso, de dados do PB;
d) Prover um modelo integrado do léxico que possibilite a formulação e testagem de
hipóteses sobre a aquisição da morfologia flexional e derivacional em PB, de maneira a
permitir uma compreensão tanto dos fenômenos envolvidos quanto da dinâmica do
processo;
e) Determinar as unidades lexicais de armazenamento e processamento, com vistas a
entender que tipo de informação é estocada no léxico de um falante de PB e como é
usada na produção e compreensão de sentenças e de palavras morfologicamente
complexas nessa língua;
f) Descrever como se acham representadas no léxico de um falante de PB as unidades
lexicais de armazenamento e processamento determinadas no item anterior, de um ponto
de vista da representação de informações relevantes para a derivação linguística e sob a
perspectiva da representação de conhecimentos declarativos sobre os itens lexicais do
PB;
40
g) Explicitar os mecanismos e operações de acesso lexical, tendo em vista recuperação
de formas armazenadas no léxico para a estruturação de palavras morfologicamente
complexas requeridas na formulação de sentenças e na criação de novas palavras.
6. Metodologia
Este projeto prevê a aplicação de dois conjuntos diferentes de paradigmas
experimentais, aplicados a sujeitos adultos e crianças. O primeiro desses conjuntos é o
dos experimentos on-line, os quais permitem captar evidências do processamento
lingüístico no decorrer de tarefas de leitura e escuta de estímulos lingüísticos, ou seja,
concomitantemente ao processamento propriamente dito, sem a intervenção consciente
do sujeito que está sendo testado. Já o segundo conjunto é o formado pelas
metodologias experimentais off-line, as quais atuam após o processamento, no momento
em que outros fatores intervêm (como fatores semânticos, pragmáticos e
extralingüísticos), além do fato de que a própria consciência linguística do sujeito em
teste já se encontrar ativada. Tanto um quanto outro podem ser utilizados na
investigação sobre aspectos do processamento e aquisição da linguagem.
Na investigação sobre o processamento, acesso e representação lexical, pretende-
se aplicar os paradigmas da leitura/escuta automonitorada (self-paced reading/listening)
e o rastreamento ocular (eye-tracking). Além desses, prevê-se o uso de testes
experimentais off-line, tais como da ativação e reativação de itens lexicais (priming) e o
julgamento imediato de gramaticalidade (speeded grammaticality judgment task). Todos
esses são experimentos on-line, e são muito úteis e produtivos especialmente quanto
aplicados em adultos. Já no caso da investigação sobre a aquisição da morfologia
derivacional, os testes a serem empregados seguem os paradigmas da escuta
preferencial (headturn preference procedure), da fixação preferencial do olhar e a tarefa
de seleção de imagem (picture identification task). Essas constituem experimentos off-
line, sendo muito usados em crianças de 12 a 48 meses, ou mesmo mais velhas, numa
fase em que a fala ainda se encontra em desenvolvimento e consolidação. Os
paradigmas experimentais on-line utilizados em crianças em fase inicial de aquisição
são, em sua grande maioria, vinculados ao mapeamento da atividade cerebral durante a
apresentação de um estímulo ou a realização de uma tarefa. Dentre esses pode-se citar a
magnetoencefalografia (MEG), a ressonância magnética funcional (fMRI) e a
41
tomografia por emissão de pósitrons (PET-Scan). Nos experimentos on-line sobre
aquisição previstos por este projeto, pretende-se usar o paradigma da
eletroencefalografia (EEG).
Em um experimento de leitura automonitorada, os sujeitos participantes são
submetidos a estímulos apresentados na tela de um computador. A velocidade de sua
leitura é medida por meio de uma caixa de botões acoplada ao mesmo computador, que
registra o tempo despendido na tarefa. Os estímulos são sempre divididos em alguns
fragmentos, chamados segmentos, de acordo com as variáveis experimentais que estão
sendo manipuladas. O tempo despendido em cada segmento é registrado e gravado por
um programa de computador. Mede-se, então, o tempo médio de leitura de cada
segmento, que é tomado como variável dependente, avaliando-se, assim, o efeito, no
processamento lingüístico, das variáveis independentes manipuladas. No caso de um
experimento que siga o paradigma da escuta automonitorada, o processo é basicamente
o mesmo, alterando-se apenas o tipo de estímulo, que passa a ser frases ouvidas pelo
sujeito por meio de um fone de ouvido. Já o rastreamento ocular vale-se de um tipo de
equipamento, o eye-tracker, que registra tanto o movimento ocular quanto o tempo
médio de pausa de fixação do olhar. Nessa metodologia, os estímulos são apresentados
de forma a poderem ser lidos, com as variáveis independentes incidindo sobre fatores
como estrutura morfológica e sintática, semântica das palavras e da sentença, etc. Por
meio da medida do padrão de movimento ocular ou dos locais onde se dão as pausas do
olhar, além do tempo médio de duração dessas pausas, pode-se obter evidências acerca
do modo como transcorre o processamento morfológico e sintático.
Com as técnicas off-line do priming e do julgamento imediato de gramaticalidade,
é possível verificar como os sujeitos reagem a certos tipos de estímulo linguístico,
elaborados de acordo com as variáveis que se deseja observar. Os testes que se valem do
julgamento de gramaticalidade são bastante simples, consistindo, no mais das vezes, na
apresentação de uma pergunta, a qual deve receber uma resposta objetiva sim ou não,
logo após a leitura ou escuta de uma frase-estímulo. As médias de erros nas respostas
em tarefas desse tipo podem indicar maior dificuldade no processamento de um certo
tipo de estrutura, em relação a outro. Os julgamentos imediatos de gramaticalidade
podem, ainda, medir a aceitabilidade dos falantes a determinados tipos de estrutura.
Nesse tipo de experimento, os sujeitos testados emitem um julgamento do tipo aceitável
42
x inaceitável acerca de um estímulo lingüístico logo após a sua leitura/audição. Testes
como esse se baseiam na intuição linguística do falante sobre a gramaticalidade de
algumas sentenças, e possuem uma ampla tradição nos estudos em teoria linguística
gerativa, ainda que usado de uma forma um tanto diversa, conforme o discutido na
seção 4. Por sua vez, experimentos de ativação/reativação (priming) se prestam a
verificar os fatores (fônicos, morfológicos e semânticos) que induzem facilitação da
recuperação de um item lingüístico no léxico ou na memória de trabalho. Nos
experimentos com essa técnica, um estímulo é rapidamente apresentado ao participante
e, logo após, uma sonda o induz a dizer se determinada palavra ou sintagma estava ou
não presente na frase lida. O priming é especialmente útil em estudos sobre o acesso e
representação lexical.
Para o estudo da aquisição da linguagem, outros modelos experimentais deverão
ser usados. No paradigma da escuta preferencial, o objetivo é registrar a sensibilidade
da criança a um determinado elemento presente no fluxo da fala. Essa técnica parte do
princípio de que a criança volta a cabeça para a direção de onde sons são emitidos e da
idéia de que enquanto a criança permanece com a cabeça voltada para a direção do som,
ela está atenta ao tipo de estímulo que chamou sua atenção. Por essa razão é que
estímulos sonoros são apresentados às crianças em uma cabine acusticamente isolada,
medindo-se o tempo médio durante o qual a criança fica atenta a esse estímulo.
Analogamente, a fixação preferencial do olhar segue princípios parecidos, só que, desta
vez, registra-se o tempo médio em que a criança olha para um estímulo visual
apresentado em uma tela, ao mesmo tempo em que ouve um estímulo sonoro. Tanto um
quanto outro paradigma são usados em bebês e crianças de até 48 meses. Na tarefa de
seleção de imagens, o que é tomado como variável dependente é o tipo de figura para a
qual a criança aponta após ouvir estímulos lingüísticos manipulados de acordo com o
que se deseja averiguar. Essa técnica foi utilizada em estudos sobre a aquisição do
sistema de número gramatical em PB (Ferrari-Neto, 2003, 2008), com resultados
bastante expressivos.
Os testes on-line de mapeamento da atividade cerebral dividem-se em dois grupos
distintos: as hemodinâmicas e as eletromagnéticas. No primeiro, onde estão inseridas a
tomografia por emissão de pósitrons (PET-Scan) e a ressonância magnética funcional
(fMRI), o que é medido é o volume de sangue presente em cada uma área cerebral
43
durante a apresentação de um estímulo ou a execução de uma tarefa. Já o segundo, que
abarca a eletroencefalografia (EEG) e a magnetoencefalografia (MEG), recorre-se ao
nível de atividade elétrica em dadas regiões do córtex cerebral para investigar como se
dá o processamento linguístico em nível cerebral. As técnicas hemodinâmicas são mais
eficientes quando se deseja localizar com precisão que áreas cerebrais estão envolvidas
na realização de tarefas cognitivas, ao passo que as eletromagnéticas são mais
adequadas quando se quer medir o tempo médio de processamento. Para os fins deste
projeto, a opção que se revela mais conforme ao que se pretende pesquisar e o
paradigma da EEG.
Na montagem e aplicação dos experimentos aqui previstos, pretende-se utilizar o
software Psyscope,8 desenvolvido especialmente para a elaboração de testes
experimentais em Psicolinguística por pesquisadores da Universidade de Carnegie
Mellon, sendo sua distribuição gratuita por meio de downloads (permitidos pelos
criadores) na internet. Trata-se de um programa de fácil utilização, que roda em
computadores do tipo Apple-MacIntosh, e que permite o registro preciso do tempo de
reação aos estímulos por parte dos sujeitos participantes dos experimentos. O Psyscope
tem sido usado com grande sucesso nos testes experimentais realizados no LAPROL e
pode ser usado em quaisquer das metodologias experimentais aqui relatadas, razão pela
qual se deseja continuar com sua aplicação.
Registre-se, à guisa de finalização, que o LAPROL dispõe dos computadores
(desktops e notebooks) Apple-MacIntosh necessários para a construção e aplicação dos
testes experimentais ora propostos, além do equipamento de eye-tracker usado no
rastreamento ocular. Está prevista, para breve, a aquisição, conjuntamente com outros
grupos de pesquisa da UFPB, de um equipamento de EEG, que possibilitará a realização
de exames de mapeamento cerebral, igualmente previstos por este projeto. O ambiente
físico do LAPROL permite também a realização de testes off-line de aquisição, como a
seleção de imagens, e o espaço físico requerido para a construção de cabines exigidas
pela metodologia de escuta preferencial e fixação do olhar será disponibilizado, em
breve, pela própria UFPB, cuja previsão orçamentária para o ano de 2011 prevê a
construção de novos espaços para a instalação de laboratórios e equipamentos. 8 O Psyscope foi desenvolvido na década de 90 por Jonathan Cohen, Matthew Flatt, Brian MacWhinney e Jefferson Provost, professores da Universidade de Carnegie Mellon. Para maiores detalhes, acessar o site http://psy.ck.sissa.it/ e no artigo de Cohen J. D., MacWhinney B., Flatt M., & Provost J. (1993).
44
7. Cronograma
Na medida em que este projeto contempla investigações na área de aquisição da
linguagem, a qual recai sobre crianças, processamento lexical (realizada com adultos) e
ainda uma descrição da morfologia do PB (feita com base em dados de produção), são
elaboradas três tabelas cronológicas, respectivas a cada um desses temas. Essas tabelas
são apresentadas a seguir:
Período de Aplicação Primeiro Ano
Primeiro Ano
Segundo Ano
Segundo Ano
Terceiro Ano
Terceiro Ano
Atividades (Processamento) 1o sem. 2o sem. 1o sem. 2º sem. 1º sem. 2º sem.Revisão da literatura XImplementação da infra-estrutura pessoal e material do laboratório
X
Delimitação dos problemas específicos a serem investigados
X
Formulação de Hipóteses sobre as questões de pesquisa
X
Escolha dos paradigmas experimentais e montagem dos experimentos
X X
Aplicação dos Experimentos X XTratamento estatístico dos dados obtidos e análise dos resultados
X
Relatório Parcial X XRedação dos resumos, artigos, texto de comunicações e pôsteres a serem apresentados e publicados.
X X
Período de Aplicação Primeiro Ano
Primeiro Ano
Segundo Ano
Segundo Ano
Terceiro Ano
Terceiro Ano
Atividades (Aquisição) 1o sem. 2o sem. 1o sem. 2º sem. 1º sem. 2º sem.Revisão da literatura XImplementação da infra-estrutura pessoal e material do laboratório
X
Delimitação dos problemas específicos a serem investigados
X
Formulação de Hipóteses sobre as questões de pesquisa
X
Escolha dos paradigmas experimentais e montagem dos experimentos
X X
Aplicação dos Experimentos X XTratamento estatístico dos dados obtidos e análise dos resultados
X X
Relatório Parcial X XRedação dos resumos, artigos, texto de comunicações e pôsteres a serem apresentados e publicados.
X X
45
Período de Aplicação Primeiro Ano
Primeiro Ano
Segundo Ano
Segundo Ano
Terceiro Ano
Terceiro Ano
Atividades (Descrição) 1o sem. 2o sem. 1o sem. 2º sem. 1º sem. 2º sem.Revisão da literatura XImplementação da infra-estrutura pessoal
X
Delimitação dos problemas específicos a serem investigados
X
Formulação de Hipóteses sobre as questões de pesquisa
X
Coleta de Dados por meio de fontes variadas
X X
Organização e sistematização preliminar dos dados coletados
X
Formulação de descrições teóricas dos fenômenos observados nos dados
X
Relatório Parcial XRedação dos resumos, artigos, texto de comunicações e pôsteres a serem apresentados e publicados.
X X X
Redação dos capítulos do livro a ser lançado com base nas descrições realizadas
X X
8. Bibliografia
ANDERSON, S.R. A-Morphous Morphology. Cambridge University Press, 1992.ARONOFF, M. Word Formation in Generative Grammar. Cambridge, Mass: The MIT Press, 1976.BAAYEN, R. H., DIJKSTRA, T. and SCHEREUDER, R. Singulars and Plurals in Dutch: Evidence for a parallel dual route model. Journal of Memory and Language 37, 1997. BASÍLIO, M.M.P. Estruturas Lexicais do Português: Uma Abordagem Gerativa. Petrópolis: Editora Vozes, 1980.BASÍLIO, M.M.P. Formação e Classes de Palavras no Português do Brasil. São Paulo: Editora Contexto, 2008.BASÍLIO, M.M.P. Produtividade, Função e Produção Lexical no Português Falado. In: IX Congresso Internacional da ALFAL. Campinas, UNICAMP, 1990.BASÍLIO, M.M.P. Teoria Lexical. São Paulo: Editora Ática, 1987.BOCK, J.K. & LEVELT, W.J.M. Language Production: Grammatical Encoding. In: GERNSBACHER, M.A. (ed.) Handbook of Psycholinguistics. San Diego: Academic Press, 1994.BUTTERWORTH, B. Lexical Representation. In: BUTTERWORTH, B. (org.) Language Production-Development, Writing and Other Language Processes. London, Academic Press, v.2, 1983CAMARA JR. J.M. Estrutura da Língua Portuguesa. Petrópolis: Editora Vozes, 1970.CARAMAZZA, A., LAUDANI, A., ROMANI, C. Lexical Access and Inflectional Morphology. Cognition, nº 28, 1988
46
CHOMSKY, N. Aspects of The Theory of Syntax. Cambridge, Mass.: The MIT Press, 1965.CHOMSKY, N. Remarks on Nominalization. In: JACOBS, R.A. & ROSEMBAUM, P. (eds.). Readings in English Transformational Grammar. Ginn and Company, 1970.CHOMSKY, N. The minimalist program. Cambridge, Mass.: The MIT Press, 1995.COLÉ, Pascale; SEGUI, Juan & TAFT, Marcus. Words and Morphemes as Units for Lexical Access. Journal of Memory and Language, 37, 1997.CORRÊA, L. M. S. Conciliando processamento lingüístico e teoria de língua no estudo da Aquisição da Linguagem. In: CORRÊA, L. M. S. (Org.). Aquisição da Linguagem e Problemas do Desenvolvimento Lingüístico. Rio de Janeiro: Editora da PUC-Rio/Ediçoes Loyola, 2006CORRÊA, L. M. S. Explorando a relação entre língua e cognição na interface: o conceito de interpretabilidade e suas implicações para teorias do processamento e da aquisição da linguagem. Veredas (UFJF), Juiz de Fora, v. 6, 2002.CORRÊA, L. M. S. Possíveis diálogos entre Teoria Lingüística e Psicolingüística: questões de processamento, aquisição e do Déficit Específico da Linguagem. In: N. MIRANDA; NAME, M.C.L. (Orgs.). Lingüística e Cognição. Juiz de Fora: Editora da UFJF, 2005aCORRÊA, L. M. S. Questões de concordância: Uma abordagem integrada para processamento, aquisição e o Déficit Específico da Linguagem. Lingüística, Rio de Janeiro, v. 1, n. 1, 2005bCORRÊA, L. M. S. Uma hipótese para a relação entre processador lingüístico e gramática numa perspectiva minimalista. In: Anais do IV Congresso Internacional da ABRALIN, Brasília, 2005b.CORRÊA, L. M. S. AUGUSTO, M. R. A. Computação lingüística no processamento on-line: soluções formais para a incorporação de uma derivação minimalista em modelos de processamento. Cadernos de Estudos Lingüísticos (UNICAMP), v. 49, 2007.COWART, W. Experimental syntax: applying objective methods to sentence judgments. London: Sage Publications, 1997.DI SCIULLO, A.M. & WILLIAMS, E., On the Definition of Word. Cambridge, Mass: The MIT Press, 1987.EMMOREY, K.D. & FROMKIN, V.A. The Mental Lexicon. In: F.J. NEWMEYER, F.J. Language: Psychological and Biological Aspects. Cambridge, Cambridge University Press, 1988.FIGUEIRA, R.A. A Aquisição dos Verbos Prefixados por Des- em Português. PaLavra, nº 5, 1999.FRANÇA, A.I., LEMLE, M., GESUALDI, A.R., CAGY, M. & INFANTOSI, A.F.C. A Neurofisiologia do Acesso Lexical: Palavras em Português. Veredas On-Line – Psicolinguística, nº 2/2008, UFJF: Juiz de Fora, 2008.GARDNER, H. The mind's new science: A history of the cognitive revolution. New York: Basic Books, 1985.GOMES, C.A. & MANOEL, C.G. Flexão de número na gramática da criança e na gramática do adulto. Veredas On Line, Atemática, nº 1/2010, Linguística/UFJF – Juiz de Fora, 2010HALLE, M. e A. MARANTZ. 1993. Distributed Morphology and the Pieces of Inflection. In: Hale, K. & S. J. Keyser. The View from Building 20, 111-176. Cambridge, Mass.: MIT Press. HALLE, M. e MARANTZ, A . Some Key Features of Distributed Morphology. MITWPL, 21, 275-288, 1994.
47
HALLE, M. Prolegomena to a Theory of Word Formation. Linguistics Inquiry, 4, p. 3-16, 1973.HARLEY, H. e R. NOYER. Distributed Morphology. Glot International 4.4: 1999. JACKENDOFF, R. Morphological and Semantic Regularities in The Lexicon. Language, 51, 1975. KENEDY, E. Análise de corpus, a intuição do lingüista e metodologia experimental na pesquisa sobre as orações relativas do PB e do PE. Linguística (Rio de Janeiro), v. 4, 2009.LAINE, M.,VAINIO S. & HYONA, J. Lexical Access Routes in a Morphologically Rich Language. Journal of Memory and Language, 40, 1999.LEVELT, W. J. M. Speaking: From Intention to Articulation. Cambridge, Mass: MIT Press, 1989LEVELT, W.J.M., ROELOFS, A. & MEYER, A.S. A Theory of Lexical Access in Speech Production. Behavioral and Brain Sciences, 22. Disponível em http://www.bbsonline.org/documents/a/00/00/05/06, 2001LIMA. P.A.N. Morfemas Derivacionais e Compostos do Português Brasileiro na Fala de Crianças de Dois a Sete Anos de Idade. Dissertação de Mestrado. Porto Alegre, UFRGS, 2006.LORANDI, A. & LAMPRECHT, R. Formas Morfológicas Variantes na Gramática Infantil: Um Estudo à Luz da Teoria da Otimalidade. Disponível em http://www.pucrs.br/edipucrs/online/IIImostra/Letras/, 2008MAIA, M. & FINGER, I. Processamento da Linguagem. Pelotas: Educat, 2005.MARSLEN-WILSON, W. & ZHOU, X. Abstractness, Allomorphy and Lexical Architecture. Language ans Cognitive Processes, nº 14, v. 4, 1999.MATEUS, M. M. et al. Gramática da língua portuguesa. Lisboa: Caminho, 2003.MIMOUNI, Z., KEHAYIA,E. & JAREMA,G. The Mental Representation of Singular and Plurals Nouns in Algerian Arabic as Revealed Through Auditory Priming in Agrmamatic Aphasic Patiens. Brain and Language,61, 1998.MITCHELL, D. C. On-line Methods in Language Processing. In M. Carreiras & C. Clifton, Jr. (Eds). The on-line study of sentence comprehension: Eyetracking, ERPs and beyond. New York, NY: Psychology Press, 2004. pp. 15-32. NAME, M.C.L. & CORRÊA, L.M.S. Explorando a escuta, o olhar e o processamento sintático: metodologia experimental para o estudo da aquisição da língua materna em fase inicial. In: CORREA. L.M.S. Aquisição da Linguagem e Problemas do Desenvolvimento Linguístico. Rio de Janeiro: Editora PUC-Rio, 2006.PERINI, M.A. Estudos de Gramática Descritiva. São Paulo: Parábola Editorial, 2008.PERINI, M.A. Princípios de Linguística Descritiva. São Paulo: Parábola Editorial, 2005.PFAU, R. Grammar as Processor: A Distributed Morphology Account of Spontaneous Speech Errors. Amsterdam, Philadelphia: Johns Benjamins, 2009.PHILLIPS, C. Linguistics and Linking Problems. In: RICE, M. & WARREN, W. (eds.) Developmental Language Disorders: From Phenotypes to Etiologies. Mahwah, N.J. Lawrence Eribaum, 1996.ROCHA, L.C.A. Estruturas Morfológicas do Português. Belo Horizonte: Editora da UFMG, 1999.SANDMANN, A. Formação de Palavras no Português Brasileiro Contemporâneo. Curitiba: Cone Editora, 1989.SANDMANN, A. Morfologia Geral. São Paulo: Editora Contexto, 1991.SANDMANN, A. Morfologia Lexical. São Paulo: Editora Contexto, 1992.
48
SCHÜLZE, C.T. The Empirical Basis of Linguistics: Grammaticality Judgements ans Linguistic Methodology. Chicago: University of Chicago Press, 1996.SCLIAR-CABRAL, L. & MACWHINNEY, B. Aquisição da Morfologia Verbal no PB. Disponível em http://www.mundoalfal.org/cdcongreso/cd/psicolinguistica/scliar.swf, 2008SEKERINA, I.A., FERNANDÉZ, E. & CLAHSEN, H., Developmental Psycholinguistics: On-line Methods in Language Acquisition Processing. Amsterdam, Philadelphia: John Benjamins Editors, 2008.SPROUSE, J. A Program for Experimental Syntax: Finding the relationship between acceptability and grammatical knowledge. University of Maryland, 2007. (Doctoral Dissertation)TAFT, M. & FORSTER, K.I. Lexical Storage ans Retrieval of Prefixed Words. In: Journal of Verbal Learning and Verbal Behavior, 14, 1975.TAFT, M. Interactive Activation as Framework for Understanding Morphological Processing. In: Language and Cognitive Processes, Special Issue, 1994.TYLER, L.K., WAKSLER, R., MARSLEN-WILSON, W. Representation and Access of Derived Words in English. The Second Sperlonga Meeting, 1993.VOTRE, S. & RONCARATI, C. (orgs.) Anthony Julius Naro e a Linguística no Brasil: uma homenagem acadêmica. RJ, 7Letras: 2008.
9. Resultados esperados
No decorrer do período previsto de aplicação deste projeto são esperados os
seguintes resultados:
Primeiro Ano
Orientação de alunos de Iniciação Científica;
Orientação de alunos de Mestrado;
Submissão dos resultados parciais da pesquisa a eventos científicos nacionais
e/ou internacionais, sob a forma de palestras, comunicações, pôsteres e mesas-
redondas, com respectiva publicação nas atas e resumos do evento em questão;
Produção de 03 (três) artigos científicos, os quais contemplarão,
respectivamente, a descrição de aspectos da morfologia do PB, a aquisição da
morfologia derivacional e o processamento de palavras morfologicamente
complexas em PB, sendo todos submetidos à publicação em revistas na área de
Letras/ Linguística, preferencialmente com Qualis da Capes nível A ou B.
Segundo Ano
Conclusão das orientações de Iniciação Científica iniciadas anteriormente e
início de novas orientações dessa categoria;
49
Conclusão das orientações de Mestrado iniciadas anteriormente e início de novas
orientações dessa categoria;
Submissão dos resultados parciais da pesquisa a eventos científicos nacionais
e/ou internacionais, sob a forma de palestras, comunicações, pôsteres e mesas-
redondas, apresentados em regime de co-autoria com os alunos de Iniciação
Científica e Mestrado, com respectiva publicação nas atas e resumos do evento
em questão;
Produção de outros 03 (três) artigos científicos, os quais novamente
contemplarão, respectivamente, a descrição de aspectos da morfologia do PB, a
aquisição da morfologia derivacional e o processamento de palavras
morfologicamente complexas em PB, sendo todos submetidos à publicação em
revistas na área de Letras/ Linguística, preferencialmente com Qualis da Capes
nível A ou B.
Terceiro Ano
Conclusão das orientações de Iniciação Científica iniciadas anteriormente e
início de novas orientações dessa categoria;
Conclusão das orientações de Mestrado iniciadas anteriormente e início de novas
orientações dessa categoria;
Orientação de alunos de doutorado;
Submissão dos resultados parciais da pesquisa a eventos científicos nacionais
e/ou internacionais, sob a forma de palestras, comunicações, pôsteres e mesas-
redondas, apresentados em regime de co-autoria com os alunos de Iniciação
Científica e Mestrado, com respectiva publicação nas atas e resumos do evento
em questão;
Produção de 03 (três) artigos científicos, em co-autoria com orientandos, com a
descrição dos resultados parciais dos subtópicos de pesquisa dos alunos, a serem
enviados para publicação em revista na área de Letras em Linguística com
Qualis da Capes nível A e B;
Produção de um livro sobre a descrição da morfologia derivacional do PB, a ser
enviado para publicação em editora de grande circulação nas áreas de Letras/
Linguística;
10. Cronograma Financeiro
50
Itens de Despesa
Descrição Especificação
Valor Unitário
QuantidadePrevista
ValorTotal
Custeio
Material de Escritório
Papel A4 Report1
R$ 12,00 36 resmas c/500 fls.
R$ 432,00
Cartucho de Tinta InkJet
Preto1R$ 59,90
12 unidades de 16 ml R$ 718,80
Cartucho de Tinta InkJet Colorido1
R$ 79,0012 unidades
de 16 ml R$ 948,00
Outrositens de
consumo
Prestação de Serviços Técnicos2
- - R$ 1.500,00
Passagense
Diárias3R$ 187,83 24 diárias R$ 4.507,92
Subtotal R$ 8.106,72
Capital Equipamentos
Notebook Apple
Macbook Intel
DuoCore 2,4 GHz e 2GB DDR4
R$ 3.199,00 1 aparelho R$ 3.199,00
Desktop PC Dell
Inspiron 2,7 GHz e 2
GB5
R$ 1.580,00 1 aparelho R$ 1.580,00
Impressora Multifuncio-nal Cânon
Pixma MP1406
R$ 350,00 1 aparelho R$ 350,00
Monitor LCD 19”
widescreen 917SW AOC 7
R$ 599,00 2 unidades R$ 1.198,00
TV 29” Tela Plana
CCER$ 669,00 1 aparelho R$ 669,00
Filmadora Digital
Flash F4000 Samsung 8
R$ 1.000,00 1 aparelho R$ 1.000,00
MaterialBibliográfico
LivrosCientíficos eTécnicos 9
R$ 3.800,00
Subtotal R$ 11.796,00
51
Total R$ 19.902,72
1 cotado no site www.twenga.com, em 03/06/20102 estimativa para o período de aplicação do projeto3 estimado de acordo com a Tabelas de Valores de Diárias para Auxílios Individuais e Bolsas de Curta Duração do CNPQ4 cotado no site www.store.apple.com em 03/06/20105 cotado no site www.dell.com em 03/06/20106 cotado no site www.submarino.com.br em 03/06/20107 cotado no site www.submarino.com.br em 03/06/20108 cotado no site www.submarino.com.br em 03/06/20109 estimativa para o período de aplicação do projeto
52