a composição de um banco com dados de variação: transcrição e armazenamento dermeval da hora...

36
A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) [email protected]

Upload: eric-alcaide-figueiroa

Post on 07-Apr-2016

212 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

A composição de um banco com dados de variação:

transcrição e armazenamento

Dermeval da Hora (UFPB/CNPq)[email protected]

Page 2: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Linguística

Meta: determinar as propriedades das línguas naturais.

Objetivo: examinar línguas específicas com o propósito de explicar por que elas são do jeito que são.

Linguística Formal: focaliza a estrutura da língua, sem preocupar-se com o contexto em que ela é adquirida nem com o uso.

Page 3: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

SociolinguísticaDefende que a língua existe no contexto, depende

do falante que a usa e onde está sendo usada e por quê.

Definições:- Estudo da língua em seu contexto social e o

estudo da vida social através da linguística (Coupland e Jaworski, 1997)

- A relação entre a língua e a sociedade (Trudgill, 2000)

- A correlação das variáveis dependentes com as variáveis sociais independentes (Chambers, 2003)

Page 4: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Sociolinguística Variacionista

Integra aspectos linguísticos e sociais da língua.

Caracteria a natureza do complexo sistema linguístico, considerando os aspectos variáveis.

Page 5: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Heterogeneidade Ordenada

Observação: a língua varia (heterogeneidade)

Falantes têm mais de uma forma para dizer mais ou menos a mesma coisa.

A heterogeneidade:- não é aleatória, obedece a um padrão;- reflete ordem e estrutura dentro da

gramática.

Page 6: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Variação e Mudança

A análise da variação objetiva colocar os traços linguísticos tais como são no contexto de onde cada um deles veio e para onde está indo – como e por quê.

Toda mudança é resultado de um processo de variação, mas nem toda variação resulta em mudança.

Page 7: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Identidade Social

A língua transmite informações de uma pessoa para outra, mas, ao mesmo tempo, um falante pode usá-la para estabelecer valores acerca da pessoa que está sendo ouvida. Pode determinar:

- Quem é a pessoa?- De onde veio?- A que grupo social pertence?- Qual o nível de escolaridade?

Page 8: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Características chaves da Sociolinguística Variacionista

O Vernacular- estilo em que a mínima atenção é dada ao

monitoramento da fala (Labov, 1972).- fala diária (Sankoff, 1974, 1980).- língua real em uso (Milroy, 1992).- fala espontânea reservada a situações

intímas ou casuais (Poplack, 1993)

Page 9: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Por que o vernacular?- Por ser a variedade que foi adquira

primeiro;- Porque é a variedade de fala mais livre de

hipercorreção ou mudança de estilo;- Porque é o estilo a partir do qual todos os

outros devem basear-se.O vernacular fornece “as relações

fundamentais que determinam o curso da evolução linguística” (Labov, 1984)

Page 10: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Comunidade Linguística

Page 11: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Assimetria Forma/Função

A análise variacionista defende que diferentes formas podem ser usadas para a mesma função.

Podemos dizer a mesma coisa de diferentes formas com o mesmo valor de verdade.

Page 12: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Variáveis Linguísticas

Diferentes formas de dizer mais ou menos a mesma coisa pode ocorrer em todos os níveis da gramática de uma língua, em todas as variedades, em todos os estilos, dialetos e registros.

a) Fonologia;b) Morfologia;c) Sintaxe

Page 13: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

O método quantitativoAbordagem utilizada na análise variacionista,

diferente de outras áreas da linguística.Combinação de técnicas empregadas na análise

variacionista.Baseia-se na observação de que o falante faz

escolhas quando usa a língua e que essas escolhas são alternativas discretas com o mesmo valor referencial ou função gramatical. Essas escolhas variam de forma sistemática e podem ser modelas quantitativamente.

Page 14: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

O método quantitativo

A vantagem da abordagem quantitativa está em sua habilidade para:

- modelar os fatores simultâneos e multidimensionais que têm impacto sobre as escolhas do falante;

- identificar tendências gramaticais e regularidades nos dados;

- avaliar sua relativa força e significância.

Page 15: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

O princípio da Explicabilidade

Toda variante que é parte do contexto variável, se ela é um elemento realizado ou não no sistema, deve ser explicada.

Page 16: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Circunscrevendo o Contexto Variável

Como o analista determina as variantes de uma variável e os contextos em que elas variam?

1) Identificar a população total de enunciados em que o traço varia. Excluir contextos onde uma variante é categórica.

2) Decidir quantas variantes podem ser identificadas.

3) Identificar todas as subcategorias (fatores) que seriam relevantes para determinar a frequência das fromas.

Page 17: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Por que usar análise variacionista?

- É uma área da disciplina que envolve língua “real”, como está sendo usada;

- Ela emprega uma metodologia que é explicável pelos dados;

- Ela fornece mecanismos para analisar a língua, não simplesmente com base em si mesma, mas no nível do sistema subjacente;

- Coloca a língua no contexto, socialmente, linguisticamente, sincronicamente e diacronicamente.

Page 18: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Dados, dados e mais dados

Que você faz com seus dados, uma vez coletados?

Page 19: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

O “corpus”

Componentes de um “corpus”:- gravações, fitas...- relatos de entrevistas- arquivos de transcrição- protocolo de transcrição- arquivos para análise

Page 20: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Transcrição dos dados

A transcrição dever ser:- detalhada o suficiente para reter

informação que possibilite uma análise linguística de forma eficiente;

- simples o suficiente para ser facilmente lida e relativamente transcrita com facilidade.

Page 21: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

O protocolo de transcrição

O principal desafio é assegurar que os dados de fala gravados sejam representados fielmente e consistentemente. A transcrição deve revelar o que a pessoa disse sem considerar se o que foi dito segue ou não as regras da língua padrão. Ou seja, não deve haver edição com modificações da língua em sua gravação. Deve-se respeitar tudo que foi dito.

Page 22: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

O protocolo de transcrição

O protocolo de transcrição é um documento de prática de transcrição. Ele assegura a representação consistente de palavras, frases, traços do discurso natural e traços específicos dos dados.

Page 23: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

A variável linguística

Como encontrar uma variável linguística?

Page 24: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Definindo a variável linguística

A definição de uma variável linguística é o primeiro e o último passo na análise da variação. Começa com o simples ato de observar uma variação – que há duas ou mais formas alternativas de dizer a mesma coisa.

Page 25: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Definindo a variável linguísticaFonologia – a variável linguística é relativamente direta. As

variantes podem diferir por um ou dois traços fonológicos.

Ex.: po[h]ta x po[s]taMorfossintaxe – a alternância pode envolver flexões

variáveis, itens lexicais alternantes, diferenças sintáticas que surgem no curso de derivação da sentença.

Ex.: Os meninos... x Os menino...Sintaxe/Semântica – há ou não duas formas de dizer a

mesma coisa,quando se trata de aspectos sintáticos e semânticos?

Ex.: O menino comprou o livro... O livro foi comprado pelo menino...

Page 26: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Projeto VALPBIniciado em 1993, o Projeto Variação Lingüística no Estado

da Paraíba (VALPB) representa uma proposta de pesquisar a realidade lingüística da comunidade de João Pessoa, tendo em vista os seguintes objetivos:- traçar o perfil lingüístico, em nível fonético-fonológico e grama-tical dos falantes da comunidade de João Pessoa, observando fatores estruturais e sociais que interferem no uso da língua;- desenvolver estudos, em nível fonético-fonológico e gramatical, visando a subsidiar o ensino da Língua Portuguesa em todos os níveis;- estabelecer comparações, em nível regional e nacional, com estudos realizados, salientando as divergências dialetais e as semelhanças.

Page 27: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Projeto VALPB• A metodologia utilizada na constituição do

corpus é a utilizada pelos trabalhos de Sociolingüística que se baseiam na perspectiva variacionista. Utilizando a técnica de amostra aleatória por área, foram selecionados 60 (sessenta) informantes, com base nos seguintes requisitos:

• - ser natural de João Pessoa ou morar nessa cidade desde os cincos anos de idade;- nunca ter-se ausentado de João Pessoa por mais do que dois anos consecutivos.

Page 28: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Projeto VALPBA partir dos critérios mencionados, foram

selecionados os 60 (sessenta) informantes que comporiam a amostragem que constitui o corpus do VALPB, assim estratificada:

• 1) Sexo:Masculino 30 informantesFeminino 30 informantes

•2) Faixa Etária:15 a 25 anos 20 informantes26 a 49 anos 20 informantesmais de 50 anos 20 informantes

Page 29: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Projeto Valpb

3) Anos de escolarização:Nenhum 12 informantes1 a 4 anos 12 informantes5 a 8 anos 12 informantes9 a 11 anos 12 informantesmais de 11 anos 12 informantes

Page 30: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Protocolo de Transcrição do VALPB

Na transcrição dos dados foram utilizadas as normas apresentadas a seguir:

• 1) Pausas e interrupções: +• 2) Dúvida quanto à palavra: a palavra sob

dúvida está entre colchetes angulares < >Ex.: Ele <andava> muito.

• 3) Cruzamento de vozes: os enunciados pronunciados por dois falantes ao mesmo tempo são sublinhados.Ex.: Que legal!

Page 31: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Protocolo de Transcrição do VALPB

• 4) Pontuação:• 4.1 ponto de interrogação nas frase interrogativas e o de

exclamação em frases exclamativas são mantidos.Ex.: Aí, eu falei: que bom! Então ele perguntou: - onde você estava?

• 4.2 os outros sinais de pontuação também são mantidos.• 5) Alongamento de vogal: após a vogal alongadas são colocados

dois pontos.Ex.: Ele gostava, e co:mo gostava!

• 6) Silabação: para indicar a silabação é colocado o hífen no meio da palavra.Ex.: ca-fé, ca-mi-nha-da etc.

• 7) Repetições: letras ou sílabas repetidas são transcritas.Ex.: Aí, e e ele foi pra casa de de Carlos.

Page 32: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Protocolo de Transcrição do VALPB

• 8) Palavra incompleta: a palavra repetida está entre colchetes [ ].Ex.: Ele comprou um [carr], uma bicicleta.

• 9) Comentários do transcritor: atitudes não lingüísticas do informante estão entre parênteses.Ex.: Ele gosta de mim (risos).

• 10) Intrusão de outro informantes: o comentário está entre barras / /.Ex.: F1 Ah, eu acho isso muito bom, /ah, eu também acho/ mas meu pai não gosta.

• 11) Palavra ou trecho ininteligível: comentário está entre chaves { }.Ex.: Maria queria comprar {inint}, a mãe dela falou que não queria.

Page 33: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Protocolo de Transcrição do VALPB

• Na transcrição dos dados, foram mantidos:• a) Os apagamentos: no lugar do segmento apagado

consta zero .Ex.: ´mesmo´ = meOmo, ´brincando´ = brincanOo, ´rapaz´ = rapayO etc.

• b) Ausência de marca de concordância: também foi colocado zero .Ex.: ´As casas bonitas´= As casaO bonitaO...

• c) Itens lexicais que fazem parte da fala coloquial são mantidos.Ex.: vixi, num, cum, ni, vissi etc.

• d) Segmentos epentéticos são colocados.Ex.: Luyz, fayz, avoar, cawso etc. Quando a inserção for de glide, aparece "y" ou "w".

Page 34: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

Protocolo de Transcrição do VALPB

• e) Casos de apagamento silábico são mantidos.Ex.: tava, ta etc.

• f) As monotongações são transcritas.Ex.: ´O rapaz roubou o ouro´ = O rapaz robô o oro. O acento dever colocado para evitar ambigüidade com outra forma existente, caso " roubo" .

Page 35: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

VALTINS• ; simbologia

• I. ;1,2,3,4 (para, pra, pa, juntura..., respectivamente)• II. ; b (baixa,m (média) ,g (grande) - escolaridade • III. ;h (homem) e m (mulher) - sexo • IV. ;j,a,v – (jovem, adulto, velho)• V. ;l (labiais = m,p,b,f,v)• ;c (coronal = r (vibrante),l,n,t,d,s, z, j, nh,lh, ch)• ;d (dorsal = (k ©), g, r (arrasta na garganta)g com som de j é coronal• ;b (vogal baixa = a)• ;e (vogais anteriores = e, i)• ;o (vogais posteriores = o, u)• ;# (pausa)• VI. ;p,n (presenca ou ausência de vibrante na palavra seguinte)• VII. ;x,y (presença ou ausência de paralelismo formal)• VIII. Informante (1,2,3,4,5,6,7,8,9,0,a,b,c,...etc)

Page 36: A composição de um banco com dados de variação: transcrição e armazenamento Dermeval da Hora (UFPB/CNPq) ho_ra@hotmail.com

VALTINS• Informante 1

• (3hjblny1 eu fui pa fazê uma prova (0.20)• (3hjbcny1 alguns amigos pa nóis (3.33)• (3hjbcny1 pa dizê que ela (7.15)• (4hjblny1 pru meu irmão (7.18)• (2hjblny1 falô pra mim (7.26)• (2hjblny1 ia comprá pra mim (7.32)• (2hjblny1 comprô uma pra mim (7.35)