-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
CADERNO DE APOIO
ATIVIDADE 2
AS LINGUAGENS DOCUMENTAIS
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
2
Caderno de apoio atividade 2
ndice
I - As linguagens documentais
Breve apontamento histrico 6
Tipologia das linguagens documentais 9
Qual a necessidade de utilizar e desenvolver linguagens documentais? 11
Controlo do vocabulrio 11 o Sinonmia 12 o Polissemia 12 o Homonmia 12 o Singular e plural 12 o Controlo formal 13 o Controlo semntico 13
As relaes semnticas 14 o Relaes de equivalncia 14 o Relaes hierrquicas 15 o Relaes associativas 16
II Os tesauros 17
Funes do tesauro 19
Composio do tesauro 19
Normas de apresentao dos descritores 20
Formas de apresentao dos descritores 23 o Apresentao alfabtica 23 o Apresentao sistemtica 24
Domnios 25 Facetas 25 Combinao dos dois tipos 25
o Apresentao grfica 25 Estrutura arborescente 25 Esquema em flecha 25
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
3
III EUROVOC 27
Historial 27
o Evoluo do EUROVOC 28 o Concluses 28
Estrutura 29 o Domnios 29 o Microtesauros 30 o Relaes semnticas 30
Caractersticas quantitativas 31
Apresentaes impressas 31 o Conselhos de utilizao 32 o Na prtica a indexao realiza-se da seguinte forma 32 o A representao dos conceitos 34 o A seletividade da indexao 35 o A exaustividade condicionada 35 o Taxa de recuperao e de preciso 36 o A especificidade da indexao 36 o Indexao hierrquica 37
Conselhos para a formulao de questes 38
Vantagens e limitaes da utilizao do EUROVOC na indexao 40
Preenchimento do Bloco 6 Assuntos do UNIMARC Bibliogrfico 41
IV Classificao Decimal Universal 43
Antecedentes histricos 43 Caractersticas do sistema 44
o Classificao 44 o Decimal 46 o Universal 46 o Princpios fundamentais 47 o Termos simples e termos compostos 48
Flexibilidade do sistema 48
Ordem de citao 49
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
4
Anlise do tema 54
Estrutura da CDU 55 o Tabelas auxiliares 56
Seco I sinais e subdivises auxiliares comuns 57
Tabela 1 a. Adio. Extenso 57
Tabela 1 b. Relao. Subagrupamento. Fixao da ordem 58
Tabela 1 c. Auxiliares comuns de lngua 59
Tabela 1 d. Auxiliares comuns de forma 60
Tabela 1 e. Auxiliares comuns de lugar 61
Tabela 1 f. Auxiliares comuns de raa, grupo tnico e nacionalidade 62
Tabela 1 g. Auxiliares comuns de tempo 62
Tabela 1 h. Notaes que no pertencem CDU 63
Tabela 1 k. Auxiliares comuns de caractersticas gerais (propriedade,
materiais, pessoas e
caractersticas pessoais) 65
Seco II Auxiliares especiais 67 Tabelas principais 67
Tabela 0 68
Tabela 1 70
Tabela 2 70
Tabela 3 71
Tabela 4 72
Tabela 5 72
Tabela 6 73
Tabela 7 74
Tabela 8 75
Tabela 9 77
Terminologia da CDU 79
Vantagens e desvantagens da utilizao da CDU na indexao 80
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
5
Preenchimento do campo 675 no Bloco 6 Assuntos do UNIMARC Bibliogrfico 81
Bibliografia 82
Anexo A 84
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
6
I - As linguagens documentais
No tpico 1 demos uma primeira definio de linguagem documental como
sendo uma linguagem artificial, convencional e controlada, utilizada para
descrever o contedo dos documentos, possibilitando o arquivamento da
informao e posterior recuperao. Salientemos agora as trs
caractersticas dessas linguagens:
artificiais
controladas
convencionais
1. Artificial porque utiliza signos alfabticos ou numricos para representarem conceitos segundo regras prprias e
dentro de um contexto restrito.
2. Controladas porque foram desenvolvidas, precisamente, para permitirem a representao de um conceito de forma
unvoca, recorrendo sempre ao mesmo termo de indexao,
de modo a que a ambiguidade seja minimizada ou mesmo
anulada. A ambiguidade surge quando uma palavra pode
designar indiferentemente diversos objetos distintos. Por
exemplo: Seminrio (religioso) e Seminrio (reunio de
estudo).
3. Convencionais porque utilizam signos ou cdigos (alfabticos, numricos ou alfanumricos) cuja utilidade
reside na univocidade de contedo. O que s possvel,
respeitando as normas e o corpo de regras subjacentes que
permitem efetivar a cooperao entre bibliotecas, ou seja, a
troca de dados bibliogrficos.
Breve apontamento histrico
As primeiras linguagens documentais a serem desenvolvidas foram as
classificaes universais de carter enciclopdico (abarcavam todas as
reas do conhecimento humano) e datam dos finais do sculo XIX.
Destacamos a Classificao Decimal de Dewey e a Classificao Decimal
Universal que so, como refere Lusa Santos (2007:50), ainda hoje
importantes instrumentos de organizao e de representao dos contedos
temticos existentes e /ou disponibilizados pelas bibliotecas (),
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
7
adequavam-se no s representao, numa linguagem uniforme, dos
principais assuntos dos documentos, mas tambm sua organizao fsica
nas estantes e salas das bibliotecas, de acordo com as vrias temticas. So
ambas classificaes de tipo hierrquico, que tm subjacente uma
organizao sistemtica do conhecimento cuja estrutura reflete a poca em
que foram concebidas. A mesma autora considera ainda que existem
algumas diferenas fundamentais que distinguem estas duas classificaes,
entre as quais o facto da CDD ter mantido uma caracterstica
marcadamente enumerativa e a CDU, trs vezes maior que a CDD, ter
evoludo como uma classificao sinttica (SLAVIC, 2000:3), com
evidentes vantagens a nvel de cobertura de assuntos (em nmero ilimitado)
e da sua combinao. Esta caracterstica confere-lhe tambm um maior
suporte a nvel das ferramentas da gesto documental (SLAVIC, 2000:7).
A cadeia notacional que construmos quando classificamos um assunto
(com base nas tabelas principais, para as classes e subclasses e nas tabelas
auxiliares, para os auxiliares comuns) corresponde, na realidade, a um
termo de indexao pr-coordenado, em que cada elemento, tem o mesmo
significado quer se encontre isolado, quer conste de uma qualquer
combinao.
As classificaes podem ser tipificadas quanto abrangncia temtica
(universais, gerais ou especializadas) e quanto organizao e estrutura
(enumerativas, hierrquicas, de facetas). Seguem os princpios da pr-
coordenao.
As linguagens vocabulares ou terminolgicas, tambm designadas por
combinatrias (porque combinam os termos de indexao) surgem,
igualmente, nos finais do sculo XIX, com a utilizao da primeira lista de
cabealhos de assunto ou lista de encabeamento de matrias. A mais
conhecida destas linguagens a LCSH Library of Congress Subject
Headings, que inspirou diretamente outras do mesmo tipo, como a do
Rpertoire de vedettes-matire (RVM) da Biblioteca de Laval (Qubec,
Canad) e a linguagem Rameau dela derivada, alm de ter servido tambm
de base conceptual do SIPORbase Sistema de Indexao em Portugus
(SANTOS, 2000:54). Seguem os princpios da pr-coordenao, da
especificidade e da entrada direta.
Os tesauros (linguagens vocabulares) aparecem apenas no sculo XX
(1958) e como considera Lusa Santos (2000:52), uma vez que utilizavam
uma linguagem controlada mais prxima da linguagem natural,
terminolgica e no notacional ou simblica, pareciam mais prximos de
satisfazer as necessidades crescentes de informao por permitirem um
tratamento dos contedos temticos de um modo mais especfico, ao nvel
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
8
do conceito, sem que se perdesse a rede de relaes semnticas do termo
correspondente ao conceito por ele representado. Pretendem responder s
necessidades impostas pela exploso documental verificada e ao advento da
informatizao documental. A sua aplicao adequava-se a reas
especializadas, eram mais fceis de utilizar, exigiam menos tempo ao
indexador na representao dos assuntos, e eram mais rpidos na
recuperao da informao, j que a informtica respondia bem. Seguem os
princpios da ps-coordenao.
Os cabealhos de assunto so linguagens terminolgicas muito
dispendiosas para os servios, pois exigem muito tempo por parte do
indexador na representao dos assuntos (mas garantem a integridade e a
especificidade da informao), possibilitam uma maior preciso na
descrio dos assuntos complexos e permitem uma perceo mais imediata,
por parte do utilizador, do contedo temtico dos itens. Estas linguagens
so adequadas s necessidades de bibliotecas de carter geral, cujos acervos
refletem uma grande diversidade temtica, mas tambm a bibliotecas
especializadas (SANTOS 2000:54). Uma vez que os termos so
combinados entre si por meio de uma estrutura sinttica complexa que
requer uma maior interveno do indexador, maior domnio de um sistema
complexo e exige sistemas informticos mais dinmicos, como os atuais,
mas inexistentes naquela data. A informtica, nos meados do sculo XX,
no tinha capacidade para potencializar as pesquisas por assunto, utilizando
as linguagens de cabealhos de assunto. Esta incompatibilidade, asssociada
aos custos do tratamento da informao, fizeram cair em desuso as
linguagens que utilizavam cabealhos de assunto. Surge a era do tesauro,
enquanto linguagem documental.
Na ltima dcada do sculo XX, com o aumento de recursos digitais
disponveis e com os desenvolvimentos da Web semntica surgiu A nova
gerao de sistemas de organizao do conhecimento, (Menon, 2004):
o As ontologias so formas de representao de um determinado domnio do conhecimento, que permitem o estabelecimento de
relaes e apresentam suficiente flexibilidade para poderem ser
partilhadas e reutilizadas. Podem conter termos descritivos variveis
e, acima de tudo, podem exprimir toda a estrutura semntica e todas
as relaes numa linguagem compreendida pelo computador
(SANTOS, 2000:65).
o Mapas conceptuais os mapas conceptuais so uma tcnica de representao visual do conhecimento na qual a informao, os
conceitos e as suas relaes aparecem representados sob a forma de
diagramas ou mapas. Este modelo de organizao do conhecimento
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
9
tem a vantagem de proporcionar a representao estruturada do
conhecimento em forma de rede as redes semnticas. Os mapas
conceptuais ao apresentarem uma representao grfica dos
conceitos e suas relaes permitem uma melhor apreenso do
contedo informativo dos documentos e ajudam a apreender novos
significados e a integrar estes novos conceitos nas relaes j
existentes, ao permitirem desenvolver novas relaes conceptuais de
forma dinmica (SIMES, 20008:69-70).
o Taxonomias constituem um esquema ordenado do conhecimento em vrias reas, segundo determinadas regras ou normas. So
instrumentos de organizao do conhecimento construdos e
desenvolvidos em ambientes de tecnologia informtica, tambm so
aplicados aos mesmos, sendo cada vez mais usados na Internet,
nomeadamente nos diretrios da Web (SIMES, 2008:73).
Tipologia das linguagens documentais:
Como refere Gil Urdician (2004) existem diversos critrios de tipificao
das linguagens documentais, sendo os mais conhecidos:
os do controlo;
os da coordenao dos termos;
e o estrutural.
Dependendo do controlo exercido sobre o vocabulrio, as linguagens
podem organizar-se em duas categorias:
livres - Por exemplo: Listas de termos, Terminologias, etc;
controladas Por exemplo: As classificaes e os tesauros. Por controladas entendem-se as linguagens
que apresentam um vocabulrio previamente
definido, estabelecem as orientaes para a sua
utilizao e admitem um nmero limitado de
alteraes. So vocabulrios construdos a priori.
O critrio de coordenao dos termos est dependente do momento em que
se realiza a combinao dos vrios elementos que compem uma
linguagem documental.
Se os termos se combinam quando se elabora a linguagem ou no momento da descrio, a
linguagem diz-se pr-coordenada
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
10
Se a combinao feita no momento da recuperao, diz-se que a linguagem ps-
coordenada.
Exemplificando: as classificaes e os cabealhos de assunto so
linguagens pr-coordenadas e os tesauros so linguagens ps-coordenadas.
Nos sistemas pr-coordenados, como no SIPORbase (Sistema de Indexao
em lngua portuguesa) desenvolvido e aplicado pela BNP, os termos de
indexao (designados por cabealhos de assunto) combinam-se de acordo
com regras sintticas estabelecidas pelo prprio sistema, no momento da
indexao. Os termos de indexao podem j existir na base ou no. No
caso de ainda no existir um cabealho de assunto adequado, o indexador
ter de o estabelecer pela primeira vez, cumprindo todas as regras definidas
no Manual SIPORbase. uma linguagem em construo constante, de
acordo com as necessidades do indexador e do documento a indexar.
Nas linguagens ps-coordenados a sintaxe booleana e os termos simples
ligam-se no momento da pesquisa. So linguagens que sofrem atualizaes
cclicas, mas que podem no responder de imediato necessidade do
indexador e do documento a tratar.
Finalmente, quanto ao critrio da estrutura, podemos identificar dois tipos
de linguagens:
as de estrutura hierrquica ou categorial onde encontramos determinadas classificaes, cuja
estrutura estabelece que o conceito mais genrico ou
categoria de assunto, representado por um cdigo
numrico construdo com um menor nmero de
dgitos e quanto maior for a especificidade do
conceito maior o nmero de dgitos que compem
o cdigo, A hierarquia conceptual reflete a
hierarquia numrica;
as de estrutura combinatria onde podemos encontrar os tesauros e os cabealhos de assunto
A NP 4285-4 (2000:4), define linguagem documental como uma
linguagem formal utilizada para caracterizar os dados ou o contedo de
documentos e permitir o seu armazenamento e recuperao. Significa isto,
que quando necessitamos de realizar uma pesquisa temtica ou por assunto,
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
11
ou seja, responder questo chave: Qual o assunto deste documento?
Recorremos a estas linguagens designadas, de um modo genrico de
linguagens documentais. Neste caso, elas intervm na terceira fase do
processo de indexao (ver tpico 1):
1. anlise e compreenso do texto e do seu contedo informativo; 2. representao verbal do contedo informativo, identificao e
seleo dos conceitos;
3. representao desses conceitos na linguagem documental
Qual a necessidade de utilizar e desenvolver linguagens
documentais?
A necessidade de criar e desenvolver linguagens documentais para
representarmos os contedos dos documentos, surge para obviar as
dificuldades levantadas pelo uso da linguagem natural (a linguagem que
todos ns utilizamos no nosso dia a dia) e da ambiguidade que lhe
inerente. As dificuldades de comunicao que o recurso linguagem
natural apresenta e que todos j vivenciamos, por mais de uma vez, tm de
ser minimizadas, num servio de informao.
Estes servios podem recorrer a linguagens codificadas onde a informao
representada por meio de cdigos classificaes bibliogrficas - ou
podem fazer recurso a linguagens alfabticas, terminolgicas ou
vocabulares, onde a informao representada atravs de termos retirados
da linguagem natural mas cujo significado est controlado. O uso de
qualquer linguagem documental resulta da necessidade de responder de um
modo rpido, eficaz e sem ambiguidades s necessidades dos utilizadores,
facilitando o acesso rpido informao procurada. Para que tudo isto seja
possvel, tornou-se indispensvel recorrer a vocabulrios controlados, de
modo a realizarmos uma indexao de qualidade.
O controlo do vocabulrio
A NP 4036 (1999), define linguagem de indexao como o conjunto
controlado de termos escolhidos numa linguagem natural e utilizados para
representar sob forma coordenada o contedo dos documentos.
Vamos analisar o conjunto de obstculos lingusticos, mais frequentes, que
a linguagem natural apresenta. A anlise incide, apenas, nos problemas
mais correntes na prtica do documentalista, quando pretende utilizar e/ou
desenvolver uma linguagem terminolgica controlada:
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
12
A sinonmia
Os sinnimos definem-se como uma equivalncia entre palavras diferentes
mas cujo significado o mesmo ou muito semelhante, nestes casos falamos
de quasi-sinnimos. Por exemplo: roubar e furtar
A polissemia
A polissemia a propriedade que uma palavra ou item lexical possui ao
apresentar vrias acees ou significados. A fronteira entre a polissemia e a
homonmia nem sempre clara.
A homonmia
Apresenta as mesmas caractersticas da polissemia, menos o tratamento
semntico comum. A classe dos homnimos subdivide-se em:
o Homgrafas So as palavras que tm a propriedade de possuir a mesma grafia, mas
pronncia e significado diferentes. Exemplo: almoo (refeio) e almoo
(verbo almoar) e sede (vontade de beber) e sede (residncia).
o Homfonas So as palavras que se pronunciam de forma igual, mas possuem grafia e
significados diferentes. Exemplo: Cozer a comida e coser a roupa.
Singular e plural
A utilizao da forma singular ou plural uma questo bsica e
extremamente importante. Todo o vocabulrio controlado deve estabelecer
os termos aceites e contemplar a forma que foi rejeitada. Por exemplo:
Alunos (termo aceite);
Aluno (termo no aceite)
USE Alunos
A deciso acerca da forma a adotar para cada termo a estabelecer, depende
da seguinte questo: Os termos que representam entidades enumerativas,
como nomes ou objetos aos quais se pode aplicar a pergunta QUANTOS?
Devem ser expressos no plural. Por exemplo: Quantos documentos?
Quantos alunos? Quantos ovos?
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
13
Os termos que representam entidades no contveis como nomes de
materiais ou de substncias s quais se pode aplicar a pergunta QUANTO?
Devem ser expressos no singular. Por exemplo:
Quanto caf? Quanto ferro?
Devem ser expressas no singular os nomes de entidades abstratas
como:
Fenmenos (personalidade, inverno);
Propriedades (fragilidade, opacidade);
Religies (Catolicismo, Hindusmo);
Atividades (corte; emigrao, respirao);
Disciplinas (Fsica; Psicologia);
O indexador dever estabelecer o controlo do vocabulrio nas linguagens
documentais a dois nveis, como refere Graa Simes (2008: 95):
1. Controlo formal que inclui o controlo morfolgico e o controlo sinttico;
2. Controlo semntico que abarca as relaes semnticas; as notas explicativas e as definies.
1. Controlo formal
Dentro da normalizao formal, e no que concerne em particular ao
controlo morfolgico, este tem a ver com a normalizao das unidades
lexicais relativamente a trs aspetos: escolha da lngua, o gnero e o
nmero em que se devem expressar.
Continuando a citar a mesma autora, No que concerne ao aspeto sinttico,
este prende-se com a normalizao da forma dos termos, em particular com
a estrutura dos termos compostos que se usam no tesauro, sempre que por
diversos condicionalismos no seja possvel representar um conceito
atravs de um termo simples, j que o uso do termo simples a forma
consagrada pela Norma ISO 2788.
2. Controlo semntico
Aqui o objetivo principal a normalizao conceptual de modo a evitar a
ambiguidade semntica que como j vimos uma caracterstica da
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
14
linguagem natural e que gera rudo e silncio na recuperao da
informao. De acordo com a autora supra citada (SIMES, 2008:104)
importante analisar o controlo semntico seguindo duas vias:
Controlo semntico via significante, onde devemos atender s questes da polissemia, da homonmia, dos qualificadores e
definies.
Controlo semntico via significado, onde atendemos aos aspetos da sinonmia (sinnimos e quasi-sinnimos) e s relaes de
equivalncia
As relaes semnticas so de ts tipos:
1. Relaes de equivalncia so estabelecidas com a funo de controlarem a sinonmia.
Podemos identificar algumas classes de sinnimos. Por
exemplo:
Termos de origem lingustica diferente (lanchar e merendar);
Termos antigos e atuais (aeroplano e avio);
Termos com grafias diferentes (ouro e oiro)
Termos equivalentes em lnguas diferentes (abstract e resumos)
Termos populares e termos cientficos (aspirina e cido acetilsaliclico);
Termos de uso geral e de uso local (conchas e caos)
Nomes comuns e nomes de marcas (garrafa isoladora e garrafa de termos)
Entre siglas, acrnimos e o seu desenvolvimento (UE e Unio Europeia)
Estas relaes so assimtricas e irreversveis, na medida em que um
termo preferencial ou aceite est ligado a um termo no preferencial e
um termo no preferencial dever estar ligado, obrigatoriamente, ao
termo preferencial. Por exemplo:
Doentes mentais (termo aceite)
UP Doentes psiquitricos (termo no aceite)
Doentes psiquitricos
USE Doentes mentais
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
15
2. Relaes hierrquicas baseiam-se em graus ou nveis de superioridade ou de subordinao, nos quais o termo superior
representa uma classe ou um todo e os termos subordinados
elementos ou partes. Estas relaes so recprocas e
assimtricas (na medida em que a um descritor de nvel
superior corresponder um de nvel inferior e vice versa)
Existem trs tipos de relaes hierrquicas:
Relao genrica identifica a posio que os membros de uma classe ou categoria tm dentro dela. O descritor de nvel inferior
especfico do descritor de nvel superior. Por exemplo:
TG Pssaros
TE Papagaios
Papagaios
TG Pssaros
Relao partitiva ou todo/parte - esta relao cobre uma gama limitada de situaes nas quais a parte est implcita no todo, em
qualquer contexto. Os termos podem ento ser organizados
hierarquicamente, servindo o todo de termo superior e a parte de
termo subordinado. Por exemplo:
TG Sistema cardiovascular
TE Artrias
Artrias
TG Sistema cardiovascular
Relao de instncia identifica a relao que existe entre uma categoria geral de coisas ou acontecimentos, expressas por um nome
comum e um espcime individual dessa categoria, que forma uma
classe de um s elemento e representado por um nome prprio. Por
exemplo:
TG Regies montanhosas
TE Himalaias
Himalaias
TG Regies montanhosas
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
16
3. Relaes associativas incluem relaes entre pares de termos
que no fazem parte de um mesmo conjunto de equivalncias. Os
termos associados no fazem parte da mesma cadeia hierrquica,
mas esto mentalmente associados (existindo entre eles uma
analogia semntica), de tal forma que a relao entre os termos
deve ser especificada. No se pode associar um termo genrico a
um termo especfico, e vice-versa, pois os termos da mesma
cadeia nunca podem ser associados. Estas relaes so
recprocas e simtricas, uma vez que quando se associa um termo
a outro, devemos obrigatoriamente fazer o inverso. Por exemplo:
Doentes mentais
TR Hospitais psiquitricos
Hospitais psiquitricos
TR Doentes mentais
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
17
II - Os tesauros
Referimos, anteriormente, que os tesauros, enquanto linguagens
documentais vocabulares, so relativamente recentes, uma vez que surgem
apenas em meados do sculo XX. A sua expanso foi muito rpida, pois
contribuiram de um modo muito eficaz para o controlo das terminologias
em reas disciplinares especficas, para o processamento mais rpido da
informao e para a cooperao e a interoperabilidade dos servios.
A NP 4285-4 (2000:5) define tesauro (Thesaurus) como o vocabulrio
controlado de termos com relaes semnticas abrangendo um ou vrios
domnios particulares do conhecimento.
A NP 4036 (1992:5) define tesauro: vocabulrio de uma linguagem de
indexao controlada, organizado formalmente de maneira a explicitar as
relaes estabelecidas a priori entre os conceitos (por exemplo, relao
genrica e especfica).
Os tesauros so construdos segundo o princpio combinatrio, baseado na
combinao de termos, utilizando os operadores booleanos (AND; OR;
NOT) quando se realiza a pesquisa.
O tesauro uma lista normalizada e estruturada de termos aceites para a
indexao de documentos de uma ou vrias reas do conhecimento. Os
termos so combinados entre si, de modo a descreverem os assuntos dos
documentos e a responderem s questes colocadas junto dos diferentes
servios de informao. Os tesauros so instrumentos muito teis para a
indexao pois fornecem uma viso estruturada do vocabulrio de uma
disciplina. Esta uma das suas potencialidades e que seria totalmente
anulada se pretendessemos criar tesauros generalistas.
Existem, contudo, alguns tesauros de mbito alargado, de tipo
enciclopdico, como o Macrothesaurus da OCDE (disponvel em
http://bibliotecavirtual.clacso.org.ar/ar/oecd-macroth/), concebido para o
processamento da informao relativa ao desenvolvimento econmico e
social. Abarca um leque alargado de disciplinas e pode ser visto como uma
metalinguagem estruturada, controlada, mas que no especifica cada rea
ou disciplina, como acontece com os tesauros que abarcam apenas um
dominio do conhecimento.
http://bibliotecavirtual.clacso.org.ar/ar/oecd-macroth/
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
18
O EUROVOC (disponvel em http://europa.eu/eurovoc/), tesauro criado
por e para os servios de informao do Parlamento Europeu, abarca todos
os assuntos ligados aos dominos polticos e jurdicos na tica dos
parlamentares.
Os tesauros so instrumentos de indexao e de pesquisa, comuns ao
indexador e ao utilizador, permitindo estabelecer a relao entre a pergunta
e a informao pertinente de uma base de dados acerca do assunto X.
Um tesauro caracteriza-se pela natureza e o nmero de relaes existentes
entre os termos. Quando se pretende estabelecer um novo tesauro,
comeamos por:
recolher vocabulrio relativo ao assunto em causa, no qual o tesauro ser utilizado;
reunimos uma lista de termos, apelidados de candidatos a descritores;
com base nessa lista, passamos a selecionar os descritores e no descritores, nesta operao de
depurao, os termos so examinados um a um,
utilizando diversos crivos, partindo do princpio que
os tesauros s devem autorizar os descritores
necessrios e suficientes para cobrir aquele domnio
concreto. Esta fase extremamente importante e o
ponto de partida para a normalizao e o controlo do
vocabulrio coligido;
a cada conceito corresponde um nico descritor
Na elaborao dos thesauri ou tesauros, o controlo semntico reveste-se de
grande importncia, pois permite restringir o significado das palavras
extradas da linguagem natural e por sua vez evitar a ambiguidade
semntica que pode provocar rudo ou silncio no ato da pesquisa de
documentos. O controlo semntico, atravs de vrias estratgias, como a
utilizao de qualificadores, de notas explicativas e o recurso s relaes
semnticas (relaes de equivalncia, relaes hierrquicas e relaes
associativas), faz o controlo da polissemia (homnimos e homgrafos) e o
controlo da sinonmia (sinnimos e quasi-sinnimos), com o objetivo de
assegurar que cada termo tem um nico significado.
http://europa.eu/eurovoc/
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
19
Seguindo a sistematizao de Gil Urdician (2004:185) acerca dos tesauros
destacamos:
Funes do tesauro
1. Normalizao do vocabulrio; 2. Induo; 3. Representao
A normalizao do vocabulrio tem como objetivo unificar todo o lxico
do tesauro de modo a controlar todas as possveis entradas. J vimos como
importante estabelecer o controlo formal e semntico dos termos.
A induo serve para que o tesauro indique sistematicamente todas as
alternativas possveis de entradas que permitam recuperar informao
pertinente, para uma dada pesquisa.
A representao a funo decorrente de qualquer linguagem
documental, ao estabelecer a correspondncia entre os descritores (termos
de indexao de um tesauro) e os conceitos presentes nos documentos.
Composio do tesauro
Os tesauros compem-se de:
unidades lexicais:
descritores;
no-descritores ou termos equivalentes;
relaes semnticas:
relaes de equivalncia;
relaes hierrquicas;
relaes associativas
Os descritores podem ser tipificados do seguinte modo:
Quanto sua carga informativa podem ser:
primrios quando representam um conceito de maneira unvoca, utilizando um nico termo;
secundrios quando a representao feita com recurso a termos compostos)
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
20
Quanto ao seu contedo podem ser:
onomsticos (representam o nome de uma pessoa individual ou coletividade;
geogrficos (representam conceitos de mbito geogrfico);
materiais ou temticos (representam conceitos muito diferentes e por isso so os mais dificeis de
controlar. Cobrem entidades concretas e
abstratas);
cronolgicos (representam um espao temporal, sejam datas, perodos , etc.)
Quanto composio podem ser:
descritores simples (representam os conceitos mediante uma nica palavra);
descritores compostos (representam o conceito utilizando:
um sintagma nominal [nome + adjetivo] ou
preposicional [conjunto de termos unidos por
nexos gramaticais].
Normas de apresentao dos descritores
A NP 4036 (1992) estabelece algumas consideraes essenciais sobre a
morfologia dos descritores:
Os descritores devem ser impressos em maisculas;
Os no descritores devem ser impressos em minsculas;
Nomes e expresses nominais os termos de indexao devem ser expressos na
forma de nome (substantivo) ou expresso
nominal. As expresses nominais pertencem
categoria de termos compostos e apresentam-se
sob duas formas:
Expresses adjetivas [nome+adjetivo]
Expresses prepositivas [nome+ preposio+nome]
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
21
Adjetivos utilizados isoladamente podem ocorrer numa
linguagem de indexao em situaes excecionais;
Advrbios como mais ou muito nunca devem ser
utilizados como termos de indexao;
Verbos verbos no infinito ou no participio no devem ser
utilizados isoladamente como termos de indexao.
As atividades devem ser representadas por nomes
ou expresses verbais;
Abreviaturas ou acrnimos no devem ser utilizadas como descritores, exceto
se estiverem largamente divulgadas e forem
facilmente reconhecidas no domnio/rea do
conhecimento coberto pelo tesauro.
Escolha da forma singular ou plural nas lnguas em que existe uma distino entre
singular e plural, a deciso de adotar uma ou outra
forma para termos de indexao pode ser
determinada pelos seguintes fatores:
a) indexao pr-coordenada ou ps-coordenada;
b) fatores culturais
Nos organismos onde se pode adotar
indiferentemente a forma singular ou plural para
um termo, a escolha entre as duas formas depende,
em geral, do tipo de noo que ele exprime.
Quando a forma singular e plural de um termo se
reportam a noes diferentes, ambas podem
constar no tesauro, ou seja, ambas so termos
descritores. Se necessrio, a distino deve ser
indicada atravs de um qualificador. Por exemplo:
MEMRIA (processo mental)
MEMRIAS (gnero literrio)
De notar que o qualificador faz parte integrante do
termo de indexao.
Nomes de lugar
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
22
Nomes de pases ou regies geogrficas variam
muitas vezes de uma para a outra lngua e, por
vezes existem variantes na mesma comunidade
lingustica, pelas razes seguintes:
a) Um nome oficial e uma variante corrente so
empregues indiferentemente. Por exemplo:
HOLANDA
PASES BAIXOS
b) Coexistem a forma original e traduo
LEGHORNO
LIVORNO
Regra geral, opta-se pelo nome mais familiar aos
utilizadores do tesauro e ser designado como
descritor. No havendo diferenas, a preferncia
dever ser dada forma oficial e no forma
corrente. Devero ser estabelecidas, neste caso,
remissivas recprocas. Por exemplo:
PASES BAIXOS
UP Holanda
Holanda
USE PASES BAIXOS
Nomes prprios de instituies ou de pessoas Estes nomes so frequentemente excludos de um
tesauro. Quando includos, a sua forma deve
obedecer s regras de catalogao do pas.
Notas explicativas e definies Podem acompanhar o termo para limitar e precisar
o sentido em que este deve ser utilizado e assim
excluir outros significados possveis. Outro tipo de
informao pode igualmente ser fornecido numa
nota explicativa:
a) data de adoo de um termo;
b) fonte do termo;
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
23
c) instrues de aplicao do termo para os
indexadores: A nota explicativa no faz parte do
termo e registada num campo especfico do
registo de autoridade;
Apresentao dos termos e suas relaes, existem vrias formas de apresentar os termos e
as suas relaes num tesauro. Esta Norma no
pretende esgotar todas as formas possveis de
apresentao, limitando-se descrio de trs
mtodos bsicos, de uso corrente:
a) apresentao alfabtica; contendo as notas
explicativas e indicao das relaes entre os
termos;
b) apresentao sistemtica, acompanhada de um
ndice alfabtico;
c) apresentao grfica, acompanhada de um
ndice alfabtico.
Alguns tesauros utilizam, como forma de
apresentao, apenas um destes tipos bsicos, no
entanto, outros h que utilizam mais do que um.
Por exemplo, um tesauro cuja parte principal se
apresente sob a forma sistemtica, pode ser
apoiado num ndice alfabtico contendo as
relaes semnticas entre os termos. Nos tesauros
que so constitudos por vrias partes (sistemtica
e grfica) toda a informao relativa a cada termo
dever estar reunida numa das partes.
Formas de apresentao dos descritores
Vamos analisar, resumidamente, cada uma das formas de apresentao dos
termos e suas relaes, continuando a citar as orientaes da NP 4036
(1999):
I) Apresentao alfabtica
Nesta forma de apresentao todos os termos, descritores e no-descritores,
esto organizados numa sequncia alfabtica nica. Os no descritores so
essencialmente acompanhados pela referncia USE que os remete para o
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
24
termo preferencial. As informaes relativas a um descritor devero ser
enunciadas pela seguinte ordem:
1) NE ou (SN) notas explicativas ou definies
2) UP ou (UF) indicao de no-descritor
3) TT indicao do termo de topo, se necessrio
4) TG ou (BT) indicao dos termos genricos
5) TE ou (NT) indicao dos termos especficos
6) TR ou (RT) indicao dos termos relacionados
(...)
II) Apresentao sistemtica
Um tesauro em que os termos estejam organizados sistemticamente deve
conter duas partes:
a) categorias ou hierarquias de termos dispostos segundo o seu significado e as relaes lgicas;
b) um ndice alfabtico que remete o utilizador para o local apropriado da apresentao sistemtica.
A ligao entre essas duas partes feita por um sistema de endereos.
atribudo, a cada um dos descritores da parte sistemtica, um cdigo que
funciona como uma referncia no ndice alfabtico. Esses cdigos devem
ter valores de classificao evidentes. Podem consistir simplesmente numa
sequncia de nmeros, ou ento, apresentar-se sob a forma de uma notao
hierrquica.
Com este tipo de apresentao, a parte sistemtica, muitas vezes
considerada como a parte principal do tesauro, isto , a que contm a maior
quantidade de informao definidora e relacional. Neste caso, o ndice
alfabtico tem o papel de um componente complementar mas secundario.
Contudo, nem sempre isto se verifica (...)
Organizao primria de um tesauro sistemtico
Quando se organizam termos em hierarquias ou categorias na parte
sistemtica, necessrio atender no apenas s relaes entre os termos,
mas tambm s relaes entre as hierarquias ou categorias em si. , com
efeito, necessrio impor uma estrutura chapu ou uma macroclassificao
parte sistemtica para nos assegurarmos que as noes similares esto
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
25
reunidas e as noes sem relao esto separadas, em benefcio do
utilizador. A organizao primria de um tesauro sistemtico pode
obedecer a duas formas:
a) organizao em domnios ou disciplinas; b) organizao em facetas; c) combinao dos dois tipos de organizao
a) Organizao em domnios
Esta tcnica , no essencial, idntica adotada para o estabelecimento de
uma classificao numa biblioteca. Comea-se por organizar o universo
dos conhecimentos em classes principais ou disciplinas. Quando aplicada a
um tesauro, as categorias de noes so agrupadas partida de forma a
refletir os diferentes domnios de interesse dos utilizadores. (...)
Nota; A ttulo exemplificativo consultar:
http://eurovoc.europa.eu/drupal/?q=pt/download/subject_oriented&cl=pt
b) Organizao por facetas
A noo de faceta mais abstrata do que a de domnio e a organizao por
facetas implica uma disciplina mental mais rigorosa da parte de quem
elabora o tesauro.
Utilizando esta tcnica, os termos so organizados em classes ou conjuntos,
segundo os tipos de noes representadas por esses termos, sem ter em
conta o ou os domnios com o qual ou os quais a noo habitualmente
associada. (...)
c) Combinao dos dois tipos de organizao
Na prtica, os dois tipos de organizao descritos acima so
frequentemente combinados, como no caso de um teasuro cuja organizao
primria por domnios e em seguida subdividido segundo as facetas. (...)
Nota: A ttulo exemplificativo consultar:
http://www.motbis.cndindexp.fr/.php/liste-des-microthesaurus.html http://www.motbis.cndp.fr/index.php/indexe-avec-motbis/32-notion-de-facettes.html
http://eurovoc.europa.eu/drupal/?q=pt/download/subject_oriented&cl=pthttp://www.motbis.cndp.fr/index.php/liste-des-microthesaurus.htmlhttp://www.motbis.cndp.fr/index.php/indexe-avec-motbis/32-notion-de-facettes.html
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
26
III) Apresentao grfica
Neste tipo de apresentao, os termos de indexao e as suas relaes so
dispostas numa figura a duas dimenses que permite ao indexador ou
utilizador dispor de toda uma gama de termos e suas relaes. Existem
vrias formas de apresentao grfica nos tesauros publicados, mas podem
identificar-se dois tipos principais:
a) estrutura arborescente (NP 4036, 1992:43) ; b) esquema em flecha (NP 4036, 1992:45)
Um tesauro que inclua uma apresentao grfica deve comportar duas
partes:
1) A apresentao grfica
A apresentao grfica propriamente dita , por norma, limitada
unicamente aos descritores, uma vez que este formato no se adapta
facilmente s notas explicativas, sinnimos, etc. Esta forma de
apresentao identificada por um smbolo, por exemplo um nmero ou
um elemento de notao hierarquicamente significativo. (...)
2) ndice alfabtico O ndice alfabtico contm as notas explicativas e as relaes de
equivalncia e pode tambm incluir as relaes hierrquicas e associativas.
O ndice da estrutura arborescente no indica relaes hierrquicas. O
ndice do esquema em flecha inclui no s notas explicativas, etc., mas
tambm as relaes hierrquicas.
Quando a parte alfabtica contm, em proporo, maior nmero de
informaes (definidoras e relacionais), funciona como a parte principal do
tesauro. (...)
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
27
III - Tesauro EUROVOC
A razo de ser do Tesauro EUROVOC (EUROVOC 1995:3,4)
Todos os anos, a documentao resultante das atividades das
Comunidades Europeias e da Unio sofre um aumento de alguns milhares,
ou mesmo de vrias dezenas de milhar, de unidades.
(...)
Perante esta massa crescente de informao, os servios de biblioteca e
documentao das instituies comunitrias procuraram dotar-se de um
instrumento para a indexao do contedo dos documentos.
(...)
Depois de examinarem os instrumentos disponveis o Servio das
Publicaes Oficiais das Comunidades Europeias (EUR-OP) e o
Parlamento Europeu optaram pela elaborao de um tesauro multilingue
que abrangesse todos os domnios de atividade das Comunidades
Europeias: o Tesauro EUROVOC.
Este tesauro, linguagem documental estruturada e controlada, foi criado
segundo as normas internacionais.
Historial
O trabalho de seleo dos descritores e de estruturao do tesauro foi
empreendido, a partir de 1982, por uma equipa de documentalistas e
bibliotecrios provenientes dos servios do Parlamento Europeu (Direo-
Geral de Estudos), da Comisso das Comunidades Europeias e do Servio
das Publicaes Oficiais das Comunidades Europeias. Este trabalho teve o
apoio da Direo-Geral Telecomunicaes, mercado da informao e
valorizao da investigao (DGXIII) da Comisso, no mbito da sua
poltica de apoio elaborao de tesauros multilingues.
A primeira edio do Tesauro EUROVOC foi publicada em 1984, em dois
volumes (apresentao alfabtica e temtica) e em sete lnguas, tendo sido
utilizada pelo Parlamento Europeu e pelo EUR-OP. A experincia
resultante dessa utilizaopermitiu uma reviso profunda do tesauro, do
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
28
qual foi publicada, em 1987, uma segunda edio, disponvel em nove
lnguas.
Esta edio do EUROVOC foi alvo de crescente interesse fora das
instituies comunitrias, em especial junto dos centros de documentao
de organismos pblicos e privados responsveis pela recolha e anlise da
informao existente sobre as atividades comunitrias.
Evoluo do EUROVOC
Estes centros de documentao reconheceram as qualidades do EUROVOC
para o tratamento da documentao comunitria e parlamentar. Alm disso,
ao adotarem o EUROVOC como base de anlise da documentao
comunitria, podiam dispor desta ltima j indexada.
(...)
O Centro Europeu de Investigao e Documentao Parlamentares
(CERDP) estabelece o contacto entre os servios de documentao de
todos os parlamentos memebros do Conselho da Europa. Um dos seus
objetivos consiste em facilitar o intercmbio de informao entre os
parlamentos, tendo esta rede de cooperao multilingue sido outro fator de
desenvolvimento do uso do EUROVOC. Foi neste contexto que a
Assembleia da Repblica portuguesa, o Parlamento espanhol e o
Parlamento belga decidiram utilizar o EUROVOC. O primeiro parlamento
membro do conselho da Europa a traduzir o EUROVOC para a sua lngua
foi o da Turquia.
(...)
Concluses
Um tesauro matria viva, que evolui em funo das necessidades
expressas pelos indexadores e utilizadores de fundos documentais e de
bases de dados cada vez mais numerosas. Facto tanto mais real quanto se
trata do tesauro EUROVOC, que deve traduzir os conceitos de uma Unio
em desenvolvimento e alargamento. Por este motivo, o Comit Diretor do
EUROVOC e a respetiva Unidade de Manuteno recolhero, com
interesse, todas as sugestes que lhes queira enviar, no sentido de
desenvolver e melhorar a qualidade do tesauros.
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
29
O nosso trabalho com o EUROVOC basear-se- na verso online
disponvel em http://europa.eu/eurovoc/
Antes de se iniciar a indexao com o tesauro aconselhamos a explorao
do stio e a leitura atenta do documento de modo a poderem utiliz-lo
convenientemente. Este manual no vai disponibilizar toda a informao do
stio, reproduzimos, apenas, alguns excertos da Apresentao e Manual
do Utilizador da edio impressa do EUROVOC de 1995, que explica,
mais detalhadamente, o modo de utilizao desta linguagem documental.
Como refere o stio, o EUROVOC 4.2 a verso mais atual e existe em 21
das lnguas oficiais da Unio Europeia (blgaro, espanhol, checo,
dinamarqus, alemo, estnio, grego, ingls, francs, hngaro, italiano,
leto, lituano, neerlands, polaco, portugus, romeno, eslovaco, esloveno,
finlands e sueco) e outra lngua (croata). Alm destas verses, o Eurovoc
foi traduzido pelos parlamentos nacionais de vrios pases (Albnia,
Rssia, e Ucrnia).
Estrutura
O EUROVOC encontra-se estruturado de modo genrico, segundo uma
classificao em dois nveis:
Domnios, identificados por um nmero de dois algarismos e impressos em maisculas. Por
exemplo:
10 COMUNIDADES EUROPEIAS
O tesauro EUROVOC abrange todos os domnios relacionados com as
atividades das instituies europeias:
04 ATIVIDADE POLTICA,
08 RELAES INTERNACIONAIS,
10 COMUNIDADES EUROPEIAS,
12 DIREITO,
16 ATIVIDADE ECONMICA,
20 INTERCMBIOS ECONMICOS E COMERCIAIS,
24 FINANAS,
http://europa.eu/eurovoc/http://wbase.duma.gov.ru/scriptsWebIrbis3/DSearch1.dll?C21COM=Enter&I21DBN=OFP_Internet
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
30
28 QUESTES SOCIAIS,
32 EDUCAO E COMUNICAO,
36 CINCIAS,
40 EMPRESAS E CONCORRNCIA,
44 EMPREGO E TRABALHO,
48 TRANSPORTES,
52 MEIO AMBIENTE,
56 AGRICULTURA, SILVICULTURA E PESCAS,
60 AGROALIMENTAR,
64 PRODUO, TECNOLOGIA E INVESTIGAO,
66 ENERGIA,
68 INDSTRIA,
72 GEOGRAFIA,
76 ORGANIZAES INTERNACIONAIS.
Microtesauros, identificados por um nmero de quatro algarismos, dos quais os dois primeiros
so os do domnio a que pertence o microtesauro,
e por um enunciado; so impressos em
minsculas. Por exemplo:
1011 direito da Unio Europeia
A numerao dos domnios e dos microtesauros idntica em todas as
verses lingusticas.
O Tesauro EUROVOC encontra-se estruturado, ao nvel especfico dos
descritores e no descritores, por relaes semnticas:
Relaes semnticas;
Relaes de pertena ao microtesauro (MT);
Relao de equivalncia (UF) ou usado por (UP);
Relao hierrquica: (BT) ou termo genrico (TG) e (NT) ou termo especfico
(TE);
Relao associativa (RT) e
Notas de aplicao ou de definio (SN)
http://europa.eu/eurovoc/sg/sga_doc/eurovoc_dif!SERVEUR/frameset!prod!F_CENTRE?langue=PT?param=P?version=4_2#42#42http://europa.eu/eurovoc/sg/sga_doc/eurovoc_dif!SERVEUR/frameset!prod!F_CENTRE?langue=PT?param=P?version=4_2#422#422http://europa.eu/eurovoc/sg/sga_doc/eurovoc_dif!SERVEUR/frameset!prod!F_CENTRE?langue=PT?param=P?version=4_2#423#423http://europa.eu/eurovoc/sg/sga_doc/eurovoc_dif!SERVEUR/frameset!prod!F_CENTRE?langue=PT?param=P?version=4_2#424#424http://europa.eu/eurovoc/sg/sga_doc/eurovoc_dif!SERVEUR/frameset!prod!F_CENTRE?langue=PT?param=P?version=4_2#425#425http://europa.eu/eurovoc/sg/sga_doc/eurovoc_dif!SERVEUR/frameset!prod!F_CENTRE?langue=PT?param=P?version=4_2#421#421
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
31
Os descritores so impressos a negrito.
Os no-descritores so impressos sem recurso ao negrito.
Caractersticas quantitativas
Todas as verses lingusticas do Tesauro EUROVOC incluem:
21 domnios,
127 microtesauros,
6645 descritores (dos quais 519 top terms),
6669 relaes hierrquicas recprocas (BT/NT),
3636 relaes associativas recprocas.
Os domnios, os microtesauros, os descritores, as relaes hierrquicas e as
relaes de associao so rigorosamente equivalentes em todas as lnguas.
Em contrapartida, cada verso lingustica inclui um nmero varivel de no
-descritores e notas.
Apresentaes impressas
O Tesauro EUROVOC apresentado, em cada uma das verses
lingusticas, em trs volumes:
Volume 1: Apresentao alfabtica permutada.
Volume 2: Apresentao temtica ou por domnio.
Volume 3: Apresentao multilingue
Conselhos de utilizao:
A indexao a operao que consiste em reconhecer e selecionar os
conceitos de que trata um documento e em represent-los por descritores do
tesauro.
A sua finalidade possibilitar a extrao, de entre uma coleo de
referncias bibliogrficas registadas numa base de dados documentais,
aquelas que respondero s questes colocadas; esta extrao s possvel
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
32
se os conceitos da questo estiverem formulados na mesma linguagem: a
dos descritores do tesauro.
Na prtica a indexao realiza-se da seguinte forma:
Rpida tomada de conhecimento do contedo do documento a indexar;
Seleo dos conceitos a utilizar para a indexao do documento, seguindo as duas das seguintes
regras:
a seletividade: s escolher os conceitos em relao aos quais o documento fornece uma
informao suscetvel de interessar aos
utilizadores;
a exaustividade: devem ser escolhidos todos os conceitos teis que figuram no texto, quer
apaream de forma explcita, quer de forma
implcita;
Representao dos conceitos selecionados por descritores do tesauro:
se o documento estiver em lngua estrangeira, traduo dos conceitos na verso
lingustica do tesauro utilizado pelo
indexador;
procura na apresentao alfabtica permutada, de termos que correspondam
expresso dos conceitos no documento.
Existem trs possibilidades:
1. a expresso do conceito corresponde a um descritor que o designa: este transcrito no formulrio de indexao ou na mscara de entrada
(exemplo: poltica de indexao),
2. a expresso do conceito corresponde a um no descritor que o designa: este ltimo remete para o descritor a utilizar (exemplo: subsdio
escolar, que nos envia para subsdios de estudo),
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
33
3. no existe uma entrada correspondente expresso do conceito. Neste caso, podem ser usados quatro mtodos:
Consultar a apresentao alfabtica permutada sobre cada uma das palavras do conceito composto procurado, a encontrando o
descritor adequado (exemplo: competncia oramental no
um descritor do tesauro; mas encontraremos o descritor a utilizar:
poder oramental, explorando a entrada alfabtica oramental
da apresentao alfabtica permutada), ou o no-descritor
adequado que remete para o descritor a utilizar;
conceber uma outra formulao do conceito em linguagem natural e verificar se a mesma corresponde a uma entrada da
apresentao alfabtica permutada (exemplo: hooliganismo no
figura no tesauro, mas evoca a ideia de violncia; assim, deve
utilizar-se o descritor EUROVOC violncia;
definir a ou as classes gerais (microtesauros) que incluem o conceito recalcitrante, consultar a apresentao temtica e
procurar, dentre os descritores disponveis, os que melhor
representam o conceito (exemplo: consequncia ambiental, no
figura no tesauro, mas claramente do mbito do microtesauro
5206 poltica ambiental; ao analisar este microtesauro,
encontramos o descritor impacto do ambiente, que pode ser
utilizado);
combinar dois ou mais descritores da apresentao alfabtica permutada para expressar, por uma perfrase, o conceito a
representar (exemplo: Conveno de Washington no existe no
tesauro, mas pode ser representado pelos descritores conveno
internacional, fauna, e flora).
A ideia do descritor, ou do no-descritor, que significa um conceito, atrs
evocada, deve frequentemente conduzir a uma anlise do contexto dos
conceitos recenseados no documento, de forma a ter em conta o respetivo
sentido real, e no o sentido literal. Por exemplo, o conceito candidato pode
significar, por um lado, o candidato num ato eleitoral, caso em que deve ser
indexado como candidato (cujo sentido precisado pelo facto deste
descritor se encontrar no microtesauro processo eleitoral) ou, por outro, o
candidato a um emprego, e nessa situao o descritor a utilizar ser
procura de emprego, que faz parte do microtesauro mercado de
trabalho. Existe, alis, um no-descritor candidato a um emprego que
remete para a utilizao do descritor procura de emprego.
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
34
A representao dos conceitos
A representao dos conceitos por descritores do tesauro efetua-se
mediante a aplicao de duas outras regras:
A especificidade vertical: o descritor deve situar-se no mesmo nvel de especificidade do conceito ou, no caso de aquele no existir, no
nvel imediatamente superior no tesauro.
Exemplos:
Um documento que trate do conceito de provncia deve ser indexado pelo
descritor provncia, e no pelo descritor genrico comunidade
territorial.
Em contrapartida, um documento que trate de mdico anestesista, conceito
que no figura no Tesauro EUROVOC, deve ser indexado com base no
conceito mais genrico de mdico, que um descritor deste tesauro.
Um documento que estude determinada situao em todos os pases do
Benelux, com pormenores relativos a cada pas, deve ser indexado
Blgica, Luxemburgo e Pases Baixos, e no pases Benelux
A especificidade horizontal: se para um conceito composto existe no tesauro um descritor composto, este deve ser utilizado em vez de
uma combinao de descritores.
Exemplo:
Um documento que trate da poltica de investigao da Comunidade deve
ser indexado pelo descritor poltica comunitria da investigao, e no
pela combinao dos descritores poltica comunitria e investigao.
A correta aplicao das regras de seletividade, exaustividade e
especificidade constitui um fator essencial da qualidade de um sistema de
armazenamento e pesquisa de informao documental.
A seletividade da indexao:
independente da qualidade do tesauro,
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
35
depende da poltica de indexao aplicada por cada sistema documental e, nomeadamente, da profundidade da indexao,
depende do conhecimento que o documentalista indexador possui dos utilizadores do sistema documental, bem como daquilo que lhes
interessa.
A exaustividade condicionada:
pela riqueza do tesauro: s podem indexar-se, obviamente, os conceitos presentes na linguagem documental,
pela poltica de indexao, que fixa a profundidade da mesma,
pelo comportamento do documentalista e respetiva meticulosidade.
Um aumento da exaustividade da indexao origina, na fase da pesquisa
documental:
uma melhoria da taxa de recuperao, isto , da proporo de documentos pertinentes efetivamente extrada do fundo como
resposta a uma questo,
mas uma diminuio da preciso, isto , da proporo de documentos efetivamente pertinentes extrada como resposta a uma questo.
Com efeito se forem indexados todos os conceitos presentes nos
documentos, mesmo os muito acessrios, aumentam-se as possibilidades de
recuperar todos, ou quase todos, os documentos que respondem s questes
colocadas, mas em contrapartida, as bibliografias obtidas contero uma
grande percentagem de documentos pouco ou nada pertinentes.
Taxa de recuperao e de preciso
Para explicar as noes de taxa de recuperao e de preciso,
consideremos uma coleo com os documentos A, B, C, D, E, e F.
Em resposta a uma questo, obtemos os documentos A, C, D e E.
Uma anlise destes ltimos revela que s os documentos C e E so
pertinentes, ou seja, respondem bem questo.
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
36
Uma anlise aprofundada da coleo revela que o documento F, apesar de
pertinente, no foi encontrado.
A taxa de recuperao ser igual a 2 (os documentos C e E) a dividir por 3 (os documentos C, E e F) ou seja, 0,66: 66% dos
documentos pertinentes foram encontrados.
A preciso ser igual a 2 (os mesmos documentos Ce E) a dividir por 4 (os documentos A, C, D e E), ou seja, 0,5: 50% dos
documentos encontrados so pertinentes.
A especificidade da indexao depende, igualmente:
do tesauro, que pode ou no incluir um nmero importante de descritores especficos,
da poltica de indexao,
dos documentalistas.
Ao contrrio do que acontece com a exaustividade, o aumento da
especificidade provoca:
uma diminuio da taxa de recuperao,
mas uma melhoria da preciso.
Com efeito, se os documentos forem indexados mediante a utilizao de
descritores com o mesmo nvel de especificidade dos conceitos que os
mesmos incluem. Exemplo: assembleia nacional, sempre que se
colocarem questes relativas a estes descritores obter-se- uma bibliografia
que no incluir os documentos indexados com um nvel mais genrico
assembleia, embora alguns contenham informaes pertinentes; porm,
em compensao, a lista conter poucos documentos no pertinentes.
Observe-se, no entanto, que os documentos indexados com um nvel mais
genrico podem ser encontrados, precisamente atravs de uma pesquisa
baseada nesses descritores. Infelizmente, o inverso no se verifica, ou seja,
se a indexao for pouco especfica, obter-se-:
melhor taxa de recuperao,
mas menor preciso.
por este motivo que convm ser especfico quando se procede
indexao dos documentos.
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
37
Por exemplo, num servio que pratique sistematicamente indexao
hierrquica (isto , a juno sistemtica, a cada descritor, dos seus
descritores genricos), encontraremos, por exemplo, a seguinte situao:
os documentos que tratem, de forma geral, de todos os pases da Unio Europeia, sem considerar nenhum ou alguns deles em
especial, sero indexados pases da CE,
os documentos que tratem especificamente da Blgica sero indexados Blgica e pases da CE,
os documentos que tratem especificamente de Itlia sero indexados Itlia e pases da CE,
uma questo relativa aos pases da Unio Europeia, considerados no seu conjunto, e portanto, formulada por pases da CE, permitir
encontrar os trs tipos de documentos acima referidos, embora
apenas o primeiro seja pertinente.
Em determinados sistemas documentais, a indexao ao nvel mais
especfico permite, escolha do utilizador, encontrar documentos que
podem ser, especficos (sobre a Blgica ou a Itlia, no nosso exemplo) ou,
por outro, simultaneamente especficos ou genricos, fazendo funcionar
automaticamente as relaes hierrquicas do tesauro (sobre a Blgica, a
Itlia e o conjunto dos pases da CE, no exemplo); se os documentos
tivessem sido indexados simultaneamente de forma especfica e genrica,
como indexao hierrquica, esta escolha, e portanto esta liberdade para o
utilizador, no seria possvel.
Para alm da indexao por descritores extrados do Tesauro EUROVOC,
pode revelar-se til a utilizao de descritores livres para representar
conceitos que surjam em documentos mas no includos no EUROVOC:
nesse caso, cria-se uma lista de autoridade desses descritores, a qual
poder, eventualmente, ligar-se por relaes hierrquicas e de associao, a
descritores EUROVOC. Se for conveniente integrar no EUROVOC alguns
desses descritores, o servio de documentao utilizador dever enviar uma
ficha de manuteno Unidade de Manuteno EUROVOC.
Em geral, tambm interessante prever uma indexao a dois nveis:
os descritores principais, num campo descritores principais,
os descritores secundrios, num campo descritores secundrios.
No primeiro campo sero colocados os descritores que representam os
conceitos correspondentes ao (s) assunto (s) principal (ais) do documento.
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
38
No segundo campo sero colocados os descritores que representam
conceitos a propsito dos quais o documento fornece informaes teis,
apesar de no corresponderem ao assunto principal.
Obviamente, isto no significa que o Tesauro EUROVOC contenha duas
categorias de descritores: os principais e os secundrios; com efeito, o
mesmo descritor pode, conforme o documento, ser principal ou secundrio.
O interesse deste mtodo consiste em possibilitar um melhor ajustamento
da interrogao:
sempre que um utilizador deseje encontrar um nmero limitado de documentos muito pertinentes, a investigao basear-se- apenas nos
descritores principais;
sempre que, pelo contrrio, o utilizador deseje uma bibliografia muito completa, a investigao incidir sobre os descritores
principais e sobre os descritores secundrios.
Este mtodo permite, igualmente, limitar o nmero de entradas num ndice
ou boletim bibliogrfico, utilizando apenas os descritores principais.
Conselhos para a formulao de questes
A formulao de uma questo a operao simtrica da indexao de um
documento: esta ltima consistia em recensear os conceitos tratados pelo
documento e em relao aos quais o mesmo fornecia informaes
suscetveis de interessar aos utilizadores; depois, estes conceitos eram
identificados por descritores. A formulao de uma questo, por sua vez,
consiste em recensear os conceitos suscetveis de existir nos documentos
que respondem questo, em traduzir esses conceitos em descritores e, em
seguida, em procurar na base de dados documentais os documentos
indexados, com a ajuda desses descritores.
O recenseamento dos conceitos de uma questo exige uma abordagem
muito diferente da que seguida para o recenseamento dos conceitos de um
documento: a indexao de um documento uma operao que origina
uma forte condensao (um documento de 5 a 10 pginas representado,
em geral, por 5 a 15 descritores, ou seja, uma taxa de condensao de 1% a
1%0), enquanto a formulao de uma questo conduz a maior parte das
vezes, a um enriquecimento do enunciado inicial.
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
39
A formulao da questo comea por tornar explcita, da forma mais
completa e precisa possvel, a necessidade de informao sentida do
utilizador, expressa em linguagem natural; em seguida, o utilizador
recenseia os conceitos que, constituem o enunciado da questo, assim
ampliada.
O utilizador deve, depois, representar estes conceitos atravs de descritores
do tesauro, havendo a distinguir trs casos:
1. a questo precisa e os conceitos que a compem encontram-se no tesauro: o utilizador usar, de preferncia, a apresentao alfabtica
permutada, na qual encontrar:
os descritores ou os no-descritores (e, destes, os descritores) que correspondem ao enunciado dos conceitos da questo,
os descritores em relao hierrquica e de associao que podero contribuir para melhor precisar a questo;
2. a questo precisa, mas todos (ou alguns) conceitos que a compem no figuram no tesauro: depois de os ter procurado, em vo, na
apresentao alfabtica permutada, o utilizador explorar, na
apresentao temtica, os microtesauros que correspondem ao (s)
domnio (s) da questo colocada, neles procurando os descritores
existentes que designam os conceitos mais prximos da questo
colocada;
3. a questo no precisa, o que acontece frequentemente: o utilizador usar de preferncia a apresentao temtica, explorando o (s)
microtesauro (s) que corresponde (m) ao (s) domnio (s) de interesse
da questo; a encontrar a coleo ordenada dos descritores que
abrangem esse (s) domnio (s) e poder escolher os descritores mais
adequados.
Alguns utilizadores finais realizam, eles prprios, as pesquisas documentais
que pretendem, a partir do seu terminal ligado ao computador onde se
encontra instalada a base de dados. Outros utilizadores preferem dirigir-se a
um documentalista, a fim de efetuar o que chamamos uma pesquisa
delegada: nestes casos, fundamental o estabelecimento de contacto
direto entre o utilizador e o documentalista, para que o primeiro possa
comunicar ao segundo, com o mximo de preciso, a natureza das suas
necessidades de informao. S assim a investigao delegada poder
revelar-se frutuosa.
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
40
Vantagens e limitaes da utilizao do EUROVOC na indexao por
assuntos
Vantagens:
normalizao terminolgica dos vocabulrios de indexao dos documentos, a introduzir numa base de dados documentais, e de
formulao das questes aquando da interrogao dessa mesma
base, permitindo uma grande eficcia da pesquisa documental;
multilinguismo, permitindo indexar documentos na lngua do documentalista e procur-los na lngua do utilizador;
possibilidade de estabelecer redes de cooperao entre servios documentais que utilizam o EUROVOC, evitando, assim, a
repetio de trabalho.
Limitaes:
O EUROVOC foi construdo para satisfazer as necessidades de sistemas documentais gerais no que se refere s atividades
comunitrias, no sendo adequado para documentos
especializados [nem para bibliotecas generalistas, uma vez que os
fundos documentais abarcam todas as reas do conhecimento];
por outro lado, embora se desenvolvam esforos no sentido de ter em conta as necessidades dos utilizadores no pertencentes s
instituies comunitrias, o EUROVOC no pode ter a pretenso
de abranger as diferentes realidades nacionais com suficiente
especificidade.
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
41
Preenchimento do Bloco 6 Assuntos do UNIMARC
Bibliogrfico
O preenchimento dos descritores atribudos a cada documento realiza-se no
registo bibliogrfico correspondente e efetua-se, de acordo com o
UNIMARC BIBLIOGRFICO, no Bloco 6 - ASSUNTOS.
Cada descritor representa um assunto especfico que deve ser preenchido
no campo adequado. Vejamos alguns exemplos:
Nome de instituio/coletividade
601 $aOIT
Nome comum como assunto
606 $aNomadismo
Nome geogrfico
607 $aNigria
Termos de indexao no controlados
610 $a . Qualquer descritor livre
Os exemplos referidos anteriormente, no dispensam a consulta do Manual
UNIMARC BIBLIOGRFICO, disponvel em
http://www.unimarc.info/bibliographic/1/pt/summary
http://www.unimarc.info/bibliographic/1/pt/summary
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
42
Parte IV A Classificao Decimal Universal
Este texto tem por base uma traduo e adaptao livre do livo de MCLLWAINE, I.C.
Gua para el uso de la CDU. Trad. De Rosa San Segundo Manuel. Madrid: AENOR,
2003. 297 p. ISBN 90-806152-1-8
Antecedentes histricos da classificao
No sculo XIX o fsico Andr Marie Ampre props pela primeira vez o
emprego da notao decimal, como um cdigo para expressar os conceitos
na classificao dos documentos.
Em 1876 Melvil Dewey desenvolveu um sistema classificatrio decimal
para aplicar na biblioteca universitria onde trabalhava que acabou por se
consagrar como Classificao Decimal de Dewey.
Em 1895 Paul Otlet e Henry La Fontaine so chamados para trabalhar no
Repertrio Bibliogrfico Universal, cujo objetivo era criar a primeira
listagem de todos os documentos impressos no mundo desde a descoberta
da imprensa. Este objetivo prximo do que a IFLA se prope, atualmente,
mediante o seu programa de Controlo Bibliogrfico Universal. Os dois
advogados belgas comeam a compilar este repertrio ou catlogo em
fichas e decidem organiz-lo de uma forma sistemtica. Tal tarefa exigia
uma classificao bibliogrfica adequada e selecionaram a Classificao
Decimal de Dewey, que nesse momento j se encontrava na sua 5 edio.
A classificao possua apenas alguns milhares de subdivises, mas a sua
notao apresentava a possibilidade de utilizao universal j que abarcava
todo o universo do conhecimento e empregava os nmeros arbicos.
Otlet e La Fontaine chegam a acordo com Dewey que os autoriza a
introduzir algumas modificaes e ampliaes classificao de modo a
adapt-la s suas necessidades, acrescentaram, ainda, uns quantos
instrumentos de sntese e tabelas auxiliares que a tornaram mais flexvel e
detalhada. Estes elementos vieram a alterar a estrutura inicial da
Classificao de Dewey, totalmente enumerativa, para uma estrutura
hbrida. A estrutura da Classificao Decimal Universal possui,
simultaneamente, caractersticas enumerativas, sintticas e facetadas.
Verifica-se ao longo das ltimas alteraes realizadas pelo UDCC e
publicadas nas Extensions and Corrections to the UDC que o carter
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
43
enumerativo est a ser eliminado aos poucos e a caracterstica sinttica
prevalece cada vez mais.
A primeira edio completa desta nova classificao foi publicada entre
1905 e 1907com o ttulo de Manual de Repertrio Bibliogrfico Universal
e contava com cerca de 35000 subdivises, tinha, ainda, um ndice
alfabtico com 38000 entradas. A ideia de constituio do Repertrio
Bibliogrfico acaba por cair e em 1927-1933 sai a segunda edio da
classificao, agora com a designao de Classificao Decimal Universal.
O tamanho desta nova edio o dobro da 1 e vai sofrendo correes e
adies sucessivas ao longo de vrios anos.
As lnguas de trabalho da CDU so historicamente o francs, o alemo e o
ingls. A utilizao de vrias lnguas foi sempre importante para manter a
universalidade do sistema e at hoje continua a ser um objetivo a
prosseguir. Atualmente o ingls a nica lngua utilizada para fins
editoriais do consrcio CDU. Este rgo gestor da CDU autoriza, mediante
o pagamento de licenas, a edio das vrias verses (mdia, especializada,
abreviada ou eletrnica) em qualquer lngua. Atualmente esto publicadas
mltiplas edies em vrios idiomas, sendo que a maioria delas tem por
base o Ficheiro Bsico de Referncia (Master Reference File) que desde
1992 a verso eletrnica da CDU. O Master Reference File possui cerca de
61000 entradas, enquanto que a verso mdia impressa tem
aproximadamente 40000, as edies abreviadas contam com cerca de
10000 a 15000 e as edies de bolso contam com cerca de 4000 entradas. O
Ficheiro Bsico de Referncia a norma, qualquer ampliao que supere o
seu nvel de detalhe no est autorizada pelo consrcio.
A organizao criada por Otlet e La Fontaine, originalmente para assumir
a responsabilidade de gerir o repertrio bibliogrfico e posteriormente
como editora do sistema de classificao da resultante, recebeu o nome de
Instituto Internacional de Bibliografia e situava-se em Bruxelas. Em 1937,
muda-se para Haia e adota o nome de Federao Internacional de
Documentao (FID). Em 1992, estabelece-se um consrcio de editores e a
responsabilidade de gerir e atualizar a CDU passa para o Consrcio da
Classificao Decimal Universal (disponvel na http://www.udcc.org/ Esta
organizao controla todas as edies e tradues da classificao e uma
das suas primeiras atividades, foi a criao de uma base de dados que
constituiu a verso autorizada do sistema, ou seja, o Master Reference File
(MRF). Esta base atualizada todos os anos, aps a publicao da lista
anual de correes autorizadas que se designa por Extensions and
Corrections to the UDC.
http://www.udcc.org/
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
44
Nota: Aconselhamos a consulta do sumrio da CDU disponvel na
http://www.udcc.org/udcsummary/php/index.php
Caractersticas do sistema
Classificao Decimal Universal
Vamos analisar cada um dos termos de modo a caracterizar o sistema:
Classificao
Desde sempre o Homem teve necessidade de classificar e ordenar tudo o
que o rodeia. Classificar um mtodo de organizao em categorias ou
classes e pode ser empregue em mltiplas tarefas quotidianas, desde a
disposio dos artigos num supermercado, at ordenao do
conhecimento. Uma aplicao bvia da classificao encontra-se nas
Cincias Biolgicas, onde os organismos so organizados segundo os
gneros e espcies em taxionomias. Tambm as classificaes
bibliogrficas so utilizadas h sculos para organizar os livros nas
bibliotecas de acordo com a informao contida nos documentos.
A classificao tem por base o princpio da ordenao de conceitos de
acordo com o seu grau de semelhana. Os elementos compartilhados
descrevem-se como caractersticas de diviso. Resulta, por conseguinte,
essencial certificar-se de que uma caracterstica de diviso se aplica sempre
e que todas as subdivises derivadas da sua aplicao tenham sido
esgotadas antes de se proceder aplicao de uma nova. Por exemplo, se
fossemos criar uma classificao correspondente a Biblioteconomia,
identificaramos em primeiro lugar, os diferentes tipos de biblioteca, antes
de consideramos as diferentes atividades que fazem parte da
biblioteconomia.
Biblioteconomia:
Tipos de bibliotecas:
- Segundo o organismo que a financia (nacional, pblica,
universitria, especializada)
http://www.udcc.org/udcsummary/php/index.php
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
45
- Segundo o tipo de leitores (crianas, estudantes, pblico em geral)
- Segundo as necessidades especiais dos seus utilizadores (cegos,
falantes de uma determinada lngua)
- Segundo o tema (Direito, Msica, Arte)
Materiais:
- Mapas, fotografias, pelculas
Atividades:
- Direo de pessoal, gesto de colees, catalogao, indexao
Agentes (Instrumentos)
- OPACS, leitores de microfilmes, fotocopiadoras
Esta perspetiva analtica da classificao essencial, se queremos que o
sistema seja coerente. A soma total dos termos derivados da aplicao de
uma nica caracterstica de diviso designa-se como faceta.
As classificaes bibliogrficas tiveram por base, tradicionalmente, a
organizao do conhecimento em disciplinas. Uma disciplina pode ser
definida como um campo de estudo fundamental ou reas do
conhecimento, como a Filosofia, as Cincias Sociais e a Religio. Estas
disciplinas podem subdividir-se em sub disciplinas, que coletivamente,
formam as primeiras, como o caso da Economia e da Cincia Poltica em
relao s Cincias Sociais. Nas classificaes bibliogrficas muito til
identificar campos do conhecimento geralmente reconhecidos, compostos
por caractersticas como um objeto de estudo distinto, mtodos distintos de
investigao, formao especializada de profissionais, departamentos nas
universidades, etc. Esta aproximao organizao do conhecimento
atravs da forma pela qual os termos so selecionados e estudados, fornece
um conjunto familiar de pontos de referncia a partir do qual se vai
construir a estrutura bsica.
As classificaes sistematizaram-se tendo por base as classes. Podemos
definir classes como um conjunto cujos membros tm algo em comum.
Pode ser simples ou composta. Por exemplo na classe Botnica, as plantas
individuais seriam classes simples. Uma classe composta constituda pela
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
46
interceo de dois ou mais tipos diferentes de conceito (ou faceta) dentro
da mesma classe, tais como fisiologia vegetal, patologia vegetal, ecologia
vegetal, etc. Numa classificao geral como a CDU, as classes pelas quais
feita a diviso do conhecimento, antes de ser efetuada qualquer anlise
facetada e que no possuam nenhuma classe mais extensa dentro da qual se
insiram, so normalmente denominadas por classes principais. Este facto
frequentemente relacionado com a distribuio da numerao na CDU, por
exemplo: classe 1- Filosofia, classe 2- Religio, classe 3 - Cincias Sociais,
etc. Pode ser muito til, mas tambm enganador, pois, muitas dessas
classes principais numeradas com um nico dgito contm mais de uma
disciplina que merece o estatuto de classe principal. A Classe 1 Filosofia
e Psicologia, a Classe 6 Tecnologia, Medicina e Engenharia, etc. Quando
existe a interceo de duas classes, como por exemplo num ttulo como
Matemtica para engenheiros, utiliza-se por vezes a denominao de
classe complexa. Na CDU estas combinaes so frequentemente expressas
atravs da utilizao de dois pontos.
Decimal
O nmero da classe o cdigo utilizado para representar a classe/conceito
e determina a disposio dessa classe no sistema. Pode ser formado por um
nico algarismo rabe (ao nvel mais elevado) ou por uma sequncia de
algarismos rabes ou ainda por uma sequncia que combine algarismos
rabes e smbolos autorizados na CDU (exemplo da classe 630).
A numerao CDU baseada em algarismos rabes ordenados de acordo
com o sistema decimal. Isto significa que o universo do conhecimento
visto como a unidade e cada rea temtica/disciplina/classe uma frao
desse todo.
A numerao aumenta por fraes decimais e a extenso reflete o nvel
hierrquico. Conceitos de categoria equivalente dentro de uma classe ou
seco especfica so normalmente constitudos pela mesma extenso
numrica.
Universal
A universalidade da CDU verifica-se duplamente:
-
LICENCIATURA EM CINCIAS DA INFORMAO E DA DOCUMENTAO
ANLISE E LINGUAGENS DOCUMENTAIS III
AS LINGUAGENS DOCUMENTAIS
UNIVERSIDADE ABERTA
2011/2012
47
universal porque abarca todos os domnios do conhecimento num nico
sist