Download - Aula 01 - Recuperação da Informação
DCI-UFPE 1
Recuperação da Informação
Renato Fernandes Corrêa
Recuperação da Informação -Introdução
2010.2
2
Roteiro
Motivação/Introdução
Definição
Sistema de Recuperação de Informação
Exemplos de SRI
3
Motivação/Introdução
O problema: "a tarefa massiva de tornar mais acessível, um acervo crescente de conhecimento“. VANNEVAR BUSH (1945)� Explosão informacional� Importância estratégica da informação
4
Motivação/Introdução
A solução: Calvin MOOERS (1951) cunhou o termo recuperação de informação, destacando que ele "engloba os aspectos intelectuais da descrição de informações e suas especificidades para a busca, além de quaisquer sistemas, técnicas ou máquinas empregados para o desempenho da operação.“
“Certamente, a recuperação da informação não foi a única responsável pelo desenvolvimento da CI [Ciência daInformação], mas pode ser considerada como principal; ao longo do tempo, a CI ultrapassou a recuperação da informação, mas os problemas principais tiveram sua origem aí e ainda constituem seu núcleo.” SARACEVIC (1991)
5
Recuperação de InformaçãoDefinição
Área de pesquisa e desenvolvimento que � investiga métodos e técnicas� para a representação, a organização, o armazenamento, a busca e a recuperação de itens de informação
Objetivo principal� facilitar o acesso a documentos (itens de informação) relevantes à necessidade de informação do usuário�Geralmente representada através de consultasbaseadas em palavras-chaves
6Tarefa típica de Recuperação de Informação (RI)
Dados� Um corpus de documentos e� Uma consulta do usuário
Encontrar � Um conjunto (ordenados) de documentos que são relevantes para a consulta
7
Elementos de um Sistemas de RI
Sistema de RIConsulta
Corpus de
documentos
Documentos
ordenados
1. Doc1
2. Doc2
3. Doc3
.
.
Usuário
Indexação
8
Como funciona?
Usuário
Necessidade de
Informação
RecuperaçãoRecuperação
Documentos
Indexação
RepresentaçãoRepresentação
Consulta
Recuperação de Informação
Sistema de
Recuperação da Informação
Resultado
Armazenamento
Casamento, Ordenação
Modelos de Recuperação de Informação
Existe uma distinção entre:� A tarefa do usuário
� Recuperação ou Navegação
� A visão lógica dos documentos � sua representação no sistema
� O modelo de recuperação de informação� Clássico ou estruturado ou navegação
Navegação
Embrapa - Infoteca
Recuperação
12
Sistemas de RI
Um sistema automático para RI pode ser visto como� a parte do sistema de informação responsável pelo armazenamento ordenado dos documentos em um banco de dados,
� e sua posterior recuperação� para responder a consulta do usuário.
Etapas principais na construção:� Aquisição (seleção) dos documentos� Preparação dos documentos� Indexação dos documentos� Armazenamento� Recuperação
� Busca (casamento com a consulta do usuário)� Ordenação dos documentos recuperados
13Exemplos de sistemas de recuperação de informação
Sistemas de RI em DVD e Cederrom
Catálogo em linha de acesso público
Engenhos de busca
Serviços de busca em linha
Sistemas de gerenciamento de documentos
Sistemas de Filtragem de Informação
Sistemas de Extração de Informação
Catálogo em linha de acesso público(OPAC)
Sistemas que recuperam informação em bases de dados catalográficos de bibliotecas.
Exemplo:
15
Engenhos de Busca
WebWeb
Consulta
Resposta
Base deÍndices
Engenho de Busca
Usuário
Spider
Indexador
Representação dos Docs
Servidor de Consultas
Aquisição
Pré-ProcessadorDocs
Recuperador
Ordenador
21
34
Motor deIndexação
Browser
Serviços de busca em linha
Sistemas que recuperam informação em bases de dados bibliográficos.
Exemplos:
Sistemas de gerenciamento de documentos
Sistemas que gerenciam versões e recuperam informação em um corpus de documentos digitais.
Exemplos:� Softwares Proprietários da IBM, Xerox, Oracle e Microsoft
� Softwares Livres� Alfresco� KnowledgeTree� Main//Pyrus DMS� Nuxeo� OpenKM� Archivista
Sistemas de Filtragem de Informação
Sistemas que filtram a informação recuperada de acordo com o interesse do usuário
Servidor News
ArtigosIndexados
Usuário
Perfil dousuário
Engenho de Busca InternetInternet
19
Sistemas de Extração de Informação
Sistemas capazes de extrair de documentos relevantes apenas a informação requerida
A informação extraída pode ser apresentada ao usuário e/ou armazenada em BDs.
Sistema de EI
BD
Nome:End.:Fone:Fax:Preços:
TemplatePágina de Hotel
20
Referências
BAYEZA-YATES, RIBEIRO-NETO. Modern Information Retrieval. Addison Wesley: 1999.
ROWLEY, J. A Biblioteca Eletrônica. 2 ed. Brasília: Brinquet Lemos Livros, 2002.
SARACEVIC, T. Ciência da informação: origem, evolução e relações. Perspec. Ci. Inf., Belo Horizonte, v. 1, n. 1, p. 41-62, jan./jun. 1996