sistemas de búsqueda y recuperación de información eva mª méndez rodríguez universidad. carlos...
TRANSCRIPT
Sistemas de búsqueda y Sistemas de búsqueda y
recuperación de recuperación de InformaciónInformación
Eva Mª Méndez RodríguezEva Mª Méndez Rodríguez Universidad. Carlos III de Madrid
Getafe, 1999
Sistemas de búsquedaTipología
Recursos Web
Software y ficherosPersonas e institucionesListas de distribuciónNews
• Directorios / índices• generales• especializados
• Buscadores• Metabuscadores• Agentes inteligentes• Portales• WebRings
Metabuscadores:Metabuscadores:búsqueda múltiplebúsqueda múltiple
ej: Metacrawler
Sis
tem
as d
e b
úsq
ued
aS
iste
mas
de
bú
squ
eda
Metabuscadores Caracterización
– Permiten formular búsquedas simultáneas en un determinado número de motores de búsqueda.
– Se les denomina también motores de búsqueda en paralelo, megamotores, o metabuscadores.
– Cuando un usuario lanza la búsqueda, el metabuscador las dirige a sus motores asociados componiendo una lista de aciertos, que representan, en teoría, las mejores respuestas a la pregunta.
– Posteriormente pueden llevar a cabo otras tareas, como asignar u ordenar por relevancia, formatearlas de forma consistente, verificar la accesibilidad o eliminar enlaces muertos.
– La lista final indica el motor que ha generado la respuesta y pueden agruparse los resultados por ese criterio.
Metabuscadores Ventajas e inconvenientes
En principio, dada la multiplicidad de motores parecen la solución óptima.
Pero al depender de los tiempos de respuesta y de la efectividad de sistemas sobre los que no se tienen control, no es sorprendente que en ocasiones fallen.
Metabuscadores Alcance:
– Trabajan para poder presentar resultados manejables, por eso no es sorprendente que las listas de resultados sean breves.
Calidad:– Dependen extremadamente de las
posibilidades de indización de los motores con los que trabaja.
– Si el motor genera basura degrada la calidad del metabuscador.
Metabuscadores Control:
– Los motores usan distintos procedimientos de búsqueda. Una petición genérica contra varios, no ofrece las mismas posibilidades que los resultados obtenidos con las funciones avanzadas de cada motor.
Velocidad:– Si un motor es lento, impone retrasos en la
presentación de resultados. Soluciones:– Metacrawler incorpora un mecanismo para verificar que los resultados
que obtiene son accesibles y relevantes antes de presentarlos en pantalla.
– SavvySearch toma en cuenta el tiempo de proceso de los motores y da preferencia a los más rápidos.
Metabuscadores:¿Cuándo usarlos?
Cuando se busque sobre una materia poco común
Cuando no se ha tenido suerte con otros servicios
Cuando no se quieran formular búsquedas complejas
Cuando se quieran recuperar tantos documentos como sea posible con una sola pregunta
MetaCrawler www.metacrawler.com
Definición:– Es un servicios web que trabaja con
diferentes motores de búsqueda.
Alcance:– Usa Lycos, Webcrawler, Excite, AltaVista,
Yahoo, Infoseek.– Puede buscar en Web, productos
informáticos, ficheros o en News.
MetaCrawler www.metacrawler.com
Uso:– Posee una única ventana desde la que
formular las búsquedas. Al introducir los términos el usuario puede decidir si quiere que los aciertos tengan cualquiera de los introducidos, todos o que los términos sean considerados una frase.
– Los resultados los presenta listados y normalizados eliminando elementos de publicidad.
MetaCrawler www.metacrawler.com
Uso avanzado:– Permite limitar las búsquedas por países, nº
de aciertos, tiempo de duración de la búsquedas (en minutos), o por el número de acierto que debe proporcionar cada motor de búsqueda.
– Permite seleccionar los motores contra los que lanzar la pregunta:Altavista, Excite, Yahoo, Infoseek, Lycos, Thunderstone, Webcrawler.
Otros metabuscadores SavySearch: http://www.savvysearch.com/
Internet Sleuth: http://www.isleuth.com/
Profusion: http://www.profusion.com
Cyber411: http://www.cyber411.com
Metafind: http://www.metafind.com
Inference Find: http://www.infind.com/
All-in-One Search: http://www.allonesearch.com/
Ask Jeeves: http://www.aj.com/ ESPAÑOLES:
Metabusca: http://metabusca.com
Diferenciación
Metabuscadores: Lanzan la misma búsqueda a distintos sistemas, aunando los resultados.
Multibuscadores: Permiten lanzar la búsqueda a varios buscadores pero de forma individual (primero uno, después otro...) simplificación de interface pero funcionamiento autónomo.
Buscopio: http://www.buscopio.com
Agentes:Agentes:la búsqueda inteligentela búsqueda inteligente
ej. RoboshopperPointcast
Sis
tem
as d
e b
úsq
ued
aS
iste
mas
de
bú
squ
eda
Agentes Inteligentes:¿Qué son?
– Los agentes inteligentes son programas que realizan tareas de acuerdo con los planteamientos de los usuarios.
– Las posibilidades son muy amplias, desde desarrollar rutinas de trabajo hasta tratar esas rutinas como preferencias o incluso negociar en nombre del usuario.
Software personal que asiste en la búsqueda de información en Internet con una autoridad
delegada de sus usuarios.
Agentes Inteligentes:Caracterización
– La característica que los distingue es la habilidad de “tomar decisiones” según un conjunto de reglas internas y sin intervención del ususario.
– Los agentes pueden tener esta característica de autonomía en mayor o menor grado. El grado de autonomía puede llegar a que tomen iniciativas: por ejemplo suministrar al usuarios información sin que la solicite, pero que quizás sea de su interés.
Agentes Inteligentes: Acceso
– El agente puede ser un programa cliente, o un servidor web.
– Existen múltiples clientes, algunos son gratuitos (Poitcast) , otros son de pago (Webcompass).
– Otros agentes son accesibles a través del URL: Jango, aunque exigen registrarse en muchos casos.
Agentes Inteligentes:Alcance
– Las tareas que pueden llevar a cabo son muy variadas:
• Enriquecen el browsing del usuario sugiriéndole enlaces basados en anteriores conductas.
• Dan valor añadido a las búsquedas convencionales como las realizadas en Altavista, Lycos, Infoseek
• Lanzan preguntas contra diferentes motores, filtran y reordenan los resultados de forma eficiente.
Agentes Inteligentes:Alcance
– Localiza el mejor precio de un determinado producto en las tiendas online.
– Controlan bases de datos Web y proporcionan actualizaciones de su contenido.
– Compila periódicos personalizados.– Visita a bases de datos seleccionadas por el
usuario y descarga automática de todas las páginas o de parte para consulta offline.
Agentes Inteligentes:Alcance
– Localización de personas con intereses similares.
– Vigilar los sitios preferidos del usuario y avisarle cuando se produce un cambio.
– Generar mapas o guías de la estructura hipertextual de un servidor.
– Comprobar y priorizar el correo electrónico, tomar decisiones basadas en el contenido del correo y actuar en consonancia.
Agentes Inteligentes:Uso
– Algunos agentes poseen sus propios conjuntos de reglas y criterios o las tareas que pueden desarrollar se circunscriben a una.
– Otros, por el contrario, deben ser “entrenados”. Es decir, las instrucciones se las proporciona el usuario. Este proceso puede consumir bastante tiempo, pero al finalizar, el usuario tiene un “traje a su medida”.
Agentes InteligentesServidorServidor
BargainFinder:• Fue un servicio experimental creado por
Anderson Consulting (junto con otros como LifestyleFinder, InfoFinder, NewsFinder, etc). Tenía la función de obtener el mejor precio de CDs.
Roboshopper:• Software que permite comparar precios de
distintos tipos de productos en distintas tiendas digitales.
Otros sistemas de Otros sistemas de búsqueda:búsqueda:
•Buscadores temáticos
•Webrings
Sis
tem
as d
e b
úsq
ued
aS
iste
mas
de
bú
squ
eda
Buscadores temáticos:
Un buscador temático o especializado es aquel que centra toda su actividad alrededor de una materia muy concreta. Este tipo de buscadores tratan por todos los medios de recoger en sus bases de datos toda la información que pueda haber en la Red (y a veces incluso fuera de ella) sobre la materia de que tratan.
Buscadores temáticos Permiten obtener de forma sencilla toda la
información existente sobre una materia. La información ordenada y con unos
resúmenes mucho mejores y más completos. Organizados para presentar en primer lugar
las mejores páginas sobre los temas que tratan (Tratamiento de la información suele ser manual)
Todo ello mejora mucho la calidad de la información ante la especificidad.
Buscadores temáticos: Se debe combinar su uso, con el de otros
buscadores más generales, ya que en algunas ocasiones, el hecho de que sean, iniciativas temáticas particulares, pone en tela de juicio su exhaustividad.
Es necesario conocer su existencia y URL concreto, o bien partir de un buscador general que nos puede hacer llegar a él.
Buscopio: http://www.buscopio.com
Anillos web Los webrings son grupos de webs sobre una
misma temática que se han ido formando o construyendo por iniciativa de los propios diseñadores de páginas web con un contenido temático específico.
Hay anillos sobre tantos y diferentes temas como podamos imaginar (más de 23.000 anillos web en todo el mundo), que constituyen hoy en día una alternativa (prometedora) para la búsqueda de información en Internet.
Anillos web Sólo contienen webs relevantes sobre la temática
concreta de la que tratan. El nivel de ruido es =0, en general.
El sistema de índices de la mayoría de los servidores de anillos web está perfectamente estructurado y cada índice contiene información detallada sobre diversas cuestiones de interés
No requieren complejas sintaxis de búsqueda. Si algo no se encuentra en un anillo sobre un tema,
éste nos llevará a otro de la misma temática que quizás si recoja el aspecto que nos interesa
Resulta una de las mejores opciones para el acercamiento a una materia.
Anillos web Si un web relevante sobre un tema no se adhiere al
anillo web, no se localizará. Sigue habiendo muchas páginas web que no se
interconectan a través de enlaces a otras similares, con lo cual siempre habrá que recurrir a índices o motores de búsqueda si se desea una búsqueda más exhaustiva.
Tienen muchas limitaciones en cuanto a la búsqueda (no booleanos)
Si se busca un web determinado, los buscadores de anillos son inútiles. Sólo permiten buscar por términos definitorios no por nombres de sitios ni por dominios.
Principales Webrings:
WebRing: http://www.webring.org
Looplink:http://www.looplink.com
Ringsurf: http://www.ringsurf.com
The Rail: http://www.therail.com