kollokvium om søketjenester

52
Søketjenester Kollokvium 20. mars 2013 [email protected]

Upload: ole-husby

Post on 30-Jun-2015

1.408 views

Category:

Education


3 download

DESCRIPTION

Prepared presentation about search services in general and discovery services in particular, for an internal workshop at the NTNU University Library.

TRANSCRIPT

Page 1: Kollokvium om søketjenester

SøketjenesterKollokvium

20. mars 2013 [email protected]

Page 2: Kollokvium om søketjenester

OBS!Denne presentasjonen er laget for et internt kollokvium ved NTNU 20. mars 2013. Tatt ut av denne sammenhengen kan den være ufullstendig. Fordi dette var et kollokvium, er noen av punktene en smule retoriske.

Del 1 er noe preget av den verktøysituasjonen UB er i for øyeblikket.

Del 2 er noe mer teknisk og ikke særlig UB-spesifikk.

Denne presentasjonen er underlagt en Creative Commons lisens CC BY-SA 3.0

Page 3: Kollokvium om søketjenester

Eksistensialistisk

Hva er

SøkingGjenfinningOppdaging

Hva er forskjellen på søking og oppdagingHva er serendipity

Page 4: Kollokvium om søketjenester

Hva er vi på jakt etter

TekstdokumenterAndre dokumenterInformasjonKunnskapEkspertrådFakta

Vet vi hva vi vil ha? Hva med sjanger, nivå, autoritet, språk, ventetid, format, pris,

Page 5: Kollokvium om søketjenester

Vet vi om vi fant det?

Er vi på jakt etter et kjent dokument er saken klar

Men ellers da?Går det an å måle det?Hva er relevans?Hva er gjenfinning og presisjon?Hva er relevansrangering?Hva er the long tail?

Page 6: Kollokvium om søketjenester

Innhold

1. Søkeverktøy som er dagsaktuelle ved UB

2. Tilbakeblikk og gjennomgang av mer grunnleggende begreper og teknologier

OBS: Dette er et kollokvium!

Page 7: Kollokvium om søketjenester

1. I dag

Google - Google Scholar - Bing - Yandex - DuckGoGo - Wikipedia - Mendeley - Primo - Discovery - EDS - Summon - VuFind - Facebook - Twitter - YouTube - WorldCat Local - BIBSYS Ask - BIBSØK -GENSØK- bokhylla.no

Page 8: Kollokvium om søketjenester

Discovery

handler om å oppdage eller finne ting

ikke bare vha tradisjonell søking

men via anbefalinger, sosial søking, snubling (serendipity) etc

Page 9: Kollokvium om søketjenester

Discovery og delivery

KunnskapsbaserERMLenketjenere Discoveryverktøy

Dette er verktøy eller tjenester som henger mer eller mindre sammen

Page 10: Kollokvium om søketjenester

Kunnskapsbase

fordi ikke alle eksemplarer er tilgjengelige

Spinal en plaque meningiomas: A contemporary experienceE Caroli, M Acqui, R Roperto, L Ferrante… - Neurosurgery, 2004 - journals.lww.comOBJECTIVE: Spinal en plaque meningiomas are rare and challenging lesions because of their tendency to induce spinal arachnoiditis. The surgical treatment of this type of meningioma is more complex than that of classic meningioma. METHODS: We report ..

http://journals.lww.com/neurosurgery/Abstract/2004/12000/Spinal_en_Plaque_Meningiomas__A_Contemporary.5.aspx

http://ovidsp.uk.ovid.com/sp-3.8.1a/ovidweb.cgi?QS2=434f4e1a73d37e8c740ce3cde7a33785b1e50109abeb977063eb5f5aed1249bf31d4353e62006f32ad18b794654723bb2e83912c60a4886baa4711a6ef570f9c27f69b81dbc8ccc21cc23088ac2d322773d73ec2d2541de9cef44a8fc098c80377362e88a28a1011e42a5e3415b9d29ec653b867ffa2210590e05070aa5618f2677d60027b80964b79d47b3fd4baaa344adc7b2e7c7e106f50397a112fb43625f878b9fac2fcd1c854d586ff1481a54fbae99747a473c9e7cddf3db61a877861d1a14f2960227bbd2805334bd32951ddec40ce7e361efe31e3b5d7c9bc7c450ad30947ee0b5620a4338d63a04aa7cd8c4d54adb621c146e31985d34f3d2c6d98bad152eb277ee482024854f78d7206478beec64b9581c5c7d53c636b8aab22f11e9bfeb5de941976309d9db84c5881f4059d6e4951ac6d19c49e2f959794dfe060785bb13ea315d9d69b818aeee924dcca2cdce5dc847b51638ac61d75ea82ce9b7d9e0592f879cf55d46ed3988af91a5e03f469048294d20743065f9e37b952c8e2ce916617082fea1d4578dec03cf3a15509aeab72acf08c186c6b5ad947d14b90048d923e3c9153e0dc9d15dba2b4e662677593a721cdbe8d27866bc05290

Google Scholar

Eks 1

Eks 2

Page 11: Kollokvium om søketjenester

Kunnskapsbase

(= Knowledge base )

Inneholder info om hvor det finnes et tilgjengelig eksemplar av et dokument

NTNU bruker kunnskapsbasen SFX Global Knowledgebase

Page 12: Kollokvium om søketjenester

Kunnskapsbasen SFX

inneholder informasjon om tilgjengelige eksemplarer av

● lisensierte etidsskrifter● gratis etidskrifter● ebøker (kjøpte eller via PDA)

inneholder ikke info om trykte ressurser

Page 13: Kollokvium om søketjenester

Kunnskapsbaser

Ex Libris SFX Global Knowledgebase

OCLC WorldCat knowledge base

EBSCO LinkSource

Serial Solutions 360 Link / KnowledgeWorks

Bibliotekbasen i BIBSYS er også en kunnskapsbase

Internasjonalt initiativ for å standardisere virkemåten til kunnskapsbasene: KBART

Page 14: Kollokvium om søketjenester

Mer om kunnskapsbaser

Det har siden 2000 (da kom SFX på markedet) vært en tendens til at KB har vært levert sammen med (som en del av) lenketjener.

I dagens marked er det sannsynligvis en ny retning å spore, nemlig at KB knyttes sterkere til discoveryverktøyene, slik at brukeren ser "direkte lenker" i stedet for "SFX-meny" o.l.

Det er ikke unaturlig at f.eks. OCLC er en pådriver her, ved å si at WorldCat fungerer også som KB.

Page 15: Kollokvium om søketjenester

ERM

( = Electronic Resources Management )

Verktøy for å administrere bibliotekets avtaler om tilgang til e-ressurser

NTNU har anskaffet ERM fra EBSCO

Page 16: Kollokvium om søketjenester

Lenketjener

(= Link resolver )

Nettbasert tjeneste som presenterer en klikkbar lenke til et tilgjengelig eksemplar av en ressurs

UB bruker lenketjeneren SFX i samarbeidet innen Uniport-konsortiet

SFX er valgt som lenketjener av BIBSYS

Page 17: Kollokvium om søketjenester

Lenketjenere

Ex Libris SFX

OCLC OCLC Link Manager

EBSCO LinkSource

Serial Solutions 360 Link

Lenketjeneren trenger en kunnskapsbase for å finne tilgjengelige eksemplarer!

Page 18: Kollokvium om søketjenester

Lenketjeneren SFX

SFX genererer lenker i form av en NTNU-knapp i forskjellige søkesystemer

Page 19: Kollokvium om søketjenester

Lenketjenere og OpenURL

OpenURL er en metadataURLstandard som tillater dynamisk lenking mellom kilde og mål

Kilde (source) = Web of Science Mål (target) = Elsevier

Page 20: Kollokvium om søketjenester

Slik ser en OpenURL uthttp://x-port-sfx.uio.no/sfx_ubit?sid=google&auinit=E&aulast=Caroli&atitle=Spinal+en+plaque+meningiomas:+A+contemporary+experience&title=Neurosurgery&volume=55&issue=6&date=2004&spage=1275&issn=0148-396X

Page 21: Kollokvium om søketjenester

Lenketjener vs direkte lenking

Brukerne oppfatter ikke det geniale ved lenketjeneren på samme måte som oss!

De synes sfx bare er et ekstra unødvendig klikk

Tendens: discoveryverktøyene har en innbygd kunnskapsbase slik at direktelenking er mulig

Lenketjenerne viktigst for "tredjepartsystemer"

Page 22: Kollokvium om søketjenester

LinkSource

NTNU UB har anskaffet lenketjeneren LinkSource fra EBSCO

Page 23: Kollokvium om søketjenester

Søkeverktøy

( = Discovery tool )

En nettbasert tjeneste for å finne alle mulige ressurstyper bl.a. ved å søke i forskjellige søkekilder

NTNU har Metalib og Primo CentralVi "har" også Google Scholar

Page 24: Kollokvium om søketjenester

Søkeverktøy av forskjellige typer

Terminologi og navnebruk er nokså grumset

Discovery tool brukes gjerne om systemer hvor man samler søkedata til en felles indeks (f.eks. Primo)

Federated search brukes om systemer hvor det søkes distribuert, dvs i forskjellige kilder samtidig (f.eks. Metalib)

Page 25: Kollokvium om søketjenester

Søkeverktøy

Ex Libris Primo / Primo Central

OCLC Worldcat Local

EBSCO EBSCO Discovery Service (EDS)

Serial Solutions Summon

Dette er de "store" verktøyene for tidaDet finnes også flere (kommersielle og frie)Og så har vi Google ScholarTida har gått fra federated search (Metalib)

Page 26: Kollokvium om søketjenester

Søkeverktøyet Primo

NTNU har avtale om Primo ut 2013

Primo er valgt som discoveryverktøy av BIBSYS

Page 27: Kollokvium om søketjenester

EDS (EBSCO Discovery System)

NTNU UB har anskaffet discoveryverktøyet EDS fra EBSCO

Page 28: Kollokvium om søketjenester

Her passer det å ta pause

Page 29: Kollokvium om søketjenester

Google Scholar

Det som gjør Google Scholar til et så bra verktøy for NTNU-brukere er ikke at det har så god gjenfinningsfunksjonalitet eller at det har så stor dekning

men

at vi har god orden på våre beholdninger via en kunnskapsbase og lenkeserver

Page 30: Kollokvium om søketjenester

Skifte av discoverysystem

Det som gjør at det er mulig å skifte discoverysystem på forholdsvis kort tid

eller evt anskaffe et nytt hvis Google legger inn årene

at vi har god orden på våre beholdninger via en kunnskapsbase og lenkeserver

Page 31: Kollokvium om søketjenester

Må vi ha discoverysystem?

Tja.

● Det perfekte søkeverktøy finnes ikke● Ingen er så omfattende at de overflødiggjør

spesialdatabaser (aka fagdatabaser)● Det er usikkert om noe er så mye bedre enn

Google Scholar at det er pengene verdt● Av hensyn til Google Scholar og fagdatabaser

må vi fortsatt ha lenketjener

Page 32: Kollokvium om søketjenester

Må vi ha discoverysystem?

Dette er et fiktivt strategidokument. Se mer om det på neste side.

1. UB skal ikke investere i et nytt discoveryverktøy. For våre brukere ville dette ha bare en marginal verdi. I stedet skal vi konsentrere innsatsen om å levere materiale som er lisensiert for NTNU-brukere, samt å levere materiale som er produsert av vitenskapelige ansatte ved NTNU.

2. Enkelte av våre spesialsamlinger har fremdeles ikke gode nok muligheter for å bli funnet på det åpne nettet. Det er nødvendig å forbedre gjenfinningen ved å dele metadata gjennom nasjonale og internasjonale tjenester. Om nødvendig må vi fortsette å bruke BIBSYS-katalogen for å sikre tilgang inntil vi har bedre løsninger. 3. Vi må revurdere bibliotekets rolle i tilgjengeliggjøring av vitenskapelig informasjon. Vår rolle innen gjenfinningstjenester for slik informasjon har vært en del av vår identitet i årevis. Vi innser at å gi fra seg denne rollen til andre aktører vil få oss til å føle oss nakne og usikre. Derfor må vi legge nye planer for hvordan vi skal tilby våre tjenester for tilgang til vitenskapelig informasjon. 4. Vi vil fase ut Primo Central. For oppdaging av e-ressurseer finnes det tilstrekkelig gode alternativer.

5. Vi må undersøke om og i tilfelle hvordan BIBSYS-katalogen kan brukes som et tilgangsverktøy for vårt trykte materiale. Den kan være nyttig som et hjelpemiddel for å finne fram til "kjente dokumenter"

Page 33: Kollokvium om søketjenester

Dette var altså ren fiction

Men teksten er direkte oversatt fra et virkelig dokument fra Universitetet i Utrecht:

http://www.libereurope.eu/blog/thinking-the-unthinkable-a-library-without-a-catalogue-reconsidering-the-future-of-discovery-to

Utrecht er erstattet med NTNUOmega er erstattet med Primo CentralWebOPAC er erstattet med BIBSYS-katalogen

Page 34: Kollokvium om søketjenester

2. Tilbakeblikk

Gjennomgang av teknikker og begreper.Ikke nødvendigvis kronologisk

ccl: find (dylan and bob) or set=1

Page 35: Kollokvium om søketjenester

Ressurs

Informasjonsressurs

BokTekstdokumentBildeWebsideLydVideo osv osv osv

http://ohhaythurr.files.wordpress.com/2011/04/illum_manuscript_l1.jpg?w=570

Page 36: Kollokvium om søketjenester

What is a resource?

That is rather a deep question and the precise definition is still the subject of debate. For our purposes we can think of it as anything we can identify. You are a resource, as is your home page, this tutorial, the number one and the great white whale in Moby Dick.

(RDF)

Page 37: Kollokvium om søketjenester

Metadata

Strukturerte data som beskriver en ressurs

Typisk eksempel: bibliografiske data

100 $a Aalberg, Trond245 $a A Tool for Converting from MARC to FRBR700 $a Husby, Ole856 $u http://dx.doi.org/10.1007/11863878_41

Page 38: Kollokvium om søketjenester

Digresjon: Setninger

Utsagn om ting

http://orcid.org/0000-0002-9113-2142

http://dx.doi.org/10.1007/11863878_41

Ole Husby

A Tool for Converting from MARC to FRBR

isCreatorOf

hasName

hasTitle

Page 39: Kollokvium om søketjenester

UB skal ikke investere i et nytt discoveryverktøy. For våre brukere ville dette ha bare en marginal verdi. I stedet skal vi konsentrere innsatsen om å levere materiale som er lisensiert for NTNU-brukere, samt å levere materiale som er produsert av vitenskapelige ansatte ved NTNU. Enkelte av våre spesialsamlinger har fremdeles ikke gode nok muligheter for å bli funnet på det åpne nettet. Det er nødvendig å forbedre gjenfinningen ved å dele metadata gjennom nasjonale og internasjonale tjenester. Om nødvendig må vi fortsette å bruke BIBSYS-katalogen for å sikre tilgang inntil vi har bedre løsninger.Vi må revurdere bibliotekets rolle i tilgjengeliggjøring av vitenskapelig informasjon. Vår rolle innen gjenfinningstjenester for slik informasjon har vært en del av vår identitet i årevis. Vi innser at å gi fra seg denne rollen til andre aktører vil få oss til å føle oss nakne og usikre. Derfor må vi legge nye planer for hvordan vi skal tilby våre tjenester for tilgang til vitenskapelig informasjon. Vi vil fase ut Primo Central. For oppdaging av e-ressurseer finnes det tilstrekkelig gode alternativer. Vi må undersøke om og i tilfelle hvordan BIBSYS-katalogen kan brukes som et tilgangsverktøy for vårt trykte materiale. Den kan være nyttig som et hjelpemiddel for å finne fram til "kjente dokumenter"

The Library should not invest in a new library discovery tool. The benefit for our users will be marginal. Instead, we should concentrate on improving delivery of the materials purchased and licensed for NTNU users or produced by NTNU scholars. Discovery in the public cloud of special collections and certain other special materials is still inadequate. We need to improve findability by adding metadata to national and international initiatives. If necessary we may need to hold on to parts of the BIBSYS OPAC to ensure materials can be found until better solutions will become available. We should rethink the role of the library in giving access to scientific information. Our role in discovery of scientific information has been part of our library identity for years. We realise that relinquishing this role to other players can make us feel naked and uncertain. We have to rethink and redesign the way we offer our services for access to scientific information. We should phase out Primo. For discovery of electronic articles there are sufficient alternatives available. We should investigate if and how the BIBSYS OPAC can serve as a delivery tool for our printed materials. It might be useful as a “known item search”– tool.

Indeksering

Søking

Dokumenter

Database

Indeksering

Page 40: Kollokvium om søketjenester

Databaser

Referansedatabaser (A&I)laget for å gi god søking

Fulltekstdatabaserlaget for å gi tilgang til fulltekst

Bibliotekdatabaserlaget for å vise hva biblioteket har

Kunnskapsbaserlaget for å viser hva biblioteket har

Page 41: Kollokvium om søketjenester

Samkataloger og samsøking

Formål: søke i flere søkekilder på et sted

I gamle dager: Samkataloger = fysisk sammenslåing av flere kataloger til en

På 1990-tallet: Samsøking = metasøking = søking i forskjellige søkekilder fra ett grenssnitt

I dag: Discovery = fysisk sammenslåing av flere søkeindekser til en

Page 42: Kollokvium om søketjenester

Samsøking

Fungerte vha standardisering av søkeprotokoller (f.eks. Z39.50 som i MetaLib) og / eller via flerprotokollsystemer (IANI, MetaLib)

Page 43: Kollokvium om søketjenester

Samsøking var dømt til å mislykkes

fordi

● protokollene og standardene var for komplekse

● de lokale tolkingene av dem forskjellige● serverne var for dårlige og ustabile● sammenfletting og deduplisering av treff fra

forskjellige systemer var i praksis umulig i det virkelige liv

Page 44: Kollokvium om søketjenester

Søketeknologi før (IR)

Hvordan matche søketermer og indekstermer

Boolsk søking vs

Vektorsøking

Trunkering vs

Lingvistisk analyse

Page 45: Kollokvium om søketjenester

Søkespråk

CCL: Common Command Language (GENSØK)CQL: Contextual Query Language (Ask)

boolske operatorerfeltkodertrunkeringnærhetsoperatorersorteringvisningsformater osv osv osv

Page 46: Kollokvium om søketjenester

StandardiseringsbehovFrom: Even Hartmann Flood <[email protected]>

To: Ole Husby <[email protected]>

Jeg kan godt ha sagt noe slikt - jeg brukte mange systemer og det var jo ikke to som var like. Fortvilelsen var stor. Men noen tall husker jeg ikke. Jeg husker a du engang ga meg i oppdrag å skaffe eksempler på forskjellige søkespråk og jeg i et anfall av glad sadisme ga deg en rekke av de forskjellige utskriftkommandoene jeg hadde funnet i forskjellige tjenester.

Even

> >From: Ole Husby [mailto:[email protected]]

> >To: Even Hartmann Flood

> >Subject: Søkespråk

> >du sa en gang, kanskje for 20 år siden, at du hadde sjekket 50 søkesystemer

> >og funnet 49 forskjellige søkespråk. Eller kanskje var det helt andre tall.

> >Husker du?

> >

> >Ole

Page 47: Kollokvium om søketjenester

Søketeknologi nå (Google)

Hvordan matche søkeuttrykk og dokumenter

Kvasi-goolsk søkingStrengmatchingLenkeanalyseKontekstuelle, lokalitets-, personlige og sosiale aspekter

Ingen får vite nøyaktig hvordan dette virkerMen hvor mye har det å si?

Page 48: Kollokvium om søketjenester

Pathetic usersUsers are incredibly bad at finding and researching things on the web. A few years ago, I characterized users' research skills as "incompetent," and they’ve only gotten worse over time. "Pathetic" and "useless" are words that come to mind after this year's user testing.

In a recent study, for example, a user wanted to buy a highly protective yet girlish phone case as a gift for her daughter. While on Amazon.com, she engaged in random fishing expeditions into the product database, using search queries such as "pink impact resistant iphone 5 cover."

Jakob Nielsen http://www.nngroup.com/articles/search-navigation/

OK. Men er dette så patetisk da?

Page 49: Kollokvium om søketjenester

Hva er en søkemotor?

En tjeneste som søker fram nettsider etter en forutgående indeksering utført av en "robot"

Robotene er ikke flink til å finne deler av nettsider eller aggregat av nettsider, og klarer stort sett ikke å finne det som ikke er statiske sider med en fast adresse, f.eks. innholdet i databaser etc

Page 50: Kollokvium om søketjenester

Søkemotorer gjennom tidene

Page 51: Kollokvium om søketjenester

Hvordan jobber søkemotorene?

Hvem trenger å vite noe om det?

Hva er SEO?Hvordan virker PageRank?Hva er robots.txt?Hva er SiteMaps?Hva er schema.org og microdata?

Page 52: Kollokvium om søketjenester

Hvordan jobber BIBSYS Ask?

Hvem trenger å vite noe om det?

- søkeindekser- innhold i søkeindeksene (marc-felt)- søke ord, antall ord- søke fraser - lengde- spesialtegn, tegnkonvertering- basisindex