hozzáférés és újrahasznosítás. a tel és az europeana a tudományos kutatás szolgálatában
TRANSCRIPT
Hozzáférés és újrahasznosítás
A TEL és az Europeana a
tudományos kutatás szolgálatában
Kovácsné Koreny ÁgnesFővárosi Szabó Ervin Könyvtár
Kutatók a virtuális térben
- 10 évnyi kutatás a virtuális kutatók információ-keresési és olvasási szokásairól
Centre for Comparative and International Business Research (CIBER), UK - Virtuális környezetben rendkívül aktívak, de a munka nagy részét
robotokkal végeztetik. - Mit szeretnének?
Közvetlen hozzáférést. Még több digitalizálást és a digitális anyagok elérését, hozzáférhetőségét - lehetőleg mindent
digitálisan. Drót nélküli hozzáférést. Mobil eszközöket, s rajtuk a tartalmat.
- Szeretnek ugrálni, minél többet, innen oda A több ezer elérhető oldalból egyet vagy kettőt néznek meg. 40%-uk nem megy vissza többé egy egyszer már használt oldalhoz.
- Hogy miért ugrálnak? Mert… … keresőmotort használnak, ami (túl) sok (nem releváns) találatot és
rengeteg linket ajánl fel, amelyek között élvezet ugrálni. … gyenge a keresési kompetenciájuk (Google - max. 2,2 szvas keresőkifejezés). … kevés az idejük.
- Másképp olvasnak- A horizontális felváltotta a vertikálisat- Gyorsan olvasnak - keresik a kulcsszavakat a szövegben- Cím, heading, összefoglaló (abstract) és a linkek fontossága.
- Olvasás helyett „rápillantás” - Néhány percet töltenek a kereséssel, illetve egy oldalon - 15 perc már sok. - Cikkre 3-4 percet szánnak - a rövidebb cikkeknek nagyobb esélyük van arra, hogy valaki elolvassa
őket. - Ha mégis hosszú, csak az összefoglalást olvassák el. Vagy letöltik, s elteszik maguknak máskorra.
- Gyors információ – információs falatkák Kis adagokban, mindent, gyorsan. A hátsó/oldalsó bejáratokon jönnek be (linkek). Nem használják a szépen kialakított, rájuk szabott keresőfelületeket.
- Mi alapján választanak? Megnézik az első találatot (ált. egy Wikipedia szócikk). Vagy megkérdezik a témában egy barátjukat, ismerősüket a Facebook-on, Twitteren. Ma fontosabb, ha valamit sokat ajánlanak, mint egy peer reviewed cikk.
http://ciber-research.eu/download/20120627-Tartu_CIBER.pdf
TEL vs. Europeana
Kezdete
Indulása
Üzemeltetője
Tartalma
Főbb adatok
„A” könyvtári aggregátor Közgyűjtemények digitális tára
1997 GABRIEL – közös portál létrehozása Európa nemzeti
könyvtárai számára
2005 március
CENL, LIBER, CERL
48 nemzeti könyvtár és a vezető európai szakkönyvtárak bibliográfiai
rekordjai és digitális objektumai
több mint 25.866.737 digitális objektum és 157.878.956 bibliográfiai
rekord
2005 EP-kezdeményezés az Europeana létrehozására
2008 november
Europeana Foundation
vezető európai könyvtárak, múzeumok, levéltárak és
archívumok digitális forrásai
39.276.880 digitális objektum 23.213.500 kép, 15.129.531 szöveg, 507.463
hang, 408.553 videó, 17.833 3D
„A” könyvtári aggregátor Közgyűjtemények digitális tára
A közös cél:
Lehetővé tenni a felhasználók számára az információkeresést és a tudáshoz való hozzáférést
Európa valamennyi nyelvén – közvetlenül, a portálokon keresztül és közvetetten, az adatokra épített különböző
alkalmazások révén.
„A” könyvtári aggregátor Közgyűjtemények digitális tára
A közös kihívás: a rendkívül heterogén adatok integrációja.
A megoldás:saját fejlesztésű infrastruktúra és munkafolyamat az adatbevitelre, az
indexálásra, az adatnormalizációra és az adatok közzétételére.
European Data Model (EDM):a szemantikus web elveit, megoldásait kihasználva képes a legkülönbözőbb
adatok nyílt környezetben való integrálására és újrahasznosítására.
Hogyan lehet a kor követelményeinek és a felhasználók
elvárásainak megfelelő, homogén tárgyszó alapú hozzáférést,
soknyelvű keresést, illetve a leírt források közötti szemantikai
kapcsolatokra is építő szolgáltatásokat biztosítani?
Knowledge Organisation Systems (KOS)
Tudásszervezési rendszerek- a dokumentumok és fogalmak összerendezését, rendszerré szervezését
végzik; plusz „tartalommal” gazdagítják az objektumokat- soknyelvű szótárak, tezauruszok, authority listák, névterek, osztályozási
rendszerek, ontológiák, taxonómiák
Kiválasztási szempontok- technikailag elérhető (Linked Data-n keresztül vagy dedikált repozitóriumban)- jól dokumentált, jól rendezett- open access- soknyelvű
Kiindulási alap
• A TEL óriási
mennyiségű
besorolási
adattal rendelkezik az általa
aggregált
bibliográfiai
adatoknak
köszönhetően.
Kihívás
• Sokféle rendsz
er, sokféle nyelv,
sokféle gyakorl
at.• A könyvtárak
többsége
helyi, nyelvfü
ggő rendszereket használtnak a szerzős
égi adatok
és a tartalo
m leírásár
a.• Szerzős
égi adatok konszolidációj
a• Tárgysz
ó-normali
zálás
Megoldás
• Nemzetközi és nyelv-függetl
en rendszerek
használata
• Virtual Internat
ional Authorit
y File (VIAF)
• International
Standard Name Identifier (ISNI)
• Common Europea
n Researc
h Classific
ation Scheme használ
ata• LCSH,
RAMEAU, SWD
tárgyszavak
kapcsolatrends
zere (MACS)
Eredmény
• Tárgyszó- és
névadat
normalizáció
minden bibliográfiai
adatra• 2012-
végére 120.000 linket sikerült bekötni
a francia,
brit, német
és svájci
nemzeti
könyvtárakból szárma
zó tárgysz
avak közé
• Mára a nyelve
ket átszöv
ő tárgyszó-bázis
Adatkonszolidáció
Adatgazdagítás az Europeana-ban
GeoNa
mes
• a világhálón szabadon hozzáférhető földrajzi névtér
• több mint 8 millió földrajzi név
• alkalmazás: 7M objektum esetében
• DublinCore mezők: spatial, coverage
DBpedia
• a Wikipédia adatait tartalmazza rendezett, strukturált formában
• jelenleg több, mint 4,58 millió bejegyzés 125 nyelven
• alkalmazás: 144K objektum esetében
• DublinCore mezők: creator, contributor, subject, type
GEMET
• GEneral Multilingual Environmental Thesaurus
• általános, többnyelvű környezetvédelmi tezaurusz
• alkalmazás: 9,1M objektum esetében
• DublinCore: subject, type
Semiu
m Tim
e
• alkalmazás: 10,2M objektum esetében
• DublinCore mezők: date, coverage, year
WHERE WHO WHAT WHEN
WHERE?
WHAT?
WHEN?
1) Portálegyszerű tárgyszavas keresés és böngészéstalálatok elemzése, szűkítése idő, hely és tárgy szerint
2) Open Search API regisztrált felhasználóknaka) The European Library Open Search API
A TEL portálon elérhető, a nemzeti és szakkönyvtárak gyűjteményeit leíró adatokhoz való hozzáférés.b) The European Library Open Dataset
Hozzáférés több mint 82 millió bibliográfiai rekordhoz Creative Commons CC0 1.0 licensz alapján.c) RLUK - Research Libraries UK database
Közel 20 millió bibliográfiai rekord 34 UK könyvtárból
3) Linked Open Data
Szolgáltatások kutatóknak
Szolgáltatások kutatóknak
PortálEuropeana Research - projekt és portál a kutatás
szolgáltában
APIk - REST-API – az adatok dinamikus
visszakereséséért- OIA-PMH – adatok aratása
Linked Open Data- 20 millió objektum letölthető RDF-ben
Speciális kutatások, fejlesztések
- Hogyan lehet az Europeana Newspapers projekt teljes szövegeit és képeit újrafelhasználásra elérhetővé tenni?
- Az Europeana Newspapers-re alapuló full-text API kifejlesztése
- További gyűjteményrészek kiemelése a kutatók számára
- Kutatói elvárások, igények és szükségletek folyamatos feltérképezése
- Tartalomfejlesztési stratégia kidolgozása a kutatói igények alapján
- Ösztöndíjprogram kidolgozása kutatók számára- …
Köszönöm a figyelmet!
Kovácsné Koreny ÁgnesFővárosi Szabó Ervin Könyvtár