statistický modul ezproxy a další aktuální vývoj multidata praha

34
Statistický modul EZproxy a další aktuální vývoj MULTIDATA Praha Mgr. Petr Novák Knihovna psychologie FF UK 6.října 2009

Upload: zephr-waters

Post on 30-Dec-2015

46 views

Category:

Documents


0 download

DESCRIPTION

Statistický modul EZproxy a další aktuální vývoj MULTIDATA Praha. Mgr. Petr Novák Knihovna psychologie FF UK 6.října 2009. Pro č statistický modul?. OCLC (výrobce EZproxy) nabízí výčet různých nástrojů, komerčních i freeware / OSS Neposkytují podporu pro skupiny - PowerPoint PPT Presentation

TRANSCRIPT

Statistický modul EZproxy a další aktuální vývoj MULTIDATA Praha Mgr. Petr NovákKnihovna psychologie FF UK6.října 2009

Proč statistický modul?

OCLC (výrobce EZproxy) nabízí výčet různých nástrojů, komerčníchi freeware / OSS

Neposkytují podporu pro skupiny Neposkytují podporu pro různé způsoby

autentizace zdlouhavá práce s logy na pracovní stanici limity, nelze pracovat v dávkách

Statistický modul Autor RNDr. Vladimír Pávek Využívá XSLT procesor Saxon Vyžaduje Java Virtual Machine Otestováno na Windows 2003 server a Linux Testovací demo ke stažení z www.multidata.cz Konfigurace = editace XML souborů práce přímo na serveru EZproxy Generuje výstupy v ČJ a AJ

Skupiny v EZproxy

Jsou využívány: pro korektní autorizaci uživatelů dle součásti

instituce (fakulty a základní součásti na VŠ, zaměstnanci x čtenáři x testeři ve všech knihovnách)

pro generování log souborů využívaných pro statistický modul

předávány jsou různé kombinace skupin

Jak EZproxy ukládá logy Konfigurace v config.txt Ukládání v týdenních intervalech 2 druhy logů:

LogSPU -> spu%Y-%W.log= výchozí URL zdroje

Hlavní log -> ezp%Y-%W.log= kompletní komunikace uživatel-zdroj bez *.jpg a *.gif

Jak EZproxy ukládá logy - co se loguje IP adresa, uživatelské jméno, výčet skupin uživatele oddělený „+“, identifikátor session, datum a čas, kompletní HTTP request (např. GET

http://www.database.com HTTP/1.0), číslelný status HTTP žádosti (200 aj.), přenesená data v bajtech, (v případě hlavního logu ještě user-agent)

Ukázka SPU logu 70.108.162.87 johndoe Default+UNI+MEDICINE+Student

a05db43a-6c0b-40d6-b0ff-2502eddb337d [10/Aug/2009:01:37:13 +0100] "GET http://ezproxy.library.edu/login/ovid HTTP/1.1" 200 0

18.18.162.117 marysmith Default+UNI+LAW+Student

e87bd19a-677a-41a1-bcb8-4309a4818e84 [10/Aug/2009:01:37:13 +0100] "GET http://ovidsp.ovid.com/ovidweb.cgi HTTP/1.1" 200 0

60.133.100.17 billking Default+UNI+ARTS+THEOLOGY+Student+Staff

94b62205-6564-47a4-97e0-e6497f2b8546 [10/Aug/2009:01:58:55 +0100] "GET http://ezproxy.library.edu/login/ebsco HTTP/1.1" 200 0

90.177.148.39 mikelee Default+UNI+ARTS+MATH+Staff

476663da-d3ac-42c1-a07b-1131fb1c01e8 [10/Aug/2009:01:58:55 +0100] "GET http://search.ebscohost.com/login.aspx?authtype=id HTTP/1.1" 200 0

58.128.110.30 tracylong Default+UNI+COMPSCI+Student

6ea828af-6c11-4f66-90ae-093be1d73026 [10/Aug/2009:03:35:11 +0100] "GET http://www.computer.org/portal/site/usdl HTTP/1.1" 200 0

Způsoby zpřístupnění elektronických inf. zdrojů Autentizace na IP adresu (poskytovatel

zdroje zařadí IP adresu EZproxy serveru na seznam povolených IP adres) = typ 1

Autentizace jménem a heslem (poskytovatel zdroje zašle autentizační data - uživ.jméno a heslo -, ta jsou zadána do EZproxy a uživatel se jimi transparentně autentizuje vůči skrytému formuláři = typ 2

Ukázka SPU logu 70.108.162.87 johndoe Default+UNI+MEDICINE+Student

a05db43a-6c0b-40d6-b0ff-2502eddb337d [10/Aug/2009:01:37:13 +0100] "GET http://ezproxy.library.edu/login/ovid HTTP/1.1" 200 0

18.18.162.117 marysmith Default+UNI+LAW+Student

e87bd19a-677a-41a1-bcb8-4309a4818e84 [10/Aug/2009:01:37:13 +0100] "GET http://ovidsp.ovid.com/ovidweb.cgi HTTP/1.1" 200 0

60.133.100.17 billking Default+UNI+ARTS+THEOLOGY+Student+Staff

94b62205-6564-47a4-97e0-e6497f2b8546 [10/Aug/2009:01:58:55 +0100] "GET http://ezproxy.library.edu/login/ebsco HTTP/1.1" 200 0

90.177.148.39 mikelee Default+UNI+ARTS+MATH+Staff

476663da-d3ac-42c1-a07b-1131fb1c01e8 [10/Aug/2009:01:58:55 +0100] "GET http://search.ebscohost.com/login.aspx?authtype=id HTTP/1.1" 200 0

58.128.110.30 tracylong Default+UNI+COMPSCI+Student

6ea828af-6c11-4f66-90ae-093be1d73026 [10/Aug/2009:03:35:11 +0100] "GET http://www.computer.org/portal/site/usdl HTTP/1.1" 200 0

typ 1typ 1 typ 2typ 2

Rozdíl v logování

SPU log – srovnatelně zaznamená jak typ 1 (autentizace IP adresou), tak typ 2 (autentizace jménem a heslem)

Hlavní log - zaznamená kompletní komunikaci EZproxy se zdrojem dle typu 1, avšak pouhé otevření zdroje typu 2

-> jako zdroj pro statistiky využívanosti se hodí spíše SPU log, Hlavní log má doplňkovou funkci

Workflow práce se statistickým modulem – generování HTML výstupů Realizováno každý týden

Nakopírování čerstvého souboru LogSPU do /statistika (adresář se statistickým modulem)

Spuštění dávky Nakopírování výstupních HTML souborů do

požadované lokace – např. /docs/public (do této lokace lze obecně umístit jakékoli HTML a grafické soubory ke kterým není třeba ověřovat přístup)

Kontrola errorlog.html

Workflow práce se statistickým modulem - tit-url.xml Editace souboru tit-url.xml tit-url.xml obsahuje seznam zdrojů včetně URL a

výčtu přiřazených skupin Vždy při přidání nového zdroje Konvence pojmenování zdroje Pokud zdroj již není předplácen – nutno

konfiguraci v tit-url ponechat Ukázka záznamu

Workflow práce se statistickým modulem – analýza chybových URL

soubor errorlog.html slouží k nalezení chybných konfigurací v tit-

url.xml

Statistika dle zdrojů a měsíců pro celou knihovnu

K čemu může sloužit

Statistika dle zdrojů a měsíců pro celou knihovnupro jednotlivé skupiny

Využití pro marketing:sledování krátkodobých přístupů (trialy)meziměsíční změnycelkové úhrny

Statistika dle skupin

K čemu může sloužit

Statistika dle skupin pro celou knihovnu pro jednotlivé skupiny

Využití pro marketing: rozdíly mezi jednotlivými skupinami (fakultami) zdroj pro přepočet dle počtu reálných uživatelů

(studenti + akademičtí pracovníci, všichni čtenáři / aktivní uživatelé vzdáleného přístupu)

K čemu může sloužit

Statistika dle skupin a dle zdrojůpro jednotlivé skupiny

Využití pro marketing:rozdíly mezi jednotlivými skupinami

(fakultami) pro konkrétní zdrojezdroj pro analýzu využívanosti zdrojů ->

podklad pro akvizici

Další práce s výstupy v Excelu

Všechny prezentované tabulky lze z HTML přes schránku snadno metodou CTRL+C, CTRL+V zkopírovat do Excelu a dále zpracovávat

Výstup např. do CSV se ukázal jako zbytečný

K nabídce statistického modulu

Dodávka zahrnuje budoucí aktualizace Cena mírná , na dotázání

Dotazy ke statistickému modulu?

Čas na švestkovou buchtu

Autentizační modul možnosti autentizace a autorizace EZproxy: built-in by OCLC

:-) textový soubor s hesly LDAP

LDAP dle RFC 2307 (např. OpenLDAP) Active Directory, eDirectory

Shibboleth doména Windows pro ČR exotické knihovní systémy – Voyager, III, …

více viz http://www.oclc.org/us/en/support/documentation/ezproxy/usr/default.htm

ALEPH...?

Nativní podpora autentizace a autorizace uživatelů EZproxy v systému ALEPH chybí

Akademické knihovny disponují LDAP adresáři pro autentizaci k různým informačním procesům v rámci svých informačních systémů

Veřejné a vědecké knihovny LDAP podporu pro čtenáře nemívají

->>> potřeba autentizačního modulu

Autentizační modul

Autoři Jiří Rataj Lukáš Hlůže Martin Vojnar

testován na EZproxy serveru draco.multidata.cz

Výhoda řešení

standardizované LDAP rozhraní podporující EZproxy Shibboleth Identity Provider libovolné další služby (tiskové fronty, autentizace pracovních

stanic, …) aktuální data via LDAP – např.

účet aktivní ihned po vystavení průkazky účet odblokován okamžitě po uhrazení pokuty lze stanovit specifickou skupinu uživatelů pro vzdálený

přístup (nikoli nutně všichni registrovaní čtenáři)

Podrobnosti

možné zabezpečení komunikace EZproxy-LDAP: SSL (ldaps) + fixní IP adresa LDAP-mezivrstva-ALEPH: omezení jen pro localhost

komunikaci, pokud nebude LDAP a ALEPH na jednom serveru – lze implementovat https + fixní IP adresu

propustnost v řádu desítek autentizačních dotazů za minutu

mezivrstva LDAP – ALEPH je napsána v perlu vyžaduje ALEPH v.18 a vyšší

s licencí X-services

Obsah datagramu mezivrstvy

<?xml version="1.0" encoding="UTF-8"?><bor-auth><bor-id>carovy_kod_uzivatele</bor-id><bor-uid>primarni_id_uzivatele</bor-uid><bor-name>jmeno_uzivatele</bor-name><bor-email>email_uzivatele</bor-email><bor-lang>jazyk_komunikace_s_uzivatelem</bor-lang><bor-auth-ok>vysledek_verifikace</bor-auth-ok><bor-credit>stav_penezniho_uctu</bor-credit><bor-status>kategorie_uzivatele</bor-status><error>textova_zprava_o_vysledku_verifikace_v_pripade_chyby

</error></bor-auth>

Ukázka http://boa.ruk.cuni.cz:8991 ldapsearch -x -D

'uid=333,ou=EZPROXY,dc=ruk,dc=cuni,dc=cz' -W -v -h boa.ruk.cuni.cz -b 'uid=333,ou=EZPROXY,dc=ruk,dc=cuni,dc=cz' uid=333,ou=ezproxy,dc=ruk,dc=cuni,dc=cz

boa.ruk.cuni.cz ou=EZPROXY,dc=ruk,dc=cuni,dc=cz(objectClass=p

erson) uid 333

Vaše dotazy a komentáře…

… za které děkuji

[email protected]