kristina štrkalj despot christine möhrs - opus 4 | home · pdf filekristina...

Download Kristina Štrkalj Despot Christine Möhrs - OPUS 4 | Home · PDF fileKristina Štrkalj Despot, Christine Möhrs: Pogled u e-leksikografiju ... na disciplina u odnosu na lingvistiku

If you can't read please download the document

Upload: truongliem

Post on 06-Feb-2018

233 views

Category:

Documents


2 download

TRANSCRIPT

  • Kristina trkalj DespotInstitut za hrvatski jezik i jezikoslovljeUlica Republike Austrije, HR-10000 [email protected]

    Christine MhrsInstitut fr Deutsche SprachePostfach 10 16 21, D-68016 Mannheimmoehrs@ids-mannheim. de

    POGLED U E-LEKSIKOGRAFIJU

    U radu se daje pregled temeljnih pojmova i klasifikacija u podruju e-leksikografije. Donosi se klasifikacija e-ijenika, prikazuje se leksikografski proces izrade e-ijenika te pregled najrairenijih sustava za izradu rjenika (DWS) i sustava za pretragu korpusa (CQS). Kao primjer dobre prakse detaljnije se opisuje mreni ljenik elexiko (Institut za njemaki jezik u Mannheimu): prikazuju se njegovi ciljevi i namjena, teorijske i metodoloke postavke, moduli te mogunosti uporabe. Kao mogua osnova za izradu korpusno utemeljenoga e-ijenika hrvatskoga jezika koji bi bio u skladu s najrecentnijim leksikografskim (i uope lingvistikim) teorijama i praksama prikazuje se rad na mrenome leksiko-semantikome repozitoriju hrvatskoga jezika (baza semantikih okvira, predodbenih shema, kognitivnih primitiva i leksikih jedinica) u okvira projekta Repozitorij metafora hrvatskoga jezika.

    1. Era e-leksikografije1

    Hrvatska leksikografija2, ija je povijest dulja od petsto godina, uvijek jebila dio europske leksikografije izrasle na tradiciji latinskih ljenika i uvijek je bila na razini europskih leksikografskih dosega. No danas je, nakon velike i

    1 U radu dajemo prikaz jednojezine e-leksikografije (usmjereni smo samo na jednojezi-ne e-rjenike), dok su dvojezini i viejezini e-rjenici te enciklopedijska leksikografija izvan opsega ovoga rada. Ne ulazimo ni u sloenu problematiku odnosa i granica izmeu e-rjenika, e-leksikona i e-enciklopedije.

    2 Za pregled hrvatske leksikografije kroz povijest v. npr. Tafra i Fink Arsovski (2013).

    329

    Published in: Rasprave: asopis Instituta za Hrvatski Jezik i Jezikoslovlj Vol. 41 (2015), pp. 329-353

    mailto:[email protected]

  • Kristina trkalj Despot, Christine Mhrs: Pogled u e-leksikografijuRasprave 41/2 (2015.), str. 329-353

    vane promjene leksikografske paradigme koju je donijela era e-rjenika, a u koju se nismo na prikladan nain ukljuili, vrlo vidljiv zaostatak u broju i kva-liteti mrenih rjenika u odnosu na druge europske, pa i samo slavenske jezike.3 Naime, podruje e-leksikografije danas je ve toliko razvijeno da se smatra za-sebnim istraivakim podrujem, a u hrvatskoj leksikografiji gotovo je potpu-no izostao i prikaz razvoja i temeljnih pojmova toga podruja, i to je jo va-nije, praktina primjena novih istraivakih uvida i ugledanje u primjere do-bre prakse.

    U radu se stoga daje pregled temeljnih pojmova i klasifikacija u podruju e-leksikografije. Donosi se klasifikacija e-rjenika, prikazuje se leksikograf-ski proces izrade e-rjenika te pregled najrairenijih sustava za izradu rjenika (DWS) i sustava za pretragu korpusa (CQS). Osim na relevantnoj literaturi iz podruja e-leksikografije te na detaljnu uvidu u jedan od primjera dobre prak-se (elexiko Instituta za njemaki jezik), rad se temelji i na uvidima i rezultati-ma nastalima u okviru COST akcije European Network o f e-Lexicography, da-lje ENeL (http://www.elexicography.eu/)4.

    Elektronika leksikografija poela se razvijati sredinom prologa stoljea uglavnom pod nazivom raunalna leksikografija (computer/computational lexi-cography), a rjenici su se nazivali strojno itljivima, a ne elektronikim rje-nicima ili e-rjenicima5, to je danas uobiajen naziv. Prema Granger (2012), u to je vrijeme obzor istraivakoga podruja bio ogranien na uporabu rauna-la u leksikografskome poslu izrade rjenika (v. npr. Knowles 1990). U zaetci- ma elektronike leksikografije ni leksikografi ni korisnici rjenika nisu se slui-li raunalom: leksikografi su nastavili s papirnatom praksom leksikografske obrade (rabei dodue sve strukturiranije i strukturiranije forme), a raunalni su strunjaci onda obraivali podatke i pretvarali ih u digitalni oblik. Prvi rjenik koji je nainio kljuan iskorak od strojno itljiva rjenika prema leksikoj bazi podataka, koja je znaila i golemu pomo leksikografima u izradi rjenika, bio je Longman Dictionary o f Contemporary English (1978.), a podjednako je re-

    3 Eri e-rjenika i e-leksikografije prethodila je korpusna revolucija, kojoj su se hrvatski jezikoslovci prikljuili u samim zaetcima (tako je npr. 1999. nastao potpuno korpusno uteme-ljen Hrvatski estotni rjenik Milana Mogua, Maje Bratani i Marka Tadia). I korpusno su se i raunalno jezikoslovlje nastavili zadovoljavajue razvijati, no uglavnom je izostala sustavna lek-sikografska obrada dostupnih korpusa (izuzetak je Hrvatski kolski rjenik koji se temelji na Hr-vatskome jezinom korpusu, raunalnome korpusu tekstova hrvatskoga jezika koji je sastavnica institutskoga programa Hrvatska jezina riznica; pri obradbi obraivai su provjeravali znaenja i uporabu rijei u korpusu, ali primjeri nisu izravno preuzimani iz korpusa).

    4 Obje su autorice lanice Upravljakoga odbora navedene akcije.5 E-rjenikom smatramo rjenik u digitalnom obliku. Za podvrste e-rjenika v. sljedee po-

    glavlje.

    330

    http://www.elexicography.eu/)4

  • Kristina trkalj Despot, Christine Mhrs: Pogled u e-leksikografijuRasprave 41/2 (2015.), str. 329-353

    volucionaran bio i projekt COBUILD Johna Sinclaira6 s poetka osamdesetih godina prologa stoljea, ije je najvee postignue bilo izrada i analiza elek-tronikoga korpusa suvremenih tekstova, to je rezultiralo rjenikom objavlje-nim 1987. (Collins COBUILD English Language Dictionary).

    Prolo je zatim nekoliko godina do pojave prvih rjenika u obliku CD-ROM-a koji su konano omoguili i korisnicima da otkriju prednosti rjenika u elektro- nikome obliku, nakon ega se, od devedesetih godina prologa stoljea, razvoj znatno ubrzao pratei razvoj tehnologija i doveo do pojave prvih mrenih rje-nika poetkom tisuljea, a zatim, u dananje doba, i do potpunoga izjednaa-vanja pojmova leksikografije i e-leksikografije te do brojnih predvianja o sko- rom potpunom nestanku papirnatih rjenikih izdanja (Granger 2012). Ono to danas podruje e-leksikografije ini zasebnim istraivakim podrujem jest go-lem broj mrenih (popularno online) rjenika te golema bibliografija istraiva-kih doprinosa usmjerenih na to podruje.7 No pitanje postojanja leksikografske teorije ostalo je aktualno unato promjeni paradigme i medija. Tako primjerice predstavnici aarhuke kole (s Bergenholtzom kao najistaknutijim predstavni-kom, v. ur. Fuertes-Olivera i Bergenholtz 2011) dre da je leksikografija autonom-na disciplina u odnosu na lingvistiku i da pripada informacijskim znanostima te, dakako, ima razvijenu vlastitu teoriju (ili niz razliitih teorija)8 i praksu (v. npr. Tarp 2012). Naslanjaju se pritom, osim na dansku, i na rusku tradiciju (npr. Scerba 1940, Sorokoletov 1978), njemaku (npr. Duda i dr. 1986, Wiegand 1999, ur. Weber 1996 itd.) te na leksikografe poput Gouwsa (2011) ili Zguste (1992). No neki leksikografi koji pripadaju anglosaskoj tradiciji (npr. Atkins i Rundell 2008 te Bjoint 2010), slijedei primjerice Landaua (1984), dre da se ne moe govoriti o teoriji leksikografije, nego samo o praksi izrade rjenika.9

    6 U velikom meunarodnom viejezinom leksikografskom projektu Vijea Europe koji je vodio John Sinclair sudjelovala je i Hrvatska (voditeljica je bila Maja Bratani).

    7 Iscrpni popisi mrenih rjenika i bibliografskih jedinica koji pripadaju podruju e-leksi- kografije jesu npr. OBELEX (http://www.owid.de), bibliografski projekt (baza podataka) Institu-ta za njemaki jezik u Mannheimu te Hartmann (2007).

    8 Aarhuka kola zastupa funkcijsku teoriju leksikografije.9 Usp. Bjoint (2010: 381): I simply do not believe that there exists a theory of lexico-

    graphy, and I very much doubt that there can be one. Those who have proposed a general theory have not been found convincing by the community, and for good reasons. A theory is a system of ideas put forward to explain phenomena that are not otherwise explainable. A science has a the-ory, a craft does not. All natural phenomena need a theory, but how can there be a theory of the production of artefacts? There are theories of language, there may be theories of lexicology, but there is no theory of lexicography. Lexicography is about all a craft, the craft of preparing dicti-onaries, as well as an art, as Landau (2001) says. It may be becoming more scientific, but it has not become a science.

    331

    http://www.owid.de

  • Kristina trkalj Despot, Christine Mhrs: Pogled u e-leksikografijuRasprave 41/2 (2015.), str. 329-353

    2. Klasifikacija e-rjenikaU de Schryver (2003: 146) ujedinjeno je nekoliko razliitih klasifikacija

    elektronikih rjenika te je ponuena klasifikacija koja se vrlo esto citira i i-roko je prihvaena. Ondje se primarno razlikuju: 1.) rjenik na samostojeemu raunalu kojim se ne moe koristiti vie korisnika istodobno, nego jedan po je -dan korisnik i 2.) rjenik na mrenome raunalu kojim se moe koristiti vie ko-risnika istodobno. Sekundarna podjela drugoga tipa rjenika nadalje ukljuuje: 1.) unutarmreni (intranetski) i 2.) mreni (ili internetski) rjenik (v. tablicu 1).

    ELEKTRONIKI RJENIK

    Rjenik na samostojeemu raunalu Rjenik na mrenome raunalu(jedan po jedan korisnik) (vie korisnika istodobno)

    Rjenik na Rjenik na Unutarmreni Mrenidlanovniku CD-ROM-u (intranetski rjenik) (internetski)

    rjenikJedan korisnik koristi Jedan Grupa korisnika Korisnici iromse dlanovnikom kako korisnik koristi se svijeta koristebi pristupio rjeniku koristi se prijenosnim/ se prijenosnim/pohranjenu na prijenosnim/ stolnim raunalom stolnimmalenome disku. stolnim kako bi pristupila raunalima,

    raunalom rjeniku pohranjenu mobilnimkako bi na lokalnome ureajimapristupio posluitelju. itd. kako birjeniku pristupili rjenikupohranjenu pohranjenuna CD- na mrenomeROM-u. posluitelju.

    Tablica 1. Klasifikacija elektronikih rjenika (prema de Schryver 2003 i Klosa 2013)