magyar tudományos akadémia
DESCRIPTION
Magyar Tudományos Akadémia. Budapest, 2011. november 24. HATÁRTALANÍTÁS ÉS HT-SZÓTÁR. Lanstyák István–Benő Attila. Miről lesz szó?. 1. Bevezetés: alapfogalmak – határtalanítás – ht-szótár 2. Ez történt (a határtalanítás rövid története, tanulságokkal) - PowerPoint PPT PresentationTRANSCRIPT
Magyar Tudományos Akadémia
Budapest, 2011. november 24.
HATÁRTALANÍTÁS ÉS HT-SZÓTÁR
Lanstyák István–Benő Attila
Miről lesz szó?
1. Bevezetés: alapfogalmak
– határtalanítás– ht-szótár
2. Ez történt (a határtalanítás rövid története, tanulságokkal)
3. A Termini magyar–magyar szótár és adatbázis bemutatása
1. Bevezetés
Alapfogalmak
Határtalanítás
– banalitás: magyar ≠ magyarországi, ahogy sokan hiszik Magyarországon
– határtalanítás általában
– szóhatártalanítás
GYIK: tyepi mint „rendes szó”)
– névhatártalanítás
– Kárpát-medencei magyar nyelvi korpusz
Ht-szótár
– Termini magyar–magyar szótár és adatbázis
(magyar–magyar–magyar–magyar–magyar–magyar–magyar–magyar szótár )
2. Ez történt
Előzmények–1994
Tájszógyűjtés
– a Magyar Nyelvjárások Atlasza gyűjtési munkálatai során az Atlasz munkatársai néhány Fv szót is följegyeztek (tájszóként) és közre is adtak a szlovákiai kutatópontok tájszavai közt
– nem tudni, hogy tudatában voltak-e annak, hogy ezek nem „ártatlan” tájszavak, hanem a nyelvművelők által megbélyegzett elemek
Nyelvművelői megközelítés
– „nyelvhelyesség” és a ht-szavak: a határon túli magyarok nyelvhasználatában nincs olyan fogalom, amelyet ne lehetne „magyarul“ (értsd: magyarországi magyar nyelven) kifejezni, ezért a sajátos határon túli magyar szavak használata még a nyelvhasználat alacsonyabb szintjén, a mindennapi beszélt nyelvben sem indokolt, az írásbeliség magasabb szintjein pedig szóba sem jöhet
→ nyelvi homogenista ideológia, amely abban a korban egyeduralkodó volt
!!! a politikai rendszer homogenista törekvései is hathattak rá
a) közvetlen kölcsönszavak: nagyfokú elutasítás (nem magyar szavak, sőt nem is szavak)
b) közvetett kölcsönszavak:
– egy részük: „fordítási hiba” – más részüket: kényszerűségből elfogadták
! egyik csoportot sem tartották tudományos vizsgálatra érdemesnek
→ nyelvi performancionalista ideológia
– a platonista ideológia egyik válfaja
– domináns volt a kor nyelvművelésében
– megtagadta a nyelvi státuszt azoktól az elemektől, amelyek a szisztemista és/vagy purista ideológia szempontjából nem voltak megfelelőek (pl. a szó idézőjelezése)
Helyesírási kéziszótár és Magyar helyesírási szótár
– (tudtunkkal) egyedüli magyarországi kiadvány, amely nem megbélyegzési szándékkal közölt határon túli szókészleti elemeket
– HKsz. (1988): alapiskola 'általános iskola‘, egységes földműves-szövetkezet 'mezőgazdasági termelőszövetkezet‘; Duna Menti Múzeum
– MHSz. (1999): alapiskola, Duna Menti Múzeum
Szombathely 1983
– 4. nemzetközi magyar nyelvész-kongresszus
– Pete István 1988. A magyar nyelv állami változatai (Kárpátukrán változat).
Kiss Jenő–Szűts László szerk.,
A magyar nyelv rétegződése I–II, 779–789.
Budapest: Akadémiai Kiadó.
– a magyar nyelv állami változatainak fogalma
– a szótárkészítők a jövőben „nagyobb mértékben“ legyenek tekintettel a magyarországi standardtól eltérő ht szókészlettani sajátosságokra
→ mérföldkő: a pluralista és vernakularista nyelvi ideológiák nyílt megjelenése
! a „nyelvmentők” részéről visszhangtalan maradt
Eger 1994
– 6. nemzetközi magyar nyelvészkongresszus
– Lanstyák István–Szabómihály Gizella 1994/1998. Standard – köznyelv – nemzeti nyelv. Kontra Miklós--Saly Noémi szerk., Nyelvmentés vagy nyelvárulás? (Vita a határon túli magyar nyelvhasználatról.), 211–216. Budapest: Osiris Kiadó.
– a standard minden kritériumának megfelelő szókészleti elemek bemutatása
– konklúzió:
– a Fv nyelvváltozatok sajátos szókincsének három rétege: standard, köznyelvi, szubstandard
→ ezek közül a standard és a köznyelvi elemeket szükséges volna felvenni az ÉKsz. új kiadásába
„Ha nem a magyar nyelv értelmező szótára szorít nekik helyet, akkor vajon milyen nyelvű szótárba kell őket utasítani?”
– Pusztai Ferenc 1994. Leíró lexikográfiánk változó és változatlan feladatai. Magyar Nyelv 90, 413–421.
– szükség van rá, hogy a ht magyar nyelvváltozatok formális regisztereiben használatos elemek egy része bekerüljön a szótárakba
!!! ezek közt nem lehetnek „kevert“ elemek
!!! a készülő kiadásban még nem lehet erről szó, megfelelő háttérkutatások hiányában
→ nyelvi purizmus
A „hőskor”1994–2003
Budapest 1994 ősze
– a Nyelvtudományi Intézet átértékelte az értelmező kéziszótár új kiadásának koncepcióját
– Er: Péntek János és Szilágyi N. Sándor
– Fv: Lanstyák István
– Ka: Csernicskó István
(– Va: Ágoston Mihály)
1995 elejePusztai Ferenc 8 irányelve
– 2. irányelv: a szótárba bevett lexéma nem lehetett volna „kevert elem“ (közvetlen kölcsönszó, tükörszó, tükörkifejezés, jelentésbeli kölcsönszó)
→ nyelvi purizmus
– 3. irányelv: adatolható kellett volna legyen az igényes publicisztikából, szakirodalomból, sőt a szépirodalomból is, méghozzá egynél több szerzőtől
→ nyelvi belletrizmus, nyelvi elitizmus, nyelvi elegantizmus
→ e két irányelv figyelembevételével egyetlen lexéma se kerülhetett volna be a szótárba
Szótári munkálatok1995–2003
– a felkért szakemberek javaslatait Pusztai Ferenc korrektül bírálta el
!!! egy-egy szó szótárazásának elutasítása sosem történt pusztán purista megfontolások alapján, hanem az a szótár egészének logikájából következett, legtöbbször a következetesség szempontjai indokolták
→ Er, Fv, Ka szójegyzékek: három önálló szójegyzék
– egymástól teljesen függetlenül jöttek létre
– az egyes régiókban dolgozó munkatársak nem ismerték egymás szójegyzékeit, így nem is történt köztük semmiféle egyeztetés
– ennek ellenére vannak a kéziszótárban „többrégiós” szavak, azok, amelyeket egynél több régióban javasoltak felvételre a munkatársak, egymástól függetlenül
!!! a legtöbb közös szó viszont nem tartalmazza mindhárom régió felségjelzését
→ megtévesztő, hiszen valamely régió felségjelzésének megléte azt implikálja, hogy a másik két ht régióban az illető szó nem használatos
– pl. a blokk ‘lakótelepi panelház; tömbház’ jelentésben az ÉKSz.2-ben csak Er és Fv szóként van jelölve, holott a Ka nyelvváltozatokban is használatos (sőt minden Kárpát-medencei ht régióban)
Példák egyéb „áldozatul esett” Ka szavakra
– átmegy ‘<betegség, fáradtság stb.> elmúlik, megszűnik’
– balkon (nem „választékos”), balkonos
– bufet ‘büfé’
– diplom ‘elismerő oklevél’
– elsős ‘elsőéves’, másodikos ‘másodéves’ stb.
– fal ‘szekrénysor’
– fizikai személy ‘természetes személy’
– fogpaszta (nem „régies”)
– halász ‘horgász’, halászik ‘horgászik’
– házasságlevél ‘házassági anyakönyvi kivonat’
– infarkt ‘(szív)infarktus’
– internát ‘diákotthon’, internátus (nem „régies”)
– kapitány ‘százados’ (nem „régies”)
– kaszárnya (nem „régies”)
– kibeszéli magát ‘kimagyarázkodik’ (nem „ritka”)
– kihágás (nem „régies”)
– község ‘önálló jogállású település (város is)’
– kurz ‘tanfolyam’
– kurzus (nem „kissé választékos”, inkább „bizalmas”)
– leesik ‘elesik’
– norma ‘szabvány’
– paciens ‘páciens’
– pasztelina, plasztelina ‘gyurma’
– polgár ‘lakos’
– poliklinika ‘rendelőintézet’
– prorektor ‘rektorhelyettes’
– rászed ‘rávesz’
– respekt ‘tekintély’
– fizetetlen szabadság ‘fizetés nélküli szabadság’
– szesztra ‘nővér, ápolónő’
– szirup ‘szörp’
– szvetter ‘kardigán’ (nem „régies”)
– tanító ‘tanár’
– útadó ‘súlyadó’
– vetrovka ‘dzseki’
– vizsgán van ‘vizsgázik’
Hu gondok
!!! mintha még a Hu anyaggal se történt volna mindig egyeztetés
– respekt
→ valójában a nyelvi konzervativizmus (nyelvi purizmus?, nyelvi originalizmus? érvényesülése)
Stílusminősítés
– az egyeztetés hiánya miatt még a többrégiósként felvett szavakban sem biztos, hogy az azonos stílusminősítés azonos stílusértéket takar-e, ill. az eltérő stílusminősítés eltérő stílusértéket takar-e (nem kaptunk szerkesztési útmutatót, sem irányelveket)
A Termini Kutatóhálózat szóhatártalanító
munkálatai2003–
A „papír nélküli papírszótár” korszaka
(2003—2007)
Regionális szólisták2003 –2004
Papír nélküli „papírszótárak”
– regionális szólisták az Osiris Idegen szavak szótára számára
– munkaeszközök:
a) szövegszerkesztő: papírszótár típusú szócikkek
b) levelezőprogram: kapcsolattartás, egyeztetés, anyagok átküldése egymásnak
c) koordinátor
– listák összehasonlítása
– változtatások bevitele
– értelmezések egységesítése
– stílusértékek egymáshoz viszonyítása
– példamondatok egyeztetése
– javaslatok új szócikkekre
→ „közvetett közös fejlesztés”
„Csatlakozási tárgyalások”
– 2003 őszén: a négy nagyrégióban kezdődtek a munkálatok (Er, Fv, Va, Ka)
– 2003 végén: két kisrégió csatlakozása (Mv, Őv)
– 2004 tavaszán: a hiányzó kisrégió csatlakozása (Hv)
Ht-lista2004–2007
– 2004 júniusában: a hét régió saját szójegyzékeinek összeolvasztása
→ ht-lista
– áttekinthetőbbé vált a nyelvi anyag, s némileg könnyebben kezelhetővé is
– minden változtatást a koordinátor vitt be (a ht-lista szétfejlődésének megelőzése érdekében)
Ht-online(2007—)
– 2006 kora tavasza: Juhász Tihamér kezdeményezése
→ fordulópont a szóhatártalanítás történetében
– 2007 folyamán a szótár anyaga felkerült a világhálóra, s létrejött egy interaktív online szótár, amely fokozatosan multifunkciós adatbázissá bővült
a) szótárként: hozzáférhetővé vált a látogatók számára
b) multifunkciós adatbázisként: hatalmas lehetőségeket magában rejtő, hatékony munkaeszközzé vált az szerkesztők, ill. kutatók számára
3. A Termini magyar–magyar
szótár és adatbázis
Főbb jellemzői
1. Az együttműködést segítő funkciók
a) Szimultán módon elérhető
– egymástól több száz kilométerre, különböző országokban tartózkodó munkatársak egyszerre dolgozhatnak ugyanazzal az adatbázissal
b) Gyors kommunikációs lehetőséget biztosít
– ímélküldés a keresőfelületről
– megjegyzések fűzése az egyes szócikkekhez, azok részeihez
a) kényelmesen kezelhető szerkesztőfelület
2. A szerkesztőmunkát megkönnyítő további funkciók
b) listázási lehetőségek, pl.:
– adathiányos szócikkek
– konstruált példamondatokat tartalmazó szócikkek
– belső megjegyzéssel ellátott szócikkek
– külső megjegyzéssel ellátott szócikkek
– példamondat nélküli jelentéseket tartalmazó címszók
– felségjelzések régiók szerint
– teljes lista készítése (→ ezáltal újjáéledt az egykori ht-lista)
– részleges listák készítése, pl. A–C kezdőbetűs szócikkek
– regionális listák készítése (→ ezáltal a megszüntetett regionális listák is újjáéledtek)
– a külső felhasználók elől elrejtett (nem kész) szócikkek
c) kimutatások
– pl. példamondat-típusok száma
a) listázások– keresési kifejezések rostált listája
b) kimutatások
(– leggyakrabban megtalált szócikkek)
– felhasználók regisztrációjának időbeli eloszlása
– keresések időbeli eloszlása
3. A továbbfejlesztést segítő funkciók
a) a kereső- és a böngészőfelületről elérhető „módosítási lista”
4. Felügyeleti és visszakereshetőségi funkciók
– a módosítási lista segítségével az egyes szerkesztők tevékenysége követhetővé és szükség esetén visszafordíthatóvá vált
→ a program nem egyszerűen felülírja az aktuális szerkesztés előtti változatot, hanem meg is őrzi (szerkesztéstörténet)
b) listázások– egy-egy szerkesztő által módosított
szócikkek jegyzéke
c) kimutatások, pl.:
– egy-egy szerkesztő által módosított szócikkek száma és időbeli eloszlása
– felségjelzések száma régiók szerint
a) listázások, pl.:
– stílusminősítések
– stílusminősítések kombinációi
– többrégiós szócikkek listája
– egyszerűsített listák készítése (pl. csak címszót, szófaji minősítést, nyelvtani alakokat, felségjelzéseket tartalmazók)
5. Kutatási funkciók
b) kimutatások, pl.:
– különbözõ szófajú szavak száma
a) keresés
– címszóban, jelentésben, példamondatban
– szó elején, szó belsejében, szó végén, teljes egyezéssel
– ékezetes és ékezet nélküli keresés
6. Online szótári funkciók
b) böngészés
– szó elején, szó belsejében, szó végén, teljes egyezéssel
– választható a teljes szócikk vagy címszó megjelenítése
7. Interaktivitás
a) „megjegyzés” funkció a regisztrált felhasználók megjegyzéseket
fűzhetnek az egyes szócikkekhez
b) fórum
(eddig még nem sikerült aktívvá tenni)
Újszerű vonások
Többdimenziós stílusminősítési
rendszer
– az ÉKSz.2-munkálatok során egyértelművé vált: a hagyományos minősítésekkel lehetetlen szakmailag korrekt módon megragadni a ht szókincs változatosságát (amiképp egyébként a közmagyar szókincsét is…)
– legnagyobb probléma: a minősítések egy részének többértelműsége, ill. néhány minősítés „ideologizáltsága”
A Termini stílusminősítési rendszer jellemzői:
a) többdimenziós rendszer: a minősítés különféle szempontjai nem keverednek, hanem elválnak egymástól
b) a semleges stílusértéket is jelöljük (a listázások, azaz a kutatás megkönnyítése végett)
c) nem alkalmazunk ideologikus minősítéseket, mint az ÉKSz.2 „vulgáris” és „kiveszőben” minősítése, ill. „pongyola használatú”, „helyesebben” stb. kitételei
A stílusminősítési rendszer dimenziói
– a földrajzi és társadalmi (iskolázottsági, kétnyelvűségi, korosztályi) dialektusokra vonatkozó minősítések
1. Dialektális dimenzió
2. Regiszterbeli dimenzió
– azok a stílusértékek, amelyekre a bizonyos specializált tevékenységekhez vagy élethelyzetekhez kötődő (vagy nem kötődő) lexémák tesznek szert
3. Stílusváltozati dimenzió
– a beszédhelyzet formalitása által meghatározott regiszterek alkotják
4. Időbeliség dimenziója
– a nyelv korábbi állapotából fennmaradt elemek mai nyelvi sajátos stílusértéke fejeződik ki ezekben a minősítésekben
5. Érzelmi dimenzió
– a lexémákhoz való pozitív vagy negatív beszélői viszonyulás, érzelmi telítettség
6. Egyéb jelölések– gyakoriság
– felségjelzések
Példamondatok minősítése
– nagyban meghatározza a szövegrészletben található címszó jelentésének és stílusértékének megállapítását
A példamondatok státusza
A szó és a beszélő régióbeli hovatartozásának
megkülönböztetése
– ehhez az a felismerés vezetett, hogy egy beszélő alkalmanként más régió szavait is használja, s az ilyen használat dokumentálásának is nagy az értéke
(pl. Hu turisták Er szavakat tanulnak meg, Er beszélő Szlovákiában vállal munkát, és Fv szavakat tanul meg)
A példamondatok nagy száma
– mivel nem korlátoz minket a terjedelem úgy, mint a papírszótárak esetében, korlátok nélkül gyűjtjük a példamondatokat, ha kell, bő kontextussal
(a kontextus segít a jelentés/árnyalat/ és a stílusérték megállapításában)
→ a Termini-szótár és adatbázis így egyre inkább „korpusz alapúvá” válik, bár a „korpusz”-t egyelőre még csak szövegrészletek képviselik
– fontolóra vesszük, hogy nem lehetne-e a Termini-szótár példamondatait hasonló módon generálni egy korpuszból, mint azt teszi pl. az MNSZ, természetesen megőrizve szótár jellegét
– ehhez első lépésnek tekinthető a nemrégiben elkezdett fejlesztés: példamondatok automatikus keresése az interneten, a példamondatokat tartalmazó oldalak automatikus eltárolása
Az eddig megtett út
Az értelmező kéziszótár „blokk”-kal kezdődő szócikkbokra
A ht-lista „blokk” szócikke
A Termini-szótár és adatbázis „blokk” szócikkének
1.változata(két-két példamondattal)
A Termini-szótár és adatbázis „blokk” szócikkének
2.változata(az összes példamondattal)
Tervek és álmok
a) ← a szótári adatbázis korpusz hátterűvé való alakítása
b) értelmezéseknek a denotátumot ábrázoló fényképekkel való kiegészítése tárgyat jelölő szavak esetén
c) azokban az esetekben, amikor a denotátum helyi kulturális sajátság, néprajzi leírások beiktatása, ill. belinkelése (saját adatbázisból)
d) a beszélt nyelvi példamondatok meghallgathatósága
e) a szótárban közölt elemekre vonatkozó bibliográfia létrehozása, ill. maguknak a szövegeknek az összegyűjtése és belinkelése
→ a fejlesztések nyomán az, ami szójegyzékként indult, szótárként folytatódott s többfunkciós adatbázissá vált, fokozatosan olyan komplex információs rendszerré nőhetné ki magát, amely magába foglalná a szótár, a strukturált adatbázis, a nyelvi korpusz, valamint a lexikon és az enciklopédia jellemzőit