magyar tudományos akadémia

98
Magyar Tudományos Akadémia Budapest, 2011. november 24.

Upload: parley

Post on 11-Jan-2016

45 views

Category:

Documents


4 download

DESCRIPTION

Magyar Tudományos Akadémia. Budapest, 2011. november 24. HATÁRTALANÍTÁS ÉS HT-SZÓTÁR. Lanstyák István–Benő Attila. Miről lesz szó?. 1. Bevezetés: alapfogalmak – határtalanítás – ht-szótár 2. Ez történt (a határtalanítás rövid története, tanulságokkal) - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Magyar Tudományos Akadémia

Magyar Tudományos Akadémia

Budapest, 2011. november 24.

Page 2: Magyar Tudományos Akadémia

HATÁRTALANÍTÁS ÉS HT-SZÓTÁR

Lanstyák István–Benő Attila

Page 3: Magyar Tudományos Akadémia

Miről lesz szó?

1. Bevezetés: alapfogalmak

– határtalanítás– ht-szótár

2. Ez történt (a határtalanítás rövid története, tanulságokkal)

3. A Termini magyar–magyar szótár és adatbázis bemutatása

Page 4: Magyar Tudományos Akadémia

1. Bevezetés

Page 5: Magyar Tudományos Akadémia

Alapfogalmak

Page 6: Magyar Tudományos Akadémia

Határtalanítás

– banalitás: magyar ≠ magyarországi, ahogy sokan hiszik Magyarországon

– határtalanítás általában

– szóhatártalanítás

GYIK: tyepi mint „rendes szó”)

– névhatártalanítás

– Kárpát-medencei magyar nyelvi korpusz

Page 7: Magyar Tudományos Akadémia

Ht-szótár

– Termini magyar–magyar szótár és adatbázis

(magyar–magyar–magyar–magyar–magyar–magyar–magyar–magyar szótár )

Page 8: Magyar Tudományos Akadémia

2. Ez történt

Page 9: Magyar Tudományos Akadémia

Előzmények–1994

Page 10: Magyar Tudományos Akadémia

Tájszógyűjtés

– a Magyar Nyelvjárások Atlasza gyűjtési munkálatai során az Atlasz munkatársai néhány Fv szót is följegyeztek (tájszóként) és közre is adtak a szlovákiai kutatópontok tájszavai közt

– nem tudni, hogy tudatában voltak-e annak, hogy ezek nem „ártatlan” tájszavak, hanem a nyelvművelők által megbélyegzett elemek

Page 11: Magyar Tudományos Akadémia

Nyelvművelői megközelítés

– „nyelvhelyesség” és a ht-szavak: a határon túli magyarok nyelvhasználatában nincs olyan fogalom, amelyet ne lehetne „magyarul“ (értsd: magyarországi magyar nyelven) kifejezni, ezért a sajátos határon túli magyar szavak használata még a nyelvhasználat alacsonyabb szintjén, a mindennapi beszélt nyelvben sem indokolt, az írásbeliség magasabb szintjein pedig szóba sem jöhet

Page 12: Magyar Tudományos Akadémia

→ nyelvi homogenista ideológia, amely abban a korban egyeduralkodó volt

!!! a politikai rendszer homogenista törekvései is hathattak rá

Page 13: Magyar Tudományos Akadémia

a) közvetlen kölcsönszavak: nagyfokú elutasítás (nem magyar szavak, sőt nem is szavak)

b) közvetett kölcsönszavak:

– egy részük: „fordítási hiba” – más részüket: kényszerűségből elfogadták

! egyik csoportot sem tartották tudományos vizsgálatra érdemesnek

Page 14: Magyar Tudományos Akadémia

→ nyelvi performancionalista ideológia

– a platonista ideológia egyik válfaja

– domináns volt a kor nyelvművelésében

– megtagadta a nyelvi státuszt azoktól az elemektől, amelyek a szisztemista és/vagy purista ideológia szempontjából nem voltak megfelelőek (pl. a szó idézőjelezése)

Page 15: Magyar Tudományos Akadémia

Helyesírási kéziszótár és Magyar helyesírási szótár

– (tudtunkkal) egyedüli magyarországi kiadvány, amely nem megbélyegzési szándékkal közölt határon túli szókészleti elemeket

Page 16: Magyar Tudományos Akadémia

– HKsz. (1988): alapiskola 'általános iskola‘, egységes földműves-szövetkezet 'mezőgazdasági termelőszövetkezet‘; Duna Menti Múzeum

– MHSz. (1999): alapiskola, Duna Menti Múzeum

Page 17: Magyar Tudományos Akadémia

Szombathely 1983

– 4. nemzetközi magyar nyelvész-kongresszus

– Pete István 1988. A magyar nyelv állami változatai (Kárpátukrán változat).

Kiss Jenő–Szűts László szerk.,

A magyar nyelv rétegződése I–II, 779–789.

Budapest: Akadémiai Kiadó.

Page 18: Magyar Tudományos Akadémia

– a magyar nyelv állami változatainak fogalma

– a szótárkészítők a jövőben „nagyobb mértékben“ legyenek tekintettel a magyarországi standardtól eltérő ht szókészlettani sajátosságokra

→ mérföldkő: a pluralista és vernakularista nyelvi ideológiák nyílt megjelenése

! a „nyelvmentők” részéről visszhangtalan maradt

Page 19: Magyar Tudományos Akadémia

Eger 1994

– 6. nemzetközi magyar nyelvészkongresszus

– Lanstyák István–Szabómihály Gizella 1994/1998. Standard – köznyelv – nemzeti nyelv. Kontra Miklós--Saly Noémi szerk., Nyelvmentés vagy nyelvárulás? (Vita a határon túli magyar nyelvhasználatról.), 211–216. Budapest: Osiris Kiadó.

Page 20: Magyar Tudományos Akadémia

– a standard minden kritériumának megfelelő szókészleti elemek bemutatása

– konklúzió:

– a Fv nyelvváltozatok sajátos szókincsének három rétege: standard, köznyelvi, szubstandard

→ ezek közül a standard és a köznyelvi elemeket szükséges volna felvenni az ÉKsz. új kiadásába

„Ha nem a magyar nyelv értelmező szótára szorít nekik helyet, akkor vajon milyen nyelvű szótárba kell őket utasítani?”

Page 21: Magyar Tudományos Akadémia

– Pusztai Ferenc 1994. Leíró lexikográfiánk változó és változatlan feladatai. Magyar Nyelv 90, 413–421.

– szükség van rá, hogy a ht magyar nyelvváltozatok formális regisztereiben használatos elemek egy része bekerüljön a szótárakba

!!! ezek közt nem lehetnek „kevert“ elemek

!!! a készülő kiadásban még nem lehet erről szó, megfelelő háttérkutatások hiányában

→ nyelvi purizmus

Page 22: Magyar Tudományos Akadémia

A „hőskor”1994–2003

Page 23: Magyar Tudományos Akadémia

Budapest 1994 ősze

– a Nyelvtudományi Intézet átértékelte az értelmező kéziszótár új kiadásának koncepcióját

– Er: Péntek János és Szilágyi N. Sándor

– Fv: Lanstyák István

– Ka: Csernicskó István

(– Va: Ágoston Mihály)

Page 24: Magyar Tudományos Akadémia

1995 elejePusztai Ferenc 8 irányelve

– 2. irányelv: a szótárba bevett lexéma nem lehetett volna „kevert elem“ (közvetlen kölcsönszó, tükörszó, tükörkifejezés, jelentésbeli kölcsönszó)

→ nyelvi purizmus

Page 25: Magyar Tudományos Akadémia

– 3. irányelv: adatolható kellett volna legyen az igényes publicisztikából, szakirodalomból, sőt a szépirodalomból is, méghozzá egynél több szerzőtől

→ nyelvi belletrizmus, nyelvi elitizmus, nyelvi elegantizmus

→ e két irányelv figyelembevételével egyetlen lexéma se kerülhetett volna be a szótárba

Page 26: Magyar Tudományos Akadémia

Szótári munkálatok1995–2003

– a felkért szakemberek javaslatait Pusztai Ferenc korrektül bírálta el

!!! egy-egy szó szótárazásának elutasítása sosem történt pusztán purista megfontolások alapján, hanem az a szótár egészének logikájából következett, legtöbbször a következetesség szempontjai indokolták

Page 27: Magyar Tudományos Akadémia

→ Er, Fv, Ka szójegyzékek: három önálló szójegyzék

– egymástól teljesen függetlenül jöttek létre

– az egyes régiókban dolgozó munkatársak nem ismerték egymás szójegyzékeit, így nem is történt köztük semmiféle egyeztetés

– ennek ellenére vannak a kéziszótárban „többrégiós” szavak, azok, amelyeket egynél több régióban javasoltak felvételre a munkatársak, egymástól függetlenül

Page 28: Magyar Tudományos Akadémia

!!! a legtöbb közös szó viszont nem tartalmazza mindhárom régió felségjelzését

→ megtévesztő, hiszen valamely régió felségjelzésének megléte azt implikálja, hogy a másik két ht régióban az illető szó nem használatos

– pl. a blokk ‘lakótelepi panelház; tömbház’ jelentésben az ÉKSz.2-ben csak Er és Fv szóként van jelölve, holott a Ka nyelvváltozatokban is használatos (sőt minden Kárpát-medencei ht régióban)

Page 29: Magyar Tudományos Akadémia
Page 30: Magyar Tudományos Akadémia

Példák egyéb „áldozatul esett” Ka szavakra

– átmegy ‘<betegség, fáradtság stb.> elmúlik, megszűnik’

– balkon (nem „választékos”), balkonos

– bufet ‘büfé’

– diplom ‘elismerő oklevél’

– elsős ‘elsőéves’, másodikos ‘másodéves’ stb.

– fal ‘szekrénysor’

Page 31: Magyar Tudományos Akadémia

– fizikai személy ‘természetes személy’

– fogpaszta (nem „régies”)

– halász ‘horgász’, halászik ‘horgászik’

– házasságlevél ‘házassági anyakönyvi kivonat’

– infarkt ‘(szív)infarktus’

– internát ‘diákotthon’, internátus (nem „régies”)

– kapitány ‘százados’ (nem „régies”)

– kaszárnya (nem „régies”)

Page 32: Magyar Tudományos Akadémia

– kibeszéli magát ‘kimagyarázkodik’ (nem „ritka”)

– kihágás (nem „régies”)

– község ‘önálló jogállású település (város is)’

– kurz ‘tanfolyam’

– kurzus (nem „kissé választékos”, inkább „bizalmas”)

– leesik ‘elesik’

– norma ‘szabvány’

– paciens ‘páciens’

Page 33: Magyar Tudományos Akadémia

– pasztelina, plasztelina ‘gyurma’

– polgár ‘lakos’

– poliklinika ‘rendelőintézet’

– prorektor ‘rektorhelyettes’

– rászed ‘rávesz’

– respekt ‘tekintély’

– fizetetlen szabadság ‘fizetés nélküli szabadság’

– szesztra ‘nővér, ápolónő’

– szirup ‘szörp’

Page 34: Magyar Tudományos Akadémia

– szvetter ‘kardigán’ (nem „régies”)

– tanító ‘tanár’

– útadó ‘súlyadó’

– vetrovka ‘dzseki’

– vizsgán van ‘vizsgázik’

Page 35: Magyar Tudományos Akadémia

Hu gondok

!!! mintha még a Hu anyaggal se történt volna mindig egyeztetés

– respekt

→ valójában a nyelvi konzervativizmus (nyelvi purizmus?, nyelvi originalizmus? érvényesülése)

Page 36: Magyar Tudományos Akadémia

Stílusminősítés

– az egyeztetés hiánya miatt még a többrégiósként felvett szavakban sem biztos, hogy az azonos stílusminősítés azonos stílusértéket takar-e, ill. az eltérő stílusminősítés eltérő stílusértéket takar-e (nem kaptunk szerkesztési útmutatót, sem irányelveket)

Page 37: Magyar Tudományos Akadémia

A Termini Kutatóhálózat szóhatártalanító

munkálatai2003–

Page 38: Magyar Tudományos Akadémia

A „papír nélküli papírszótár” korszaka

(2003—2007)

Page 39: Magyar Tudományos Akadémia

Regionális szólisták2003 –2004

Papír nélküli „papírszótárak”

– regionális szólisták az Osiris Idegen szavak szótára számára

– munkaeszközök:

a) szövegszerkesztő: papírszótár típusú szócikkek

b) levelezőprogram: kapcsolattartás, egyeztetés, anyagok átküldése egymásnak

Page 40: Magyar Tudományos Akadémia

c) koordinátor

– listák összehasonlítása

– változtatások bevitele

– értelmezések egységesítése

– stílusértékek egymáshoz viszonyítása

– példamondatok egyeztetése

– javaslatok új szócikkekre

→ „közvetett közös fejlesztés”

Page 41: Magyar Tudományos Akadémia

„Csatlakozási tárgyalások”

– 2003 őszén: a négy nagyrégióban kezdődtek a munkálatok (Er, Fv, Va, Ka)

– 2003 végén: két kisrégió csatlakozása (Mv, Őv)

– 2004 tavaszán: a hiányzó kisrégió csatlakozása (Hv)

Page 42: Magyar Tudományos Akadémia

Ht-lista2004–2007

– 2004 júniusában: a hét régió saját szójegyzékeinek összeolvasztása

→ ht-lista

– áttekinthetőbbé vált a nyelvi anyag, s némileg könnyebben kezelhetővé is

– minden változtatást a koordinátor vitt be (a ht-lista szétfejlődésének megelőzése érdekében)

Page 43: Magyar Tudományos Akadémia
Page 44: Magyar Tudományos Akadémia

Ht-online(2007—)

Page 45: Magyar Tudományos Akadémia

– 2006 kora tavasza: Juhász Tihamér kezdeményezése

→ fordulópont a szóhatártalanítás történetében

– 2007 folyamán a szótár anyaga felkerült a világhálóra, s létrejött egy interaktív online szótár, amely fokozatosan multifunkciós adatbázissá bővült

Page 46: Magyar Tudományos Akadémia

a) szótárként: hozzáférhetővé vált a látogatók számára

b) multifunkciós adatbázisként: hatalmas lehetőségeket magában rejtő, hatékony munkaeszközzé vált az szerkesztők, ill. kutatók számára

Page 47: Magyar Tudományos Akadémia

3. A Termini magyar–magyar

szótár és adatbázis

Page 48: Magyar Tudományos Akadémia

Főbb jellemzői

Page 49: Magyar Tudományos Akadémia

1. Az együttműködést segítő funkciók

a) Szimultán módon elérhető

– egymástól több száz kilométerre, különböző országokban tartózkodó munkatársak egyszerre dolgozhatnak ugyanazzal az adatbázissal

Page 50: Magyar Tudományos Akadémia

b) Gyors kommunikációs lehetőséget biztosít

– ímélküldés a keresőfelületről

Page 51: Magyar Tudományos Akadémia

– megjegyzések fűzése az egyes szócikkekhez, azok részeihez

Page 52: Magyar Tudományos Akadémia

a) kényelmesen kezelhető szerkesztőfelület

2. A szerkesztőmunkát megkönnyítő további funkciók

Page 53: Magyar Tudományos Akadémia

b) listázási lehetőségek, pl.:

– adathiányos szócikkek

– konstruált példamondatokat tartalmazó szócikkek

– belső megjegyzéssel ellátott szócikkek

– külső megjegyzéssel ellátott szócikkek

Page 54: Magyar Tudományos Akadémia

– példamondat nélküli jelentéseket tartalmazó címszók

– felségjelzések régiók szerint

– teljes lista készítése (→ ezáltal újjáéledt az egykori ht-lista)

– részleges listák készítése, pl. A–C kezdőbetűs szócikkek

– regionális listák készítése (→ ezáltal a megszüntetett regionális listák is újjáéledtek)

– a külső felhasználók elől elrejtett (nem kész) szócikkek

Page 55: Magyar Tudományos Akadémia

c) kimutatások

– pl. példamondat-típusok száma

Page 56: Magyar Tudományos Akadémia

a) listázások– keresési kifejezések rostált listája

b) kimutatások

(– leggyakrabban megtalált szócikkek)

– felhasználók regisztrációjának időbeli eloszlása

– keresések időbeli eloszlása

3. A továbbfejlesztést segítő funkciók

Page 57: Magyar Tudományos Akadémia

a) a kereső- és a böngészőfelületről elérhető „módosítási lista”

4. Felügyeleti és visszakereshetőségi funkciók

Page 58: Magyar Tudományos Akadémia

– a módosítási lista segítségével az egyes szerkesztők tevékenysége követhetővé és szükség esetén visszafordíthatóvá vált

→ a program nem egyszerűen felülírja az aktuális szerkesztés előtti változatot, hanem meg is őrzi (szerkesztéstörténet)

Page 59: Magyar Tudományos Akadémia

b) listázások– egy-egy szerkesztő által módosított

szócikkek jegyzéke

c) kimutatások, pl.:

– egy-egy szerkesztő által módosított szócikkek száma és időbeli eloszlása 

Page 60: Magyar Tudományos Akadémia

– felségjelzések száma régiók szerint

Page 61: Magyar Tudományos Akadémia

a) listázások, pl.:

– stílusminősítések

– stílusminősítések kombinációi

– többrégiós szócikkek listája

– egyszerűsített listák készítése (pl. csak címszót, szófaji minősítést, nyelvtani alakokat, felségjelzéseket tartalmazók)

5. Kutatási funkciók

Page 62: Magyar Tudományos Akadémia
Page 63: Magyar Tudományos Akadémia

b) kimutatások, pl.:

– különbözõ szófajú szavak száma

Page 64: Magyar Tudományos Akadémia

a) keresés

– címszóban, jelentésben, példamondatban

– szó elején, szó belsejében, szó végén, teljes egyezéssel

– ékezetes és ékezet nélküli keresés

6. Online szótári funkciók

Page 65: Magyar Tudományos Akadémia

b) böngészés

– szó elején, szó belsejében, szó végén, teljes egyezéssel

– választható a teljes szócikk vagy címszó megjelenítése

Page 66: Magyar Tudományos Akadémia

7. Interaktivitás

a) „megjegyzés” funkció a regisztrált felhasználók megjegyzéseket

fűzhetnek az egyes szócikkekhez

Page 67: Magyar Tudományos Akadémia

b) fórum

(eddig még nem sikerült aktívvá tenni)

Page 68: Magyar Tudományos Akadémia

Újszerű vonások

Page 69: Magyar Tudományos Akadémia

Többdimenziós stílusminősítési

rendszer

Page 70: Magyar Tudományos Akadémia

– az ÉKSz.2-munkálatok során egyértelművé vált: a hagyományos minősítésekkel lehetetlen szakmailag korrekt módon megragadni a ht szókincs változatosságát (amiképp egyébként a közmagyar szókincsét is…)

– legnagyobb probléma: a minősítések egy részének többértelműsége, ill. néhány minősítés „ideologizáltsága”

Page 71: Magyar Tudományos Akadémia

A Termini stílusminősítési rendszer jellemzői:

a) többdimenziós rendszer: a minősítés különféle szempontjai nem keverednek, hanem elválnak egymástól

b) a semleges stílusértéket is jelöljük (a listázások, azaz a kutatás megkönnyítése végett)

c) nem alkalmazunk ideologikus minősítéseket, mint az ÉKSz.2 „vulgáris” és „kiveszőben” minősítése, ill. „pongyola használatú”, „helyesebben” stb. kitételei

Page 72: Magyar Tudományos Akadémia

A stílusminősítési rendszer dimenziói

Page 73: Magyar Tudományos Akadémia

– a földrajzi és társadalmi (iskolázottsági, kétnyelvűségi, korosztályi) dialektusokra vonatkozó minősítések

1. Dialektális dimenzió

Page 74: Magyar Tudományos Akadémia

2. Regiszterbeli dimenzió

– azok a stílusértékek, amelyekre a bizonyos specializált tevékenységekhez vagy élethelyzetekhez kötődő (vagy nem kötődő) lexémák tesznek szert

Page 75: Magyar Tudományos Akadémia

3. Stílusváltozati dimenzió

– a beszédhelyzet formalitása által meghatározott regiszterek alkotják

Page 76: Magyar Tudományos Akadémia

4. Időbeliség dimenziója

– a nyelv korábbi állapotából fennmaradt elemek mai nyelvi sajátos stílusértéke fejeződik ki ezekben a minősítésekben

Page 77: Magyar Tudományos Akadémia

5. Érzelmi dimenzió

– a lexémákhoz való pozitív vagy negatív beszélői viszonyulás, érzelmi telítettség

Page 78: Magyar Tudományos Akadémia

6. Egyéb jelölések– gyakoriság

– felségjelzések

Page 79: Magyar Tudományos Akadémia

Példamondatok minősítése

Page 80: Magyar Tudományos Akadémia

– nagyban meghatározza a szövegrészletben található címszó jelentésének és stílusértékének megállapítását

A példamondatok státusza

Page 81: Magyar Tudományos Akadémia

A szó és a beszélő régióbeli hovatartozásának

megkülönböztetése

– ehhez az a felismerés vezetett, hogy egy beszélő alkalmanként más régió szavait is használja, s az ilyen használat dokumentálásának is nagy az értéke

(pl. Hu turisták Er szavakat tanulnak meg, Er beszélő Szlovákiában vállal munkát, és Fv szavakat tanul meg)

Page 82: Magyar Tudományos Akadémia

A példamondatok nagy száma

Page 83: Magyar Tudományos Akadémia

– mivel nem korlátoz minket a terjedelem úgy, mint a papírszótárak esetében, korlátok nélkül gyűjtjük a példamondatokat, ha kell, bő kontextussal

(a kontextus segít a jelentés/árnyalat/ és a stílusérték megállapításában)

→ a Termini-szótár és adatbázis így egyre inkább „korpusz alapúvá” válik, bár a „korpusz”-t egyelőre még csak szövegrészletek képviselik

Page 84: Magyar Tudományos Akadémia

– fontolóra vesszük, hogy nem lehetne-e a Termini-szótár példamondatait hasonló módon generálni egy korpuszból, mint azt teszi pl. az MNSZ, természetesen megőrizve szótár jellegét

– ehhez első lépésnek tekinthető a nemrégiben elkezdett fejlesztés: példamondatok automatikus keresése az interneten, a példamondatokat tartalmazó oldalak automatikus eltárolása

Page 85: Magyar Tudományos Akadémia

Az eddig megtett út

Page 86: Magyar Tudományos Akadémia

Az értelmező kéziszótár „blokk”-kal kezdődő szócikkbokra

Page 87: Magyar Tudományos Akadémia
Page 88: Magyar Tudományos Akadémia

A ht-lista „blokk” szócikke

Page 89: Magyar Tudományos Akadémia
Page 90: Magyar Tudományos Akadémia

A Termini-szótár és adatbázis „blokk” szócikkének

1.változata(két-két példamondattal)

Page 91: Magyar Tudományos Akadémia
Page 92: Magyar Tudományos Akadémia

A Termini-szótár és adatbázis „blokk” szócikkének

2.változata(az összes példamondattal)

Page 93: Magyar Tudományos Akadémia
Page 94: Magyar Tudományos Akadémia
Page 95: Magyar Tudományos Akadémia

Tervek és álmok

Page 96: Magyar Tudományos Akadémia

a) ← a szótári adatbázis korpusz hátterűvé való alakítása

b) értelmezéseknek a denotátumot ábrázoló fényképekkel való kiegészítése tárgyat jelölő szavak esetén

c) azokban az esetekben, amikor a denotátum helyi kulturális sajátság, néprajzi leírások beiktatása, ill. belinkelése (saját adatbázisból)

Page 97: Magyar Tudományos Akadémia

d) a beszélt nyelvi példamondatok meghallgathatósága

e) a szótárban közölt elemekre vonatkozó bibliográfia létrehozása, ill. maguknak a szövegeknek az összegyűjtése és belinkelése

Page 98: Magyar Tudományos Akadémia

→ a fejlesztések nyomán az, ami szójegyzékként indult, szótárként folytatódott s többfunkciós adatbázissá vált, fokozatosan olyan komplex információs rendszerré nőhetné ki magát, amely magába foglalná a szótár, a strukturált adatbázis, a nyelvi korpusz, valamint a lexikon és az enciklopédia jellemzőit