УДК 811.512. 122 КОРпУС КАзАхСКОгО языКА ... › pdf › 2016 › 11-2 ›...
TRANSCRIPT
INTERNATIONAL JOURNAL OF APPLIED AND FUNDAMENTAL RESEARCH №11,2016
334 PHILOLOGICALSCIENCES УДК811.512.122
КОРпУС КАзАхСКОгО языКА: пРОСОДИЧЕСКАя РАзМЕТКАБазарбаева з.М.
Институт языкознания им. А. Байтурсынова МОН РК, Алматы, е-mail: [email protected]
целью данной работы является описание просодической разметки публицистического текста дляразработкиисозданиянациональногокорпусаказахскогоязыка.Длядостиженияцелииспользуютсяэкс-периментально-фонетическиеметоды исследования, компьютерная программа.Врезультате анализа былпредставлен аннотированный звучащий текст с просодической разметкой, включающий деление на син-тагмысобозначениемнаправлениядвиженияосновноготонаипауз.членениенасинтагмыопределяетсясмысловымсодержаниемвысказывания,степеньюраспространенностиглавныхивторостепенныхчленов.Выявлено,чтоодноитожевысказываниевзависимостиотинтенцииговорящегоможетбытьпроизнесеносразличнымсинтагматическимчленением.Восновепросодическойразметкилежитсемантико-интонаци-онноеделениезвучащеготекста.Спомощьюавтоматизированнойобработкиэлектронныхкорпусовбыливыявленыречевыезакономерностизвучащеготекста.
Ключевые слова: корпусная лингвистика, просодическая разметка, аннотирование, синтагма, звучащий текст, сегментация, пауза
corPuS KaZaKh: ProSodIc marKINgbazarbayeva Z.m.
DLitt, Professor of A. Baitursynov Linguistics Institute, Almaty, е-mail: [email protected]
TheaimofthispaperistodescribeprosodicmarkingjournalistictextforthedevelopmentandestablishmentofanationalbodyoftheKazakhlanguage.Toachievetheobjectiveusedexperimentally-phoneticresearchmethods,computerprogram.Theanalysiswaspresentedannotatedsoundingtextprosodicmarkings,includingthedivisionofSyntagmatoindicatethedirectionofthepitchandpauses.ThedivisionSyntagmadefinedsemanticcontentofspeech,theprevalenceofprimaryandsecondarymembers.Itwasrevealedthatthesamesentencecanbepronouncedinadifferentsyntagmaticarticulationdependingontheintentionsofthespeaker.Thebasisofprosodicmarkupissemanticandintonationdivisionsoundingtext.Withthehelpoftheautomatedprocessingofelectronichousingswereidentifiedspeechpatternssoundingtext.
Keywords: corpus linguistics, prosodic markup, annotation, syntagma, sounding text, segmentation, pause
В настояще время в европейском, рос-сийском, а также в казахском (последниенесколько лет) языкознании все большийинтерес вызывают проблемы корпуснойлингвистики. Зарождение корпуснойлинг-вистикисвязаносразвитиемкомпьютерныхтехнологий и программного обеспечения,которыедаливозможностьобработкиираз-метки больших по объему текстов в элек-троннойформе,аккумулирующихтехноло-гиибазданныхиинформационногопоиска.Автоматизированная обработка электрон-ныхкорпусовдаетвозможностьболееточ-нойинтерпретацииполученныхданных.
Авторитет в области корпусной линг-вистики В.П.Захаров определяет это на-правление как «большой, представленныйв электронном виде, унифицированный,структурированный, размеченный, фило-логическикомпетентныймассивязыковыхданных,предназначенныйдлярешениякон-кретных лингвистических задач»[2]. Ина-че говоря, обработав и систематизировавс помощью компьютерной техники боль-шиеобъемытекстов,можностатистическиобосновывать лингвистические явления,прослеживать диахронические измененияв речи, найти всю интересующую инфор-
мациюо языке с цельюизучения речевыхзакономерностейдляпостроенияфункцио-нальноймоделиязыка.Создание,развитиеи использование электронных корпусов –этоодноизнаиболеепередовыхнаправле-нийсовременнойлингвистики.
Целью даннойработыявляетсяописа-ние просодической разметки публицисти-ческого текста для разработки и созданиянациональногокорпусаказахскогоязыка.
Материалы и методы исследованияВ работе использовались экспериментально-
фонетическиеметодыисследования, а также специ-ально созданная программистами-информатикамикомпьютерная программа аннотирования звучащеготекста.Материаломдляанализапослужилиотрывкиизпублицистическоготекста,начитанныедиктором,владеющиморфоэпическойнормойказахскогоязыка.
Результаты исследования и их обсуждение
Специалисты в области корпуснойлингвистики придерживаются определен-ной лингвистической теории, которая ле-жит в основе разметки каждого корпуса,поэтомувыводыпокорпуснымданныммо-гутпроизводитьсялишьврамкахэтойкон-
МЕЖДУНАРОДНЫЙЖУРНАЛПРИКЛАДНЫХ ИФУНДАМЕНТАЛЬНЫХИССЛЕДОВАНИЙ №11,2016
335 ФИЛОЛОгИчЕСКИЕНАУКИ цепции.Однаковзависимостиотструкту-рыязыканекоторыетеорииформализациимогут не подходить ко всем исследуемымязыкам.Вэтомслучаеисследовательнахо-дитнаиболееприемлемыепутилингвисти-ческого аннотирования текстовых данных,учитывающихспецификуданногоязыка.
Выделяют различные виды корпус-ной лингвистики: письменные и устные(звуковые) тексты, параллельные (текстынескольких языков), по стилю (публици-стические, художественные, официально-деловые,научные,разговорные),похроно-логии (синхронические, диахронические)идр.Слишкомподробнаялингвистическаяинформация,заключеннаявразметкеболь-ших по объему корпусов текстов, можетбытьизбыточна,поэтому,какправило,об-ходятсянеобходимымвданномисследова-нии набором меток в зависимости от по-ставленнойцели.
Лингвистическое аннотирование мо-жет включать несколько видов разметок:синтаксическую, лексико-семантическую,морфологическую и просодическую[3].Врусскомязыкознаниисамымразработан-ным является морфологическая разметка.Снедавнихпорвказахскомязыкознаниинаосновеимеющихсяметодиканнотированияэлектронных текстов также начали зани-маться морфологической разметкой. Этотвидразметкипредусматриваетраспределе-ние электронныхкорпусовпочастямречис их грамматическими категориями. Наоснове правил словообразования большиемассивытекстовподвергаютсяавтоматизи-рованнойобработке.Аннотированиекорпу-сов,какбылосказановыше,осуществляет-сяпрограммнымисредствами.Иногдаиз-заотсутствияпрограммныхсредствнекотрыевиды разметок осуществляются вручную.Это чаще всего касается просодическойразметки,гденарядусавтоматизированнойобработкой текстов используется и ручнаяобработка.
Методикапросодическойразметкиуст-ных текстов посредством компьютерныхпрограмм наименее разработана в корпус-нойлингвистике.Врусскомязыкеосновойпросодической разметки является делениена синтагмы и метки ударения. Учитываяфонетическую систему казахского языкапросодическая разметка казахских текстовпредусматриваетсинтагматическоеделениетранскрибированнойзвучащейречисобо-значением направления движения тона,разметкой синтагм на акцентные единицы(ритмическиегруппы)ипаузхезитации.
Для просодической разметки был вы-бранозвученныйдикторамипублицистиче-ский текст «Театр».Поправилам аудитор-
скогоанализазвучащийтекстбылподеленнасинтагмыиакцентныеединицы.Каждаясинтагма оформлялась соответствующиммелодическим контуром (восходящим,нисходящим, восходяще-нисходящим, нис-ходяще-восходящим или ровным). Всоот-ветствиисзадачамиисследованияозвучен-ные тексты анализировались специальнойкомпьютернойпрограммой,разработаннойпрограммистами-информатиками, котораядает возможность фиксировать осцилло-граммуречевогосигнала,озвученныйтекст,начало и конец высказывания и синтагмысобозначениемнаправлениядвиженияос-новного тона синтагмы. Посредством раз-работанной для просодической разметкикомпьютернойпрограммыбылпроанализи-рованозвученныйпублицистическийтекст.Впроцессе разметки обращалось внима-ниенапроцедуруанализаисопоставленияречевых сигналов. При делении текста насинтагмы было важно правильно ставитьграницу синтагмы, чтобы не нарушалосьсмысловое восприятие речи.Правила син-тагматического членения базируются награмматическом (пунктуационном, мор-фологическом и синтаксическом) анали-зе текста, а такжена ситуативном анализесегментации в звучащей речи. Установкаграницсинтагмвлияетнапередачуинтона-ционныххарактеристикатакженапереда-чусмысловогосодержания.Подсинтагмойпонимается универсальная, характернаядля всех языков, смысловая единица, воз-никающаяприсегментациивысказывания,текста. Минимальным объемом речевогоотрезка, в котором проявляется синтакси-ческоеиинтонационноезначениеявляетсясинтагма,несущаябольшуюфункциональ-нуюнагрузкувтексте[1].
Как показала просодическая разметка,синтагма в зависимости от речевой ситуа-циииконтекстаможетоформлятьсясловом,словосочетаниемипредложением,выражаясложное смысловое единство. Синтагмауниверсальна и встречается во всех язы-ках, формирование синтагм в потоке речиопределяетсянежесткимиправилами,аоб-условлено разнообразными смысловымисвязямивнутри текста, а также зависитотхода мысли говорящего (диктора), от еговиденияипониманияситуации.Например:
Театр өнерінің ең басты құралы – //сөз.(главноесредствотеатральногоискус-ства–//этослово).
Онсыз әдебиет те,// драматургия да,//қарым-қатынас та болмақ емес. (без негонеможетсуществоватьнилитература,//нидраматургия,//никоммуникация).
Различныесинтагмыобладаютбольшейили меньшей смысловой целостностью.
INTERNATIONAL JOURNAL OF APPLIED AND FUNDAMENTAL RESEARCH №11,2016
336 PHILOLOGICALSCIENCES При недостаточности объема синтаксиче-ское значение остается интонационно не-выраженным. Например, незавершенностьможет выражать подчинительные отноше-ния, еслиподчинительнаясвязьвпростомвысказыванииустанавливаетсямеждусло-вами,необразующимисинтагму,тоонанебудет иметь интонационного выражения.Втомслучае,еслисловаисловосочетанияв простых высказываниях соответствуютсинтагме, то они будут выражаться неза-вершеннойинтонацией,вчастности,ввы-сказываниях с однородными членами. На-пример:
Оқу техникасы фонетика,// граммати-ка,// орфоэпия,// орфография,// стилисти-камен ұштасып жатыр. (Техника чтениясвязана с грамматикой,// орфоэпией,// ор-фографией,//стилистикой).
В сложном же высказывании, где егокомпоненты являются отдельными син-тагмами, подчинительная связь также бу-дет выражена незавершенной интонацией.Простое нераспространенное высказыва-ние, образующееодну синтагму, оформля-ется завершенной интонацией. Например,следующее высказываниеИнтонация өте маңызды орын алады. (Интонация играет большую роль) состоитизоднойсинтагмы,передающейзначениезаконченностиине-зависимости. Оба эти значения передаетнисходящаяинтонация.Ноинтонационнаяскрытая внутренняя зависимость друг отдругачленовпредложения, существующаяблагодаря подчинительным связям междуними, обнаруживается при их распростра-ненности:
Сахнатілінде//интонацияөтемаңыздыорыналады.(Всценическойречи//интона-цияиграетбольшуюроль).
Отношения зависимости между члена-мипредложения становятся интонационновыраженными и передаются с помощьювосходящей интонации. Восходящий тон,которыйоформляетнеконечные синтагмы,нарядусозначениемнезаконченностипере-даетиэтиотношениязависимости.Следо-вательно, если в объеме синтагмы проис-ходит полное совпадение синтаксическихи интонационных значений на основаниидвух значимых критериев, то интонацияв этих конструкциях безвариантна, т.е.может быть использован только один ин-тонационный тип – восходящий или нис-ходящий. Вданном случае под типом по-нимается движение основного тона, и подвариантом – возможность использованияводнойсинтагмефонологическипротиво-положногоинтонационноготипа.
В просодической разметке различаютграмматические паузы, отделяющие друг
отдругаинтонационно-оформленныесин-тагмы и фразы, а также паузы хезитации(неуверенности). грамматические паузыпринимают участие в передаче опреде-лённых синтаксических, интонационныхисмысловыхотношений.границаакцент-ных единиц может быть промаркированапереломом тонального контура, сменойпросодических характеристик, которыевоспринимаются как нарушениеплавноготеченияречи.Синтагмапосравнениюсак-центнойединицей(ритмическойгруппой)являясьединицейболеевысокогопорядка,шире определяет характеристики предме-товиявлений,окоторыхговоритсявречи.Минимальные фонетические и семанти-ко-интонационныеединицы,каковымияв-ляются ритмические группы и синтагмы,определяютсемантико-интонационноеде-лениеречи(текста).
границы семантико-интонационных,синтаксических единиц синтагм переда-ются посредством синтагматических уда-рений. Являясь предельным элементомфразировки,онаявляетсярезультатомсин-тактико-стилистического и лексико-фра-зеологического членения речевого потока.границысинтагмывречидостаточнопод-вижныичастонаходятотражениевпункту-ации, однако знаки препинания не всегдасовпадаютсееграницей.будучинаимень-шаей знаменательной частью высказыва-ния, синтагма оформляется посредствоминтонационныхсредств.
Как показывает просодическая размет-ка, членение на синтагмы определяетсясмысловым содержанием высказывания,степенью распространенности главныхи второстепенных членов. Одно и то жевысказывание в зависимости от интенцииговорящегоможетбытьпроизнесеносраз-личнымсинтагматическимчленением.Рас-смотрим следующий пример, озвученныйдиктором:Ән өнері ерте заманнан бастау алатыны белгілі. (Известно, что певче-ское искусство зародилось очень давно). Этовысказываниеможетсостоятьизоднойсинтагмы,издвухитрехвзависимостиотконтекста:
Әнөнеріертезаманнанбастауалатыныбелгілі.
(Известно, чтопевческоеискусство за-родилосьоченьдавно).
Әнөнері//ертезаманнанбастауалаты-ныбелгілі.
(Известно,// что певческое искусствозародилосьоченьдавно).
Әнөнері//ертезаманнан//бастауала-тыныбелгілі.
(Известно,//чтопевческоеискусство//зародилосьоченьдавно).
МЕЖДУНАРОДНЫЙЖУРНАЛПРИКЛАДНЫХ ИФУНДАМЕНТАЛЬНЫХИССЛЕДОВАНИЙ №11,2016
337 ФИЛОЛОгИчЕСКИЕНАУКИ Такое соотношение частей высказыва-
ния обусловлено определенным осмысле-ниемситуацииговорящимилислушающим.Интонационное оформление синтагмы,в нашем анализе, обеспечивалось мело-дическими и темпоральными средствами.Когда несколько ритмических групп объ-единяются в синтагму, происходит усиле-ние синтагматического ударения за счетослабленияпредшествующихритмическихударений.
ВыводыТаким образом, просодическая раз-
метка текста показала, что фонетическаяцелостностьсинтагмывречисоздаетсяот-сутствиемпаузывнутрисинтагмыиобщиммелодическимконтуром.Синтагмыоформ-лялись восходящим, нисходящим, восход-ще-нисходящим и нисходще-восходящим
направлением движения основного тона.Спомощью автоматизированной обработ-ки электронных корпусов были описаныречевыезакономерностизвучащеготекста.Воснове просодической разметки речево-гопотокалежитсемантико-интонационнаясегментация. было выявлено, что просо-дическое аннотирование звучащего текстаопределяетсяпаузацией,направлениемдви-женияосновноготонаипереломоммелоди-ческого контура на стыках анализируемыхсегментов.
Список литературы
1.базарбаева З.М. Казахская интонация. – Алматы,2008.–281с.
2.ЗахаровВ.П.Корпуснаялингвистика:Учебно-мето-дическоепособие.–СПб.,2005.–48с.
3.ПлунгянВ.А.(ред.).Национальныйкорпусрусскогоязыка:2003–2005.–М.,2005.–150с.