УДК 811.512. 122 КОРпУС КАзАхСКОгО языКА ... › pdf › 2016 › 11-2 ›...

4
INTERNATIONAL JOURNAL OF APPLIED AND FUNDAMENTAL RESEARCH № 11, 2016 334 PHILOLOGICAL SCIENCES УДК 811.512. 122 КОРпУС КАзАхСКОгО языКА: пРОСОДИЧЕСКАя РАзМЕТКА Базарбаева з.М. Институт языкознания им. А. Байтурсынова МОН РК, Алматы, е-mail: [email protected] целью данной работы является описание просодической разметки публицистического текста для разработки и создания национального корпуса казахского языка. Для достижения цели используются экс- периментально-фонетические методы исследования, компьютерная программа. В результате анализа был представлен аннотированный звучащий текст с просодической разметкой, включающий деление на син- тагмы с обозначением направления движения основного тона и пауз. членение на синтагмы определяется смысловым содержанием высказывания, степенью распространенности главных и второстепенных членов. Выявлено, что одно и то же высказывание в зависимости от интенции говорящего может быть произнесено с различным синтагматическим членением. В основе просодической разметки лежит семантико-интонаци- онное деление звучащего текста. С помощью автоматизированной обработки электронных корпусов были выявлены речевые закономерности звучащего текста. Ключевые слова: корпусная лингвистика, просодическая разметка, аннотирование, синтагма, звучащий текст, сегментация, пауза corPuS KaZaKh: ProSodIc marKINg bazarbayeva Z.m. DLitt, Professor of A. Baitursynov Linguistics Institute, Almaty, е-mail: [email protected] The aim of this paper is to describe prosodic marking journalistic text for the development and establishment of a national body of the Kazakh language. To achieve the objective used experimentally-phonetic research methods, computer program. The analysis was presented annotated sounding text prosodic markings, including the division of Syntagma to indicate the direction of the pitch and pauses. The division Syntagma defined semantic content of speech, the prevalence of primary and secondary members. It was revealed that the same sentence can be pronounced in a different syntagmatic articulation depending on the intentions of the speaker. The basis of prosodic markup is semantic and intonation division sounding text. With the help of the automated processing of electronic housings were identified speech patterns sounding text. Keywords: corpus linguistics, prosodic markup, annotation, syntagma, sounding text, segmentation, pause В настояще время в европейском, рос- сийском, а также в казахском (последние несколько лет) языкознании все больший интерес вызывают проблемы корпусной лингвистики. Зарождение корпусной линг- вистики связано с развитием компьютерных технологий и программного обеспечения, которые дали возможность обработки и раз- метки больших по объему текстов в элек- тронной форме, аккумулирующих техноло- гии баз данных и информационного поиска. Автоматизированная обработка электрон- ных корпусов дает возможность более точ- ной интерпретации полученных данных. Авторитет в области корпусной линг- вистики В.П. Захаров определяет это на- правление как «большой, представленный в электронном виде, унифицированный, структурированный, размеченный, фило- логически компетентный массив языковых данных, предназначенный для решения кон- кретных лингвистических задач» [2]. Ина- че говоря, обработав и систематизировав с помощью компьютерной техники боль- шие объемы текстов, можно статистически обосновывать лингвистические явления, прослеживать диахронические изменения в речи, найти всю интересующую инфор- мацию о языке с целью изучения речевых закономерностей для построения функцио- нальной модели языка. Создание, развитие и использование электронных корпусов – это одно из наиболее передовых направле- ний современной лингвистики. Целью данной работы является описа- ние просодической разметки публицисти- ческого текста для разработки и создания национального корпуса казахского языка. Материалы и методы исследования В работе использовались экспериментально- фонетические методы исследования, а также специ- ально созданная программистами-информатиками компьютерная программа аннотирования звучащего текста. Материалом для анализа послужили отрывки из публицистического текста, начитанные диктором, владеющим орфоэпической нормой казахского языка. Результаты исследования и их обсуждение Специалисты в области корпусной лингвистики придерживаются определен- ной лингвистической теории, которая ле- жит в основе разметки каждого корпуса, поэтому выводы по корпусным данным мо- гут производиться лишь в рамках этой кон-

Upload: others

Post on 26-Jun-2020

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: УДК 811.512. 122 КОРпУС КАзАхСКОгО языКА ... › pdf › 2016 › 11-2 › 10495.pdf · 2016-11-25 · international journal of applied and fundamental research

INTERNATIONAL JOURNAL OF APPLIED AND FUNDAMENTAL RESEARCH №11,2016

334 PHILOLOGICALSCIENCES УДК811.512.122

КОРпУС КАзАхСКОгО языКА: пРОСОДИЧЕСКАя РАзМЕТКАБазарбаева з.М.

Институт языкознания им. А. Байтурсынова МОН РК, Алматы, е-mail: [email protected]

целью данной работы является описание просодической разметки публицистического текста дляразработкиисозданиянациональногокорпусаказахскогоязыка.Длядостиженияцелииспользуютсяэкс-периментально-фонетическиеметоды исследования, компьютерная программа.Врезультате анализа былпредставлен аннотированный звучащий текст с просодической разметкой, включающий деление на син-тагмысобозначениемнаправлениядвиженияосновноготонаипауз.членениенасинтагмыопределяетсясмысловымсодержаниемвысказывания,степеньюраспространенностиглавныхивторостепенныхчленов.Выявлено,чтоодноитожевысказываниевзависимостиотинтенцииговорящегоможетбытьпроизнесеносразличнымсинтагматическимчленением.Восновепросодическойразметкилежитсемантико-интонаци-онноеделениезвучащеготекста.Спомощьюавтоматизированнойобработкиэлектронныхкорпусовбыливыявленыречевыезакономерностизвучащеготекста.

Ключевые слова: корпусная лингвистика, просодическая разметка, аннотирование, синтагма, звучащий текст, сегментация, пауза

corPuS KaZaKh: ProSodIc marKINgbazarbayeva Z.m.

DLitt, Professor of A. Baitursynov Linguistics Institute, Almaty, е-mail: [email protected]

TheaimofthispaperistodescribeprosodicmarkingjournalistictextforthedevelopmentandestablishmentofanationalbodyoftheKazakhlanguage.Toachievetheobjectiveusedexperimentally-phoneticresearchmethods,computerprogram.Theanalysiswaspresentedannotatedsoundingtextprosodicmarkings,includingthedivisionofSyntagmatoindicatethedirectionofthepitchandpauses.ThedivisionSyntagmadefinedsemanticcontentofspeech,theprevalenceofprimaryandsecondarymembers.Itwasrevealedthatthesamesentencecanbepronouncedinadifferentsyntagmaticarticulationdependingontheintentionsofthespeaker.Thebasisofprosodicmarkupissemanticandintonationdivisionsoundingtext.Withthehelpoftheautomatedprocessingofelectronichousingswereidentifiedspeechpatternssoundingtext.

Keywords: corpus linguistics, prosodic markup, annotation, syntagma, sounding text, segmentation, pause

В настояще время в европейском, рос-сийском, а также в казахском (последниенесколько лет) языкознании все большийинтерес вызывают проблемы корпуснойлингвистики. Зарождение корпуснойлинг-вистикисвязаносразвитиемкомпьютерныхтехнологий и программного обеспечения,которыедаливозможностьобработкиираз-метки больших по объему текстов в элек-троннойформе,аккумулирующихтехноло-гиибазданныхиинформационногопоиска.Автоматизированная обработка электрон-ныхкорпусовдаетвозможностьболееточ-нойинтерпретацииполученныхданных.

Авторитет в области корпусной линг-вистики В.П.Захаров определяет это на-правление как «большой, представленныйв электронном виде, унифицированный,структурированный, размеченный, фило-логическикомпетентныймассивязыковыхданных,предназначенныйдлярешениякон-кретных лингвистических задач»[2]. Ина-че говоря, обработав и систематизировавс помощью компьютерной техники боль-шиеобъемытекстов,можностатистическиобосновывать лингвистические явления,прослеживать диахронические измененияв речи, найти всю интересующую инфор-

мациюо языке с цельюизучения речевыхзакономерностейдляпостроенияфункцио-нальноймоделиязыка.Создание,развитиеи использование электронных корпусов –этоодноизнаиболеепередовыхнаправле-нийсовременнойлингвистики.

Целью даннойработыявляетсяописа-ние просодической разметки публицисти-ческого текста для разработки и созданиянациональногокорпусаказахскогоязыка.

Материалы и методы исследованияВ работе использовались экспериментально-

фонетическиеметодыисследования, а также специ-ально созданная программистами-информатикамикомпьютерная программа аннотирования звучащеготекста.Материаломдляанализапослужилиотрывкиизпублицистическоготекста,начитанныедиктором,владеющиморфоэпическойнормойказахскогоязыка.

Результаты исследования  и их обсуждение

Специалисты в области корпуснойлингвистики придерживаются определен-ной лингвистической теории, которая ле-жит в основе разметки каждого корпуса,поэтомувыводыпокорпуснымданныммо-гутпроизводитьсялишьврамкахэтойкон-

Page 2: УДК 811.512. 122 КОРпУС КАзАхСКОгО языКА ... › pdf › 2016 › 11-2 › 10495.pdf · 2016-11-25 · international journal of applied and fundamental research

МЕЖДУНАРОДНЫЙЖУРНАЛПРИКЛАДНЫХ ИФУНДАМЕНТАЛЬНЫХИССЛЕДОВАНИЙ №11,2016

335 ФИЛОЛОгИчЕСКИЕНАУКИ цепции.Однаковзависимостиотструкту-рыязыканекоторыетеорииформализациимогут не подходить ко всем исследуемымязыкам.Вэтомслучаеисследовательнахо-дитнаиболееприемлемыепутилингвисти-ческого аннотирования текстовых данных,учитывающихспецификуданногоязыка.

Выделяют различные виды корпус-ной лингвистики: письменные и устные(звуковые) тексты, параллельные (текстынескольких языков), по стилю (публици-стические, художественные, официально-деловые,научные,разговорные),похроно-логии (синхронические, диахронические)идр.Слишкомподробнаялингвистическаяинформация,заключеннаявразметкеболь-ших по объему корпусов текстов, можетбытьизбыточна,поэтому,какправило,об-ходятсянеобходимымвданномисследова-нии набором меток в зависимости от по-ставленнойцели.

Лингвистическое аннотирование мо-жет включать несколько видов разметок:синтаксическую, лексико-семантическую,морфологическую и просодическую[3].Врусскомязыкознаниисамымразработан-ным является морфологическая разметка.Снедавнихпорвказахскомязыкознаниинаосновеимеющихсяметодиканнотированияэлектронных текстов также начали зани-маться морфологической разметкой. Этотвидразметкипредусматриваетраспределе-ние электронныхкорпусовпочастямречис их грамматическими категориями. Наоснове правил словообразования большиемассивытекстовподвергаютсяавтоматизи-рованнойобработке.Аннотированиекорпу-сов,какбылосказановыше,осуществляет-сяпрограммнымисредствами.Иногдаиз-заотсутствияпрограммныхсредствнекотрыевиды разметок осуществляются вручную.Это чаще всего касается просодическойразметки,гденарядусавтоматизированнойобработкой текстов используется и ручнаяобработка.

Методикапросодическойразметкиуст-ных текстов посредством компьютерныхпрограмм наименее разработана в корпус-нойлингвистике.Врусскомязыкеосновойпросодической разметки является делениена синтагмы и метки ударения. Учитываяфонетическую систему казахского языкапросодическая разметка казахских текстовпредусматриваетсинтагматическоеделениетранскрибированнойзвучащейречисобо-значением направления движения тона,разметкой синтагм на акцентные единицы(ритмическиегруппы)ипаузхезитации.

Для просодической разметки был вы-бранозвученныйдикторамипублицистиче-ский текст «Театр».Поправилам аудитор-

скогоанализазвучащийтекстбылподеленнасинтагмыиакцентныеединицы.Каждаясинтагма оформлялась соответствующиммелодическим контуром (восходящим,нисходящим, восходяще-нисходящим, нис-ходяще-восходящим или ровным). Всоот-ветствиисзадачамиисследованияозвучен-ные тексты анализировались специальнойкомпьютернойпрограммой,разработаннойпрограммистами-информатиками, котораядает возможность фиксировать осцилло-граммуречевогосигнала,озвученныйтекст,начало и конец высказывания и синтагмысобозначениемнаправлениядвиженияос-новного тона синтагмы. Посредством раз-работанной для просодической разметкикомпьютернойпрограммыбылпроанализи-рованозвученныйпублицистическийтекст.Впроцессе разметки обращалось внима-ниенапроцедуруанализаисопоставленияречевых сигналов. При делении текста насинтагмы было важно правильно ставитьграницу синтагмы, чтобы не нарушалосьсмысловое восприятие речи.Правила син-тагматического членения базируются награмматическом (пунктуационном, мор-фологическом и синтаксическом) анали-зе текста, а такжена ситуативном анализесегментации в звучащей речи. Установкаграницсинтагмвлияетнапередачуинтона-ционныххарактеристикатакженапереда-чусмысловогосодержания.Подсинтагмойпонимается универсальная, характернаядля всех языков, смысловая единица, воз-никающаяприсегментациивысказывания,текста. Минимальным объемом речевогоотрезка, в котором проявляется синтакси-ческоеиинтонационноезначениеявляетсясинтагма,несущаябольшуюфункциональ-нуюнагрузкувтексте[1].

Как показала просодическая разметка,синтагма в зависимости от речевой ситуа-циииконтекстаможетоформлятьсясловом,словосочетаниемипредложением,выражаясложное смысловое единство. Синтагмауниверсальна и встречается во всех язы-ках, формирование синтагм в потоке речиопределяетсянежесткимиправилами,аоб-условлено разнообразными смысловымисвязямивнутри текста, а также зависитотхода мысли говорящего (диктора), от еговиденияипониманияситуации.Например:

Театр өнерінің ең басты құралы – //сөз.(главноесредствотеатральногоискус-ства–//этослово).

Онсыз әдебиет те,// драматургия да,//қарым-қатынас та болмақ емес. (без негонеможетсуществоватьнилитература,//нидраматургия,//никоммуникация).

Различныесинтагмыобладаютбольшейили меньшей смысловой целостностью.

Page 3: УДК 811.512. 122 КОРпУС КАзАхСКОгО языКА ... › pdf › 2016 › 11-2 › 10495.pdf · 2016-11-25 · international journal of applied and fundamental research

INTERNATIONAL JOURNAL OF APPLIED AND FUNDAMENTAL RESEARCH №11,2016

336 PHILOLOGICALSCIENCES При недостаточности объема синтаксиче-ское значение остается интонационно не-выраженным. Например, незавершенностьможет выражать подчинительные отноше-ния, еслиподчинительнаясвязьвпростомвысказыванииустанавливаетсямеждусло-вами,необразующимисинтагму,тоонанебудет иметь интонационного выражения.Втомслучае,еслисловаисловосочетанияв простых высказываниях соответствуютсинтагме, то они будут выражаться неза-вершеннойинтонацией,вчастности,ввы-сказываниях с однородными членами. На-пример:

Оқу техникасы фонетика,// граммати-ка,// орфоэпия,// орфография,// стилисти-камен ұштасып жатыр. (Техника чтениясвязана с грамматикой,// орфоэпией,// ор-фографией,//стилистикой).

В сложном же высказывании, где егокомпоненты являются отдельными син-тагмами, подчинительная связь также бу-дет выражена незавершенной интонацией.Простое нераспространенное высказыва-ние, образующееодну синтагму, оформля-ется завершенной интонацией. Например,следующее высказываниеИнтонация өте маңызды орын алады. (Интонация играет большую роль) состоитизоднойсинтагмы,передающейзначениезаконченностиине-зависимости. Оба эти значения передаетнисходящаяинтонация.Ноинтонационнаяскрытая внутренняя зависимость друг отдругачленовпредложения, существующаяблагодаря подчинительным связям междуними, обнаруживается при их распростра-ненности:

Сахнатілінде//интонацияөтемаңыздыорыналады.(Всценическойречи//интона-цияиграетбольшуюроль).

Отношения зависимости между члена-мипредложения становятся интонационновыраженными и передаются с помощьювосходящей интонации. Восходящий тон,которыйоформляетнеконечные синтагмы,нарядусозначениемнезаконченностипере-даетиэтиотношениязависимости.Следо-вательно, если в объеме синтагмы проис-ходит полное совпадение синтаксическихи интонационных значений на основаниидвух значимых критериев, то интонацияв этих конструкциях безвариантна, т.е.может быть использован только один ин-тонационный тип – восходящий или нис-ходящий. Вданном случае под типом по-нимается движение основного тона, и подвариантом – возможность использованияводнойсинтагмефонологическипротиво-положногоинтонационноготипа.

В просодической разметке различаютграмматические паузы, отделяющие друг

отдругаинтонационно-оформленныесин-тагмы и фразы, а также паузы хезитации(неуверенности). грамматические паузыпринимают участие в передаче опреде-лённых синтаксических, интонационныхисмысловыхотношений.границаакцент-ных единиц может быть промаркированапереломом тонального контура, сменойпросодических характеристик, которыевоспринимаются как нарушениеплавноготеченияречи.Синтагмапосравнениюсак-центнойединицей(ритмическойгруппой)являясьединицейболеевысокогопорядка,шире определяет характеристики предме-товиявлений,окоторыхговоритсявречи.Минимальные фонетические и семанти-ко-интонационныеединицы,каковымияв-ляются ритмические группы и синтагмы,определяютсемантико-интонационноеде-лениеречи(текста).

границы семантико-интонационных,синтаксических единиц синтагм переда-ются посредством синтагматических уда-рений. Являясь предельным элементомфразировки,онаявляетсярезультатомсин-тактико-стилистического и лексико-фра-зеологического членения речевого потока.границысинтагмывречидостаточнопод-вижныичастонаходятотражениевпункту-ации, однако знаки препинания не всегдасовпадаютсееграницей.будучинаимень-шаей знаменательной частью высказыва-ния, синтагма оформляется посредствоминтонационныхсредств.

Как показывает просодическая размет-ка, членение на синтагмы определяетсясмысловым содержанием высказывания,степенью распространенности главныхи второстепенных членов. Одно и то жевысказывание в зависимости от интенцииговорящегоможетбытьпроизнесеносраз-личнымсинтагматическимчленением.Рас-смотрим следующий пример, озвученныйдиктором:Ән өнері ерте заманнан бастау алатыны белгілі. (Известно, что певче-ское искусство зародилось очень давно). Этовысказываниеможетсостоятьизоднойсинтагмы,издвухитрехвзависимостиотконтекста:

Әнөнеріертезаманнанбастауалатыныбелгілі.

(Известно, чтопевческоеискусство за-родилосьоченьдавно).

Әнөнері//ертезаманнанбастауалаты-ныбелгілі.

(Известно,// что певческое искусствозародилосьоченьдавно).

Әнөнері//ертезаманнан//бастауала-тыныбелгілі.

(Известно,//чтопевческоеискусство//зародилосьоченьдавно).

Page 4: УДК 811.512. 122 КОРпУС КАзАхСКОгО языКА ... › pdf › 2016 › 11-2 › 10495.pdf · 2016-11-25 · international journal of applied and fundamental research

МЕЖДУНАРОДНЫЙЖУРНАЛПРИКЛАДНЫХ ИФУНДАМЕНТАЛЬНЫХИССЛЕДОВАНИЙ №11,2016

337 ФИЛОЛОгИчЕСКИЕНАУКИ Такое соотношение частей высказыва-

ния обусловлено определенным осмысле-ниемситуацииговорящимилислушающим.Интонационное оформление синтагмы,в нашем анализе, обеспечивалось мело-дическими и темпоральными средствами.Когда несколько ритмических групп объ-единяются в синтагму, происходит усиле-ние синтагматического ударения за счетослабленияпредшествующихритмическихударений.

ВыводыТаким образом, просодическая раз-

метка текста показала, что фонетическаяцелостностьсинтагмывречисоздаетсяот-сутствиемпаузывнутрисинтагмыиобщиммелодическимконтуром.Синтагмыоформ-лялись восходящим, нисходящим, восход-ще-нисходящим и нисходще-восходящим

направлением движения основного тона.Спомощью автоматизированной обработ-ки электронных корпусов были описаныречевыезакономерностизвучащеготекста.Воснове просодической разметки речево-гопотокалежитсемантико-интонационнаясегментация. было выявлено, что просо-дическое аннотирование звучащего текстаопределяетсяпаузацией,направлениемдви-женияосновноготонаипереломоммелоди-ческого контура на стыках анализируемыхсегментов.

Список литературы

1.базарбаева З.М. Казахская интонация. – Алматы,2008.–281с.

2.ЗахаровВ.П.Корпуснаялингвистика:Учебно-мето-дическоепособие.–СПб.,2005.–48с.

3.ПлунгянВ.А.(ред.).Национальныйкорпусрусскогоязыка:2003–2005.–М.,2005.–150с.