uygulamalı türkçe doğal dil İşleme evreleri...sunum İçeriği •türkçe doğal dil İşleme...

71
Uygulamalı Türkçe Doğal Dil İşleme Evreleri GÜLŞEN ERYİĞİT İstanbul Teknik Üniversitesi, Bilgisayar ve Bilişim Fakültesi

Upload: others

Post on 21-Aug-2020

21 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Uygulamalı Türkçe Doğal Dil İşleme

Evreleri

GÜLŞEN ERYİĞİTİstanbul Teknik Üniversitesi, Bilgisayar ve Bilişim Fakültesi

Page 2: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Akademisyen kısa özgeçmişİstanbul Teknik Üniversitesi (İTÜ) Bilgisayar ve Bilişim Fakültesi öğretim üyesi olan Dr. GülşenEryiğit İTÜ Doğal Dil İşleme Grubunun kurucu üyesi ve yöneticisidir. Yüksek lisans ve doktoraderecelerini 2002 ve 2007 yıllarında İTÜ Bilgisayar Mühendisliği Bölümünden almıştır. 2006yılında İsveç Vaxjö Üniversitesinde ziyaretçi araştırmacı olarak bulunmuş ve çalıştığı grup ileCoNLL (doğal dil öğrenme konferans serisi) 2006 ve 2007 çok-dilli bağlılık ayrıştırmasıçalıştaylarında birinci olarak seçilen çalışmada yer almıştır. 2007 yılında doktora çalışmalarınedeni ile Siemens Mükemmeliyet Ödülüne laik görülmüştür.

Gülşen Eryiğit’in aktif araştırma alanı doğal dil işleme konusundadır. Bu alanda, pek çok prestijlidergi ve konferansta hakem ve yazar olarak görev almıştır. Avrupa Birliği CLARIN (EU 7thFramework Programme, CLARIN - Common language resources and technology infrastructure)projesinde Türkiye temsilcisi olarak yer almıştır. Bunun yanı sıra yakın geçmişte pek çok AB (Cost),Tubitak (1001 ve 1003) ve Sanayi Bakanlığı (Santez) destekli projede yürütücülük vearaştırmacılık yapmış, 6 Tubitak TEYDEB destekli projede danışman olarak görev almıştır. Aynızamanda bu fonlama kuruluşlarında (AB H2020, Cost Aksiyonu programları, Tubitak, SanayiBakanlığı) hem araştırma hem endüstriyel proje önerilerinde hakemlik ve izleyicilik yapmaktadır.Araştırmacıların hizmetine sunduğu Türkçe Doğal Dil İşleme Web Servisleri (tools.nlp.itu.edu.tr)2018 yılı itibari ile 190’nın üzerinde araştırmacıya hizmet vermektedir.

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Page 3: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Uygulamalı Türkçe Doğal Dil İşleme

Evreleri

GÜLŞEN ERYİĞİTİstanbul Teknik Üniversitesi, Bilgisayar ve Bilişim Fakültesi

Page 4: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

• 2014’den bu yana

• >190 kayıtlı aktif araştırmacı (y.lisans, doktora, araştırma projesi çalışanı)

Page 5: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Sunum İçeriği

• Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri• Normalizasyon• Sözcük Analizi• Varlık İsmi Tanıma• Cümle Analizi• Veri Kümeleri

• Örnek Projeler• Aktif Araştırma Evreleri

• Anlamsal Rol Etiketleme• Eşgönderge Çözümlemesi• Çok sözcüklü terimlerin Bulunması

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Page 6: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Sunum İçeriği

• Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri• Normalizasyon• Sözcük Analizi• Varlık İsmi Tanıma• Cümle Analizi• Veri Kümeleri

• Örnek Projeler• Aktif Araştırma Evreleri

• Anlamsal Rol Etiketleme• Eşgönderge Çözümlemesi• Çok sözcüklü terimlerin Bulunması

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Kullanılan Yapay Zeka Yöntemleri• Sınıflandırıcılar• Dizilim Etiketleyicileri• Kural Kodlayıcıları

CRF (conditional random fields, koşullu rasgele alanlar)

FST (Finite State Transducers –Sonlu Durumlu Otomatlar)

SVM (Support Vektor Machines –Karar Destek Makineleri)

Yapay Sinir Ağları

Derin Öğrenme - LSTM (Long-Short Term Memory)

Page 7: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Sunum İçeriği

• Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri Normalizasyon• Sözcük Analizi• Varlık İsmi Tanıma• Cümle Analizi• Veri Kümeleri

• Örnek Projeler• Aktif Araştırma Evreleri

• Anlamsal Rol Etiketleme• Eşgönderge Çözümlemesi• Çok sözcüklü terimlerin Bulunması

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Page 8: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Normalizasyon

Page 9: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Normalizasyon

rahat €ttt MUSFIK KENTER :((

Rahat et Müşfik Kenter @smiley[:((]

Page 10: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Page 11: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Normalizasyon

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Gülşen Eryiğit and Dilara Torunoğlu-Selamet. 2017.

Social media text normalization for Turkish. Natural Language Engineering Journal, 23(6): 835–875.

Sorunlu Sözcük Tespiti

Öneri Üretimi

Harf Yazımı Dönüşümü

Türkçe Karakter Düzeltici

Sesli Harf

Üreteci

Dönüştürme Kuralları

Özel İsim Tespiti

Şive Düzeltici

Yazım Hatası Düzeltici

Page 12: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Normalizasyon

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Gülşen Eryiğit and Dilara Torunoğlu-Selamet. 2017.

Social media text normalization for Turkish. Natural Language Engineering Journal, 23(6): 835–875.

Öneri Üretimi

Harf Yazımı Dönüşümü

Türkçe Karakter Düzeltici

Sesli Harf

Üreteci

Dönüştürme Kuralları

Özel İsim Tespiti

Şive Düzeltici

Yazım Hatası Düzeltici

tümüküçükTÜMÜBÜYÜKÖzel İsim YazımıkarIŞIK YaZıM

Page 13: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Normalizasyon

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Gülşen Eryiğit and Dilara Torunoğlu-Selamet. 2017.

Social media text normalization for Turkish. Natural Language Engineering Journal, 23(6): 835–875.

Öneri Üretimi

Harf Yazımı Dönüşümü

Türkçe Karakter Düzeltici

Sesli Harf

Üreteci

Dönüştürme Kuralları

Özel İsim Tespiti

Şive Düzeltici

Yazım Hatası Düzeltici

umuttan Umut’tan ?meltem yanık konuşmacılarımızdan biri.ayşenden Ayşe’nden , Ayşen’den ?

Page 14: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Normalizasyon

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Gülşen Eryiğit and Dilara Torunoğlu-Selamet. 2017.

Social media text normalization for Turkish. Natural Language Engineering Journal, 23(6): 835–875.

Öneri Üretimi

Harf Yazımı Dönüşümü

Türkçe Karakter Düzeltici

Sesli Harf

Üreteci

Dönüştürme Kuralları

Özel İsim Tespiti

Şive Düzeltici

Yazım Hatası Düzeltici

Karakter tekrarları,Logogramlar ($ → ¸s, €→ e, 3 → e, @ → a, ! → i, and ß→ b),Web 2.0’a özgü sözcükler, Eposta, hashtag, mention ve URL’leri yakalamaya yönelik

Page 15: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Normalizasyon

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Öneri Üretimi

Harf Yazımı Dönüşümü

Türkçe Karakter Düzeltici

Sesli Harf

Üreteci

Dönüştürme Kuralları

Özel İsim Tespiti

Şive Düzeltici

Yazım Hatası Düzeltici

Kübra Adalı and Gülşen Eryiğit. 2014.

Vowel and diacritic restoration for social media texts. In 5th Workshop on Language Analysis for Social Media (LASM) at EACL.

_k_l_d_n okuldan

Page 16: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Normalizasyon

•Dizilim etiketleyicileri

•CRF – Koşullu Rasgele Alanlar

•Kod çözme aşamasında

Kısıtlanmış Viterbi algoritması

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Öneri Üretimi

Harf Yazımı Dönüşümü

Türkçe Karakter Düzeltici

Sesli Harf

Üreteci

Dönüştürme Kuralları

Özel İsim Tespiti

Şive Düzeltici

Yazım Hatası Düzeltici

Gülşen Eryiğit and Dilara Torunoğlu-Selamet. 2017.

Social media text normalization for Turkish. Natural Language Engineering Journal, 23(6): 835–875.

Page 17: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Normalizasyon

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Öneri Üretimi

Harf Yazımı Dönüşümü

Türkçe Karakter Düzeltici

Sesli Harf

Üreteci

Dönüştürme Kuralları

Özel İsim Tespiti

Şive Düzeltici

Yazım Hatası Düzeltici

Gülşen Eryiğit and Dilara Torunoğlu-Selamet. 2017.

Social media text normalization for Turkish. Natural Language Engineering Journal, 23(6): 835–875.

Page 18: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Normalizasyon

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Kübra Adalı and Gülşen Eryiğit. 2014.

Vowel and diacritic restoration for social media texts. In 5th Workshop on Language Analysis for Social Media (LASM) at EACL.

Öneri Üretimi

Harf Yazımı Dönüşümü

Türkçe Karakter Düzeltici

Sesli Harf

Üreteci

Dönüştürme Kuralları

Özel İsim Tespiti

Şive Düzeltici

Yazım Hatası Düzeltici

Page 19: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Normalizasyon

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Gülşen Eryiğit and Dilara Torunoğlu-Selamet. 2017.

Social media text normalization for Turkish. Natural Language Engineering Journal, 23(6): 835–875.

Öneri Üretimi

Harf Yazımı Dönüşümü

Türkçe Karakter Düzeltici

Sesli Harf

Üreteci

Dönüştürme Kuralları

Özel İsim Tespiti

Şive Düzeltici

Yazım Hatası Düzeltici

gidmiycem gitmeyeceğim

Page 20: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Normalizasyon

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Dilara Torunoğlu-Selamet, Eren Bekar, Tugay İlbay and Gülşen Eryiğit. 2016.

Exploring spelling correction approaches for Turkish. The First International Conference on Turkic Computational Linguistics at CICLING 2016

Öneri Üretimi

Harf Yazımı Dönüşümü

Türkçe Karakter Düzeltici

Sesli Harf

Üreteci

Dönüştürme Kuralları

Özel İsim Tespiti

Şive Düzeltici

Yazım Hatası Düzeltici

Page 21: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Normalizasyon

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Gülşen Eryiğit and Dilara Torunoğlu-Selamet. 2017.

Social media text normalization for Turkish. Natural Language Engineering Journal, 23(6): 835–875.

Sorunlu Sözcük Tespiti

Öneri Üretimi

Harf Yazımı Dönüşümü

Türkçe Karakter Düzeltici

Sesli Harf

Üreteci

Dönüştürme Kuralları

Özel İsim Tespiti

Şive Düzeltici

Yazım Hatası Düzeltici

Page 22: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Page 23: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Sunum İçeriği

• Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri• Normalizasyon Sözcük Analizi• Varlık İsmi Tanıma• Cümle Analizi• Veri Kümeleri

• Örnek Projeler• Aktif Araştırma Evreleri

• Anlamsal Rol Etiketleme• Eşgönderge Çözümlemesi• Çok sözcüklü terimlerin Bulunması

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Page 24: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Sözcük Analizi

2. tekil kişi emir kipinde çekilmiş olumlu eylem et+Verb+Pos+Imp+A2sg

Sıfatrahat+Adj

Özel İsimMüşfik+Noun+Prop+A3sg+Pnon+Nom

Özel İsimKenter+Noun+Prop+A3sg+Pnon+Nom

Page 25: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Sözcük Analizi

İyelik eki almamış yalın halde 3. tekil kişi isimet+Noun+A3sg+Pnon+Nom

2. tekil kişi emir kipinde çekilmiş olumlu eylem et+Verb+Pos+Imp+A2sg

İyelik eki almamış yalın halde 3. tekil kişi isimrahat+Noun+A3sg+Pnon+Nom

Sıfatrahat+Adj

Sıfatmüşfik+Adj

Özel İsimMüşfik+Noun+Prop+A3sg+Pnon+Nom

Özel İsimKenter+Noun+Prop+A3sg+Pnon+Nom

Biçimbilimsel Çözümleme

Gülşen Eryiğit, 2017.

ITU Turkish NLP Web Service.In Proc. of the Demonstrations at EACL 2014.Gothenburg, Sweden,

Page 26: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Sözcük Analizi

İyelik eki almamış yalın halde 3. tekil kişi isimet+Noun+A3sg+Pnon+Nom

2. tekil kişi emir kipinde çekilmiş olumlu eylem et+Verb+Pos+Imp+A2sg

İyelik eki almamış yalın halde 3. tekil kişi isimrahat+Noun+A3sg+Pnon+Nom

Sıfatrahat+Adj

Sıfatmüşfik+Adj

Özel İsimMüşfik+Noun+Prop+A3sg+Pnon+Nom

Özel İsimKenter+Noun+Prop+A3sg+Pnon+Nom

Biçimbilimsel Çözümleme

Gülşen Eryiğit, 2017.

ITU Turkish NLP Web Service.In Proc. of the Demonstrations at EACL 2014.Gothenburg, Sweden,

Page 27: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Sözcük Analizi

İyelik eki almamış yalın halde 3. tekil kişi isimet+Noun+A3sg+Pnon+Nom

2. tekil kişi emir kipinde çekilmiş olumlu eylem et+Verb+Pos+Imp+A2sg

İyelik eki almamış yalın halde 3. tekil kişi isimrahat+Noun+A3sg+Pnon+Nom

Sıfatrahat+Adj

Sıfatmüşfik+Adj

Özel İsimMüşfik+Noun+Prop+A3sg+Pnon+Nom

Özel İsimKenter+Noun+Prop+A3sg+Pnon+Nom

Biçimbilimsel Çözümleme

Gülşen Eryiğit, 2017.

ITU Turkish NLP Web Service.In Proc. of the Demonstrations at EACL 2014.Gothenburg, Sweden,

Page 28: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Sözcük Analizi

İyelik eki almamış yalın halde 3. tekil kişi isimet+Noun+A3sg+Pnon+Nom

2. tekil kişi emir kipinde çekilmiş olumlu eylem et+Verb+Pos+Imp+A2sg

İyelik eki almamış yalın halde 3. tekil kişi isimrahat+Noun+A3sg+Pnon+Nom

Sıfatrahat+Adj

Sıfatmüşfik+Adj

Özel İsimMüşfik+Noun+Prop+A3sg+Pnon+Nom

Özel İsimKenter+Noun+Prop+A3sg+Pnon+Nom

Biçimbilimsel Çözümleme

Gülşen Eryiğit, 2017.

ITU Turkish NLP Web Service.In Proc. of the Demonstrations at EACL 2014.Gothenburg, Sweden,

Page 29: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Sözcük Analizi

İyelik eki almamış yalın halde 3. tekil kişi isimet+Noun+A3sg+Pnon+Nom

2. tekil kişi emir kipinde çekilmiş olumlu eylem et+Verb+Pos+Imp+A2sg

İyelik eki almamış yalın halde 3. tekil kişi isimrahat+Noun+A3sg+Pnon+Nom

Sıfatrahat+Adj

Sıfatmüşfik+Adj

Özel İsimMüşfik+Noun+Prop+A3sg+Pnon+Nom

Özel İsimKenter+Noun+Prop+A3sg+Pnon+Nom

Biçimbilimsel Çözümleme

HFST & XFST uyumlu1.5M sözcük

22saniye

Gülşen Eryiğit, 2017.

ITU Turkish NLP Web Service.In Proc. of the Demonstrations at EACL 2014.Gothenburg, Sweden,

Page 30: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Page 31: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Biçimbilimsel Çözümleyici ne amaçlarla kullanılıyor?

• Sözcük Çözümleme

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

GET or POST parameters: {tool}, {input} and {token} token: you can find your token on your login spacetool: ner, morphanalyzer, isturkish, morphgeerator, tokenizer, normalize, deasciifier, Vowelizer, DepParserFormal, DepParserNoisy, spellcheck, disambiguator, pipelineFormal, pipelineNoisy, input: utf-8 string The response is a text/plain encoded in UTF-8 Example: http://tools.nlp.itu.edu.tr/SimpleApi?tool=

morphanalyzer&input=et&token=XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

Page 32: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Biçimbilimsel Çözümleyici ne amaçlarla kullanılıyor?

• Sözcük Çözümleme

• Sözcük Üretimi

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

GET or POST parameters: {tool}, {input} and {token} token: you can find your token on your login space tool: ner, morphanalyzer, isturkish, morphgenerator, tokenizer, normalize, deasciifier, Vowelizer, DepParserFormal, DepParserNoisy, spellcheck, disambiguator, pipelineFormal, pipelineNoisy, input: utf-8 string The response is a text/plain encoded in UTF-8 Example: http://tools.nlp.itu.edu.tr/SimpleApi?tool=

morphgenerator&input=&token=XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

morphgenerator git+Verb+Pos+Fut+A1sg

Page 33: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Biçimbilimsel Çözümleyici ne amaçlarla kullanılıyor?

• Sözcük Çözümleme

• Sözcük Üretimi

• Sözcük Doğrulama

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

GET or POST parameters: {tool}, {input} and {token} token: you can find your token on your login space tool: ner, morphanalyzer, isturkish, morphgenerator, tokenizer, normalize, deasciifier, Vowelizer, DepParserFormal, DepParserNoisy, spellcheck, disambiguator, pipelineFormal, pipelineNoisy, input: utf-8 string The response is a text/plain encoded in UTF-8 Example: http://tools.nlp.itu.edu.tr/SimpleApi?tool=

morphgenerator&input=git+Verb+Pos+Fut+A1sg&token=XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXisturkish giteceğim

Page 34: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Biçimbilimsel Çözümleyici ne amaçlarla kullanılıyor?

• Sözcük Çözümleme

• Sözcük Üretimi

• Sözcük Doğrulama

• Sözcük bazında

transfere dayalı çeviri

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Hasan Kaya and Gülşen Eryiğit. 2015.

Using finite state transducers for helping foreign language learning. 2nd Workshop on Natural Language Processing Techniques for Educational Applications at ACL, Beijing, China

Page 35: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Biçimbilimsel Çözümleyici ne amaçlarla kullanılıyor?

• Sözcük Çözümleme

• Sözcük Üretimi

• Sözcük Doğrulama

• Sözcük bazında

transfere dayalı çeviri

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Page 36: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Sözcük Analizi

İyelik eki almamış yalın halde 3. tekil kişi isimet+Noun+A3sg+Pnon+Nom

2. tekil kişi emir kipinde çekilmiş olumlu eylem et+Verb+Pos+Imp+A2sg

İyelik eki almamış yalın halde 3. tekil kişi isimrahat+Noun+A3sg+Pnon+Nom

Sıfatrahat+Adj

Sıfatmüşfik+Adj

Özel İsimMüşfik+Noun+Prop+A3sg+Pnon+Nom

Özel İsimKenter+Noun+Prop+A3sg+Pnon+Nom

Biçimbilimsel Belirsizlik Giderme

Page 37: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Sözcük Analizi

2. tekil kişi emir kipinde çekilmiş olumlu eylem et+Verb+Pos+Imp+A2sg

Sıfatrahat+Adj

Özel İsimMüşfik+Noun+Prop+A3sg+Pnon+Nom

Özel İsimKenter+Noun+Prop+A3sg+Pnon+Nom

Biçimbilimsel Belirsizlik Giderme

Page 38: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Sözcük Analizi

2. tekil kişi emir kipinde çekilmiş olumlu eylem et+Verb+Pos+Imp+A2sg

Sıfatrahat+Adj

Özel İsimMüşfik+Noun+Prop+A3sg+Pnon+Nom

Özel İsimKenter+Noun+Prop+A3sg+Pnon+Nom

Gülşen Eryiğit. 2012.

The Impact of Automatic Morphological Analysis & Disambiguation on Dependency Parsing of Turkish. LREC

Page 39: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Sunum İçeriği

• Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri• Normalizasyon• Sözcük Analizi Varlık İsmi Tanıma• Cümle Analizi• Veri Kümeleri

• Örnek Projeler• Aktif Araştırma Evreleri

• Anlamsal Rol Etiketleme• Eşgönderge Çözümlemesi• Çok sözcüklü terimlerin Bulunması

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Page 40: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Varlık İsmi Tanıma

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Gökhan Akın Şeker and Gülşen Eryiğit. 2017.

Extending a CRF-based named entity recognition model for Turkish well formed text and user generated content. Semantic Web Journal, 8(5):625–642.

Page 41: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Varlık İsmi Tanıma

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Gökhan Akın Şeker and Gülşen Eryiğit. 2017.

Extending a CRF-based named entity recognition model for Turkish well formed text and user generated content. Semantic Web Journal, 8(5):625–642.

Page 42: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Varlık İsmi Tanıma

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Gökhan Akın Şeker and Gülşen Eryiğit. 2017.

Extending a CRF-based named entity recognition model for Turkish well formed text and user generated content. Semantic Web Journal, 8(5):625–642.

• Biçimbilimsel Özellikler• Sözcüksel Özellikler• Sözlüklerden Elde Edilen

Özellikler

Page 43: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Sunum İçeriği

• Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri• Normalizasyon• Sözcük Analizi• Varlık İsmi Tanıma Cümle Analizi• Veri Kümeleri

• Örnek Projeler• Aktif Araştırma Evreleri

• Anlamsal Rol Etiketleme• Eşgönderge Çözümlemesi• Çok sözcüklü terimlerin Bulunması

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Page 44: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Cümle AnaliziGülşen Eryiğit, Joakim Nivre and Kemal Oflazer. 2008.

Dependency parsing of Turkish. Computational Linguistics, 34(3):357–389.

Page 45: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Cümle Analizi

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Gülşen Eryiğit, Joakim Nivre and Kemal Oflazer. 2008.

Dependency parsing of Turkish. Computational Linguistics, 34(3):357–389.

Page 46: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Geçiş Tabanlı Ayrıştırma

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

İşlenmekteolan

sözcüklerin tutulduğu

YIĞIN

İşlenmek üzere olan sözcüklerin tutulduğu

KUYRUK

ötele indirge

ilişkilendir

Page 47: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Cümle Analizi

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Gülşen Eryiğit. 2013-2015.

Türkçe Web 2.0 Cümlelerinin AyrıştırılmasıTubitak 1001 (EU ICT Cost Aksiyonu) Projesi

Page 48: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Veri Kümeleri

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Umut Sulubacak, Tuğba Pamay Gülşen Eryiğit. 2016.

IMST: A revisited Turkish dependency treebank.TURCLING

Tuğba Pamay, Umut Sulubacak, Dilara Torunoğlu-Selamet and Gülşen Eryiğt. 2015.

The annotation process of the ITU Web treebank.LAW at NAACL

Page 49: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Veri Kümeleri

• Uluslararası Bağlılık Projesi‘Universal Dependencies Project’

UDhttp://universaldependencies.org/

71 dil , 122 ağaç yapılı derlem

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Umut Sulubacak and Gülşen Eryiğit. 2018.

Implementing universal dependency, morphology and multiword expression annotation standards for Turkish language processing. Turkish Journal of Electrical Engineering & Computer Sciences, 26(3):1662-1672.

Umut Sulubacak, Memduh Gokirmak, Francis Tyers, Çağrı Çöltekin, Joakim Nivre, and Gülşen Eryiğit. 2016.

Universal dependencies for Turkish. COLING

Page 50: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

İTÜ

UD

Page 51: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Sunum İçeriği

• Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri• Normalizasyon• Sözcük Analizi• Varlık İsmi Tanıma• Cümle Analizi• Veri Kümeleri

Örnek Projeler• Aktif Araştırma Evreleri

• Anlamsal Rol Etiketleme• Eşgönderge Çözümlemesi• Çok sözcüklü terimlerin Bulunması

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Page 52: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

ITU Natural Language Processing GroupProjects and Collaborations

Parsing Web2.0 Sentences (funding agency: The Scientific and Technological Research Council of

Turkey TÜBİTAK and EU COST ACTION IC1207 ) Sentiment Analysis and Big Data Platform for Turkish(funding agency: TÜBİTAK – TEYDEB Technology and Innovation

Funding Programs Directorate, collaboration with TURKCELL)

Turkish Mobile Personal Assistant(funding agency: Republic of Turkey Ministry of Science,Industry and Technology, collaboration with HUAWEI)

Machine Translation from Turkish to Turkish Sign Language and the

Avatar Animation (funding agency TÜBİTAK )

The usage of NLP for Geocoding(funding agency: : TÜBİTAK – TEYDEB, collaboration with MAPTRİKS)

ITU TURKISH WEB TREEBANK

Social CRM(funding agency: : TÜBİTAK– TEYDEB, collaborationwith INTERTECH)

Information Retrieval from FaxMessages

(funding agency: : TÜBİTAK – TEYDEB, collaboration with YapıKrediTeknoloji)

Aspect Based Sentiment Analysis for Turkish(funding agency: TÜBİTAK – TEYDEB Technology and Innovation

Funding Programs Directorate, collaboration with TURKCELL)Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Page 53: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

ITU Natural Language Processing GroupProjects and Collaborations

Parsing Web2.0 Sentences (funding agency: The Scientific and Technological Research Council of

Turkey TÜBİTAK and EU COST ACTION IC1207 ) Sentiment Analysis and Big Data Platform for Turkish(funding agency: TÜBİTAK – TEYDEB Technology and Innovation

Funding Programs Directorate, collaboration with TURKCELL)

Turkish Mobile Personal Assistant(funding agency: Republic of Turkey Ministry of Science,Industry and Technology, collaboration with HUAWEI)

Machine Translation from Turkish to Turkish Sign Language and the

Avatar Animation (funding agency TÜBİTAK )

The usage of NLP for Geocoding(funding agency: : TÜBİTAK – TEYDEB, collaboration with MAPTRİKS)

ITU TURKISH WEB TREEBANK

Social CRM(funding agency: : TÜBİTAK– TEYDEB, collaborationwith INTERTECH)

Information Retrieval from FaxMessages

(funding agency: : TÜBİTAK – TEYDEB, collaboration with YapıKrediTeknoloji)

Aspect Based Sentiment Analysis for Turkish(funding agency: TÜBİTAK – TEYDEB Technology and Innovation

Funding Programs Directorate, collaboration with TURKCELL)Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Page 54: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Sanal Asistanlar

• Soru-Soru & Soru-Cevap benzerlikleri hesaplama

•Varlık tespiti

•Niyet tespiti

•Aksiyon Planlama

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Gökhan Çelikkaya and Gülşen Eryiğit. 2017.

Use of NLP Techniques for an Enhanced Mobile Personal Assistant: The Case of Turkish. International Journal of Intelligent Systems and Applications in Engineering, 5(3):94–104

Page 55: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

ITU Natural Language Processing GroupProjects and Collaborations

Parsing Web2.0 Sentences (funding agency: The Scientific and Technological Research Council of

Turkey TÜBİTAK and EU COST ACTION IC1207 ) Sentiment Analysis and Big Data Platform for Turkish(funding agency: TÜBİTAK – TEYDEB Technology and Innovation

Funding Programs Directorate, collaboration with TURKCELL)

Turkish Mobile Personal Assistant(funding agency: Republic of Turkey Ministry of Science,Industry and Technology, collaboration with HUAWEI)

Machine Translation from Turkish to Turkish Sign Language and the

Avatar Animation (funding agency TÜBİTAK )

The usage of NLP for Geocoding(funding agency: : TÜBİTAK – TEYDEB, collaboration with MAPTRİKS)

ITU TURKISH WEB TREEBANK

Social CRM(funding agency: : TÜBİTAK– TEYDEB, collaborationwith INTERTECH)

Information Retrieval from FaxMessages

(funding agency: : TÜBİTAK – TEYDEB, collaboration with YapıKrediTeknoloji)

Aspect Based Sentiment Analysis for Turkish(funding agency: TÜBİTAK – TEYDEB Technology and Innovation

Funding Programs Directorate, collaboration with TURKCELL)Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Page 56: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

TürkçedenTürk İşaret DilineÇeviri

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Cihat Eryiğit, Hatice Köse, Meltem Kelepir and Gülşen Eryiğit. 2016.

Building machine-readable knowledge representations for Turkish sign language generation. Knowledge-Based Systems, 108:179–194

Page 57: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

ITU Natural Language Processing GroupProjects and Collaborations

Parsing Web2.0 Sentences (funding agency: The Scientific and Technological Research Council of

Turkey TÜBİTAK and EU COST ACTION IC1207 ) Sentiment Analysis and Big Data Platform for Turkish(funding agency: TÜBİTAK – TEYDEB Technology and Innovation

Funding Programs Directorate, collaboration with TURKCELL)

Turkish Mobile Personal Assistant(funding agency: Republic of Turkey Ministry of Science,Industry and Technology, collaboration with HUAWEI)

Machine Translation from Turkish to Turkish Sign Language and the

Avatar Animation (funding agency TÜBİTAK )

The usage of NLP for Geocoding(funding agency: : TÜBİTAK – TEYDEB, collaboration with MAPTRİKS)

ITU TURKISH WEB TREEBANK

Social CRM(funding agency: : TÜBİTAK– TEYDEB, collaborationwith INTERTECH)

Information Retrieval from FaxMessages

(funding agency: : TÜBİTAK – TEYDEB, collaboration with YapıKrediTeknoloji)

Aspect Based Sentiment Analysis for Turkish(funding agency: TÜBİTAK – TEYDEB Technology and Innovation

Funding Programs Directorate, collaboration with TURKCELL)Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Page 58: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

İlişki Çıkarımı

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Gözde Gül İşgüder¸ Sahin, Erdem Emekligil, Seçil Arslan, Onur Ağın and Gülşen Eryiğit.

Relation extraction via one-shot dependency parsing on inter-sentential, higher-order and nested relations. Turkish Journalof Electrical Engineering & Computer Sciences, 26(2):830–843.

Page 59: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

ITU Natural Language Processing GroupProjects and Collaborations

Parsing Web2.0 Sentences (funding agency: The Scientific and Technological Research Council of

Turkey TÜBİTAK and EU COST ACTION IC1207 ) Sentiment Analysis and Big Data Platform for Turkish(funding agency: TÜBİTAK – TEYDEB Technology and Innovation

Funding Programs Directorate, collaboration with TURKCELL)

Turkish Mobile Personal Assistant(funding agency: Republic of Turkey Ministry of Science,Industry and Technology, collaboration with HUAWEI)

Machine Translation from Turkish to Turkish Sign Language and the

Avatar Animation (funding agency TÜBİTAK )

The usage of NLP for Geocoding(funding agency: : TÜBİTAK – TEYDEB, collaboration with MAPTRİKS)

ITU TURKISH WEB TREEBANK

Social CRM(funding agency: : TÜBİTAK– TEYDEB, collaborationwith INTERTECH)

Information Retrieval from FaxMessages

(funding agency: : TÜBİTAK – TEYDEB, collaboration with YapıKrediTeknoloji)

Aspect Based Sentiment Analysis for Turkish(funding agency: TÜBİTAK – TEYDEB Technology and Innovation

Funding Programs Directorate, collaboration with TURKCELL)Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Page 60: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Hedef Tabanlı Duygu Analizi

DDİ Sosyal Medya Analizinin daha doğru yapılmasını sağlar:

• “The iPhone has never been good,”

• “The iPhone has never been this good”

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Maria Pontiki et al. (including Gülşen Eryiğit). 2016.

SemEval-2016 task 5: Aspect basedsentiment analysisSemEval

Page 61: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Sunum İçeriği

• Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri• Normalizasyon• Sözcük Analizi• Varlık İsmi Tanıma• Cümle Analizi• Veri Kümeleri

• Örnek ProjelerAktif Araştırma Evreleri

• Anlamsal Rol Etiketleme• Eşgönderge Çözümlemesi• Çok sözcüklü terimlerin Bulunması

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Page 62: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Sunum İçeriği

• Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri• Normalizasyon• Sözcük Analizi• Varlık İsmi Tanıma• Cümle Analizi• Veri Kümeleri

• Örnek Projeler• Aktif Araştırma Evreleri

Anlamsal Rol Etiketleme• Eşgönderge Çözümlemesi• Çok sözcüklü terimlerin Bulunması

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Page 63: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Anlamsal Rol Etiketleme

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Gözde Gül İşgüder, Eşref Adalı, 2017.

Annotation of semantic roles for the Turkish Proposition Bank.Language Resources and Evaluation

Gözde Gül İşgüder, Mark Steedman, 2018.

Character-Level Models versus Morphology in Semantic Role Labeling.ACL

Page 64: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Sunum İçeriği

• Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri• Normalizasyon• Sözcük Analizi• Varlık İsmi Tanıma• Cümle Analizi• Veri Kümeleri

• Örnek Projeler• Aktif Araştırma Evreleri

• Anlamsal Rol Etiketleme Eşgönderge Çözümlemesi• Çok sözcüklü terimlerin Bulunması

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Page 65: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Eşgönderge Çözümlemesi

•Artgönderim

•Öngönderim

•Adıl Çözümlemesi

vb…

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Tuğba Pamay and Gülşen Eryiğit. 2018.

Turkish CoreferenceResolution. INISTA

Page 66: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Eşgönderge Çözümlemesi

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Tuğba Pamay and Gülşen Eryiğit. 2018.

Turkish Coreference Resolution. INISTA

Page 67: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

İlişki Çıkarımı

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Tuğba Pamay and Gülşen Eryiğit. 2018.

Turkish Coreference Resolution. INISTA

Tuğba Pamay and Gülşen Eryiğit. 2018.

Turkish Coreference Resolution. INISTA

Page 68: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Sunum İçeriği

• Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri• Normalizasyon• Sözcük Analizi• Varlık İsmi Tanıma• Cümle Analizi• Veri Kümeleri

• Örnek Projeler• Aktif Araştırma Evreleri

• Anlamsal Rol Etiketleme• Eşgönderge Çözümlemesi Çok sözcüklü terimlerin Bulunması

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Page 69: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Çok Sözcüklü Terimler

•MWEs «Pain in the neck» in NLP

Türkçe’de «boyun ağrısı» değil «karın ağrısı»

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

Mathieu Constant, Gülşen Eryiğit, Johanna Monti, Lonneke van der Plas, Carlos Ramisch, Michael Rosner and Amalia Todirascu. 2017.

Multiword Expression Processing: A Survey. Computational Linguistics, 43(4):837–892

Umut Sulubacak and Gülşen Eryiğit. 2018.

Implementing universal dependency, morphology and multiword expression annotation standards for Turkish language processing. Turkish Journal of Electrical Engineering & Computer Sciences, 26(3):1662-1672.

Page 70: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Çok Sözcüklü Terimler

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit

«Parseme» Parsing andMulti Word ExpressionsEU Cost Action

Page 71: Uygulamalı Türkçe Doğal Dil İşleme Evreleri...Sunum İçeriği •Türkçe Doğal Dil İşleme Yazılım Zinciri Evreleri•Normalizasyon •Sözcük Analizi •Varlık İsmi

Questions

? ??

??

?

Türkçe Doğal Dil İşleme Evreleri © 2018 by Gülşen Eryiğit