otomata teorisinin uygulama alanları
DESCRIPTION
Otomata Teorisinin Uygulama Alanları. ve DİlİMLEyİCİ(LEXİCAL ANALYSER) ÖrNEĞİ. Sunumun sebebi hakkında. Uygulama Alanları. Uygulama Alanları = q'lar ve 1 ve 0'lar ne olabilir?. Bu sunuda derleyiciler alanındaki uygulamasını göreceğiz. Doğal dil işleme(nlp) Biyoloji - PowerPoint PPT PresentationTRANSCRIPT
Otomata Teorisinin Uygulama AlanlarıVE DİLİMLEYİCİ(LEXİCAL ANALYSER) ÖRNEĞİ
Sunumun sebebi hakkında
Uygulama Alanları
Doğal dil işleme(nlp)Biyoloji(Hücresel Otomat, Game of Life)Sıvı akışlarıKozmoloji Derleyiciler
Bu sunuda derleyiciler alanındaki
uygulamasını göreceğiz.
Uygulama Alanları = q'lar ve 1 ve 0'lar ne olabilir?
Bizim sunumuzun içeriği
Derste öğrendiklerimizin derleyicilerde nasıl kullanıldığı Basit bir dilimleyici projesi Derste gördüğümüz NFA-Boş Kısacık bir Jflap özeti ve NFA-Boş'tan NFA'ya NFA'dan Jflap ile DFA'ya geçiş DFA geçiş tablosu ve önemi Teoriden koda TürkÇE'nin dilimleyicisinden örnek
Derste öğrendiklerimiz makineler
Alfabe = {a,b}
Derleyicilerde kullanılan makineler
Alfabe = {a,b,c,ç,d,e...z,A,B,C...Z}
Tabi bu sadece bir anahtar kelime için verilmiş bir örnek, ileride ne kadar karmaşık olacağını göreceğiz.
Bizim sonlu sayıda(finite-state) makinasını anlamak için yapacağımız küçük proje
Proje kendisine gelen bir kaynak dosyasından, belli formatlardaki e-posta adreslerini, telefon numaralarını ve adresleri ayıklayan ve yanlarına e-posta, tel ve adres yazdıran küçük bir uygulama olacak. Bu formatlar aşağıdaki gibidir:
==> ........@.....(.)com ==> +90...-...-..-.. ==> Apt:..../No:....
İzleyeceğimiz yol: bizim gereksinimlerimize göreRegular Expression == > NFA ==> DFA ==> Geçiş Tablosu ==> Tabloda gezen for döngüsü
Regular Expression Derste gördüğümüz bir regular expression r = a(a+b)*aa Bu regular expression'un ürettiği diziler: L = { aaaaa,abbabaa..}
Fakat bize iki harf yetmeyeceğinden
r = (a+b+c+d+e+f+..+z), r yerinede harf diyelim harf = (a+b+c+d..+z) rakam = (0+1+2+3+4+5+6+7+8+9) isim = (harf)(harf+rakam)*
Projemizin Regular Expression'ları ==> ........@.....(.)com ==> +90...-...-..-.. ==> Apt:..../No:.... harf = (a+b+c+d..+z) rakam = (0+1+2+3+4+5+6+7+8+9) isim = (harf)(harf+rakam)*
• e-posta = isim '@' isim '.' com• tel = '+90' (rakam)^3 '-' (rakam)^3 '-' (rakam)^2
'-' (rakam)^2• adres = 'Apt:' isim '/No:' isim
• Not: (^ işareti üssüyü ifade etmektedir. 'x' tırnak işareti ise x'in mutlaka dizgide olacağını ifade eder. Biraz önceki regular expression'u hatırlayalım:
Basit bir regular exp. örneği
r = a(a+b)*aa
E-posta için NFAe-posta = isim '@' isim '.' com
E-posta için NFA'dan DFA'yae-posta = isim '@' isim '.' com
DFA'dan Geçiş Tablosu Bu tablo iki boyutlu A
dizisi olsun
örnek olarak input[] = {abc} olsun
Sonuç
Bir e-posta regular expression'u için bu kadar karmaşık işlemler gerektiriyor, hem e-posta hem adres hemde telefon için veya bir derleyicideki anahtar kelimeler, sabitler, değişkenler için pazar ne kadar karışır siz tahmin edin. Peki çözümü yok mu?
Bunun için sizin regular
expressionlarınızı veren ve size java kodunu döndüren
Jflex'e veya C++ için olanu flex'e müracaat
edebilirsiniz.