Çok katmanli algilayici ve gerİye yayilim algorİtmasi İle konuŞmaci ayirt etme
DESCRIPTION
ÇOK KATMANLI ALGILAYICI VE GERİYE YAYILIM ALGORİTMASI İLE KONUŞMACI AYIRT ETME. Fırat Fehmi Aygün Aybars Moralı Dokuz Eylül Üniversitesi Bilgisayar Mühendisliği Bölümü. Ana Hat. Giriş Konuşmacı Tanıma Nasıl Ayırt Edilebilir Bayes Karar Ağaçları Yapay Sinir Ağları Girdi Sorunları - PowerPoint PPT PresentationTRANSCRIPT
ÇOK KATMANLI ALGILAYICI VE GERİYE YAYILIM ALGORİTMASI
İLE KONUŞMACI AYIRT ETME
Fırat Fehmi AygünAybars Moralı
Dokuz Eylül ÜniversitesiBilgisayar Mühendisliği Bölümü
Akademik Bilişim '07 Dumlupınar Üniversitesi 2
Ana Hat• Giriş• Konuşmacı Tanıma• Nasıl Ayırt Edilebilir
– Bayes– Karar Ağaçları– Yapay Sinir Ağları
• Girdi Sorunları• Öznitelik Çıkarma
– MFCC• MLP Yapay Sinir Ağları• Eğitim Kümesi• Değerlendirme Kümesi• Deneyler• Bitim• Teşekkürler
Akademik Bilişim '07 Dumlupınar Üniversitesi 3
Giriş
Konuşmacı Tanıma• Konuşmacı Doğrulama• Konuşmacı Ayırt Etme
Akademik Bilişim '07 Dumlupınar Üniversitesi 4
Konuşmacı Tanıma
Akademik Bilişim '07 Dumlupınar Üniversitesi 5
Nasıl Ayırt Edilebilir ?
• Arama– Tam Eşleştirme
NP-Complete• Yaklaşık Çözüm
– Bayes– Yapay Sinir Ağları– Karar Ağaçları
Akademik Bilişim '07 Dumlupınar Üniversitesi 6
Bayes?
• +– Başarım oranı yüksek– Eğitim için ek süre yok– Yerel en iyi noktaları yok
• -– Yüksek işlem zamanı– İstatistiksel -> Geniş çalışma kümesi
Akademik Bilişim '07 Dumlupınar Üniversitesi 7
Karar Ağaçları?
• +– Hızlı Sınıflandırma– Sonuç: Ağaç
• -– Yerel En İyi Noktası Sorunu
Akademik Bilişim '07 Dumlupınar Üniversitesi 8
Yapay Sinir Ağları?
• +– Hızlı Sınıflandırma– Sonuç: Fonksiyon– Yerel En İyi Noktası Sorunu Yok
• -– Uzun Eğitim Süresi– Çok Fazla Değişken
Akademik Bilişim '07 Dumlupınar Üniversitesi 9
Girdi Sorunları
Girdi Boyu• DeğişkenGirdi Verisi• Eğitime Uygun Değil
Çözüm :• Öznitelik Çıkarma
Akademik Bilişim '07 Dumlupınar Üniversitesi 10
Aşama 1 – Veri Toplama ve Eğitim
Akademik Bilişim '07 Dumlupınar Üniversitesi 11
Aşama 2 – Ayırt Etme
Akademik Bilişim '07 Dumlupınar Üniversitesi 12
Öznitelik Çıkarma
• MFCC• DFT
Akademik Bilişim '07 Dumlupınar Üniversitesi 13
MFCC• Mel-Frequency Cepstrum Katsayıları, algı temelli sesi
temsil eden katsayılardır.• Fourier Dönüşümü veya Discrete Cosine
Dönüşümü'nden türetilir. FFT/DCT ve MFCC arasındaki temel fark MFCC'de frekans bantları logaritmik olarak (Mel ölçüsünde) yerleşmiştir ve bu da insan ses sisteminin yanıtını bantları doğrusal olarak yerleşen FFT veya DCT'ye göre daha da yaklaştırır.
Akademik Bilişim '07 Dumlupınar Üniversitesi 14
MLP Yapay Sinir Ağları
• 4 Katman– 1 Giriş– 1 Çıkış– 2 Gizli
• Geriye Yayılım Algorithması
• HyperTansig• Rastsal İlkleme
Akademik Bilişim '07 Dumlupınar Üniversitesi 15
Eğitim Kümesi
• 4 Konuşmacı– Aybars– Kürşat– Begüm– Fırat
Akademik Bilişim '07 Dumlupınar Üniversitesi 16
Eğitim Kümesi• Konuşmacı başına 10 kelime
– Ad– Adil– Sektör– Kızı Öp– Vizör– Kokoş– Porsuk– Öpücük– Kuzen– Yüzyıl
Akademik Bilişim '07 Dumlupınar Üniversitesi 17
Değerlendirme Kümesi
• Eğitim Kümesi• Yeni Girdiler
Akademik Bilişim '07 Dumlupınar Üniversitesi 18
Deney 1
• Adım : 1000• Ayırt Etme Oranı: %32,5
Akademik Bilişim '07 Dumlupınar Üniversitesi 19
Deney 1 – Hata Grafiği
Akademik Bilişim '07 Dumlupınar Üniversitesi 20
Deney 2
• Adım : 2000• Ayırt Etme Oranı: %45
Akademik Bilişim '07 Dumlupınar Üniversitesi 21
Deney 2 – Hata Grafiği
Akademik Bilişim '07 Dumlupınar Üniversitesi 22
Deney 3
• Adım : 5000• Ayırt Etme Oranı: %57,5
Akademik Bilişim '07 Dumlupınar Üniversitesi 23
Deney 3 – Hata Grafiği
Akademik Bilişim '07 Dumlupınar Üniversitesi 24
Bitim
• Sonuç:– Düşük başarım oranı?
• Nasıl geliştirilebilir:– Adım sayısı– Nöron sayıları– Girdi
• Daha çok girdi• Daha az gürültü; daha iyi kayıt ortamı• Daha iyi örnek dağılımı• Daha iyi öznitelik çıkarma
Akademik Bilişim '07 Dumlupınar Üniversitesi 25
Teşekkürler• Yöney nicemleme işlemlerindeki ve Malcom Slanley’in
MFCC fonksiyonunu düzenlemedeki yardımlarından ötürü Dr. Emine Ekin’e teşekkür ederiz.