pembangkitan suara sintetik berbasis spektrum...
Post on 20-Aug-2019
251 Views
Preview:
TRANSCRIPT
Pembangkitan Suara SintetikBerbasis Spectrum Density
Pada Gamelan Kelompok Balungan
BIYAN OSCAR2209100140
Pembimbing:1. Dr. Ir. Yoyon Kusnendar Suprapto, M.Sc.2. Ir. Stevanus Hardiristanto, MT.
Latar Belakang
Nada Dasar alat musik modern Nada dasar bisa berubah-rubah
Nada Dasar gamelan disesuaikan penyanyi daerah
2
Masing-masing gamelan mempunyai frekuensi dasar yang tidak sama antara suatu set dengan yang lain.
Frek =538 Hz Frek =465 Hz Frek =581 Hz
PermasalahanGamelan mempunyai harga yang mahal dan tidak mudah dipindah darisatu tempat ke tempat lainnya. Hal ini menghambat orang yangmempelajari gamelan dan juga menjadi hambatan dalam mendapatkansuara gamelan. Padahal gamelan memiliki nada dasar yang berbedaantara satu set dengan set yang lain.
3
Tujuan
Batasan Masalah Implementasi dilakukan untuk nada-nada gamelan keluarga balungan
(khususnya saron).
Pada penelitian ini, penulis tidak menganalisis gamelan dengan gagrak tertentu, melainkan menganalisis gamelan yang berada di Elektro ITS saja.
Penelitian ini bertujuan membangkitkan suara sintetik gamelan yang bisadiatur pitch-nya.
4Gamelan kelompok Balungan
5Spektrum Sinyal
Interval musikmusik modern
gamelan
𝑓𝑘 = 𝑓𝑅 . 2 𝑘 12
𝑓𝑗 = 𝑓𝑖 . 2 𝑚 5 𝑓𝑠𝑎𝑟𝑜𝑛2 = 𝑓𝑠𝑎𝑟𝑜𝑛1. 2
1 5
1. Loy, D. Gareth. “Musimathics : a guided tour of the mathematics of music”, The MIT Press, United States of America, Ch 2 dan Ch. 3, 2006.2. Suprapto, Yoyon Kusnendar, “Spectral Density Based on Phase Shifting for Music Notation”, Jurnal Ilmiah Kursor Vol. 6, No. 3, Januari 2012
[1]
[2]
a. Spektrum Sinyal Saron dilihat dari samping
b. Spektrum Sinyal Saron dilihat dari atas
di mana j = saron yang dicari, i = saron referensi, dan m = interval antara i ke j.
Input Rekaman
Nada Asli
Analisis Frekuensi
Estimasi nilai frekuensi/ pitch dengan menggunakan FFT
Menentukan Panjang Window
Output:
Frekuensi,
Amplitude Envelope,
Sudut fasa
Analisis Amplitudo
Digunakan metode Least Square
untuk mengambil Envelope
Analisis Fasa
Estimasi titik mulai dari nada asli
Tidak
Seluruh Sinyal telah dianalisis
Ya
Melakukan analisis Amplitudo dan fasa Tiap windownya
Menunjuk Window selanjutnya
Tahap Analisis 6
Output:Nilai freq_found = 581 Hz, 3443 Hz, 2585 Hz, 3061 Hz
Nilai phi = 245.71
Dan Matrix Amplitude Envelope:
Tahap Analisis 7
Memasukkan input rekaman suara
Fast Fourier Transform(FFT)
𝑋 𝜔 = −∞
∞
𝑥(𝑡) 𝑒−𝑗𝜔𝑡
Analisis Frekuensi
Di mana :x(t) sinyal domain waktu𝑋 𝜔 sinyal domain frekuensi
Pencarian Frekuensi dengan FFT8
Frek fundamental =581 Hz Frek partial =3443 Hz
Frek partial =2585 Hz Frek partial = 3061 HzTidak
Fast Fourier Transform
Mencari spektrum frekuensi yang punya magnitudo terbesar
Nilai frekuensi disimpan
Spektrum pada frekuensi tersebut dihapus
Masih ditemukan kandidat frekuensi
Proses pencarian frekuensi berakhir
Ya
Input Nada Asli
AmplitudoAmplitudo adalah adalah puncak/simpangan tertinggi dari suatu sinyal/gelombang.[1] Di gamelan, volume perlahan-lahan melemah.
Perubahan amplitudo envelope
Mengambil Envelope sinyal
metode yang digunakan adalah Least Square
9Analisis Amplitudo
[1] Park, Tae Hong. “Introduction To Digital Signal Processing”, World Scientific Publishing Co. Pte. Ltd, Ch. 1, 2010..
Bentuk Polar sinyal Sinusoidal [1]
Bentuk rectangular sinyal Sinusoidal
10Least Square
𝑥 𝑡 = 𝐴 cos(𝜔𝑡 + ∅) (10.1)
𝐴 cos 𝜔𝑡 + ∅ = 𝐴 cos ∅ cos 𝜔𝑡 − 𝐴 sin ∅ sin 𝜔𝑡
)= 𝐶 cos 𝜔𝑡 + 𝐷 sin(𝜔𝑡 (10.2)
dengan C = 𝐴 cos(∅) dan D = − 𝐴 sin∅ .
[1] Gunawan, Dadang dan Juwono, Filbert Hilman, “Pengolahan Sinyal Digital dengan Pemrograman MATLAB”, Graha Ilmu, Yogyakarta, 2012.
Parameter Deskripsi
A
𝜔
t
∅
Amplitudo
Frekuensi sudut
Waktu dalam sekon
Fase awal dalam radian
Bentuk rectangular sinyal Sinusoidal
Dengan mengambil bentuk kuadrat dari parameter C dan D didapat
𝐶2 = 𝐴2 cos2(∅) dan 𝐷2 = 𝐴2 sin2(∅) . (11.1)
Dengan menjumlahkan kuadrat C dan D didapat nilai untuk parameter A[1]
, yaitu:
11Least Square
)𝐶2 + 𝐷2 = 𝐴2(cos2 ∅ + sin2 ∅ (11.2)
𝑨𝟐 = 𝑪𝟐 +𝑫𝟐 ↔ 𝑨 = 𝑪𝟐 +𝑫𝟐 (11.3)
[1] Gunawan, Dadang dan Juwono, Filbert Hilman, “Pengolahan Sinyal Digital dengan Pemrograman MATLAB”, Graha Ilmu, Yogyakarta, 2012.
Parameter Deskripsi
A
∅
C
D
Amplitudo
Sudut fase
= 𝐴 cos(∅)
= − 𝐴 sin ∅
12Least Square
Mengambil potongan sinyal input yang akan dianalisis
Membentuk sinyal komponen sinus dan cosinus
Menghitung besar amplitudo berdasarkan persamaan 11.3
amp =
2.0000 0.5000
phi =
90.0000 60.0000
xx =-2.0000-0.0000-0.43300.2500
Analisis Fase
Fase adalah ukuran posisi suatu sinyal dalam satuan waktu, berguna untuk menentukan titik mulai dari suatu gelombang.
13Analisis Fase
Sudut fasa dianalisis dengan turunan persamaan 12.2 yaitu
∅ = tan−1𝐶
𝐷
Gambar perbandingan 2 gelombang. Gelombang A mendahului gelombang B sebesar 30o
(13.1)
14Tahap Resynthesis
Membangkitkan sinyal sinusoidal
Resynthesis Amplitudo
Pada Sinyal Sintetik dibentuk Envelope sinyal sesuai sinyal asli
dengan mengatur amplitudo Sinyal Sinus
Resynthesis Fasa
Menentukan titik mulai pada sinyal Sinus
Resynthesis Frekuensi
Memasukan nilai frekuensi nada/ pitch
Output Sinyal Sintetik
Input dari tahap
analisis
(Frekuensi, Amplitude
Envelope, sudut fase)
15Membangkitkan sinyal sinusoidal
Parameter Deskripsi
A
f
t
∅
Amplitudo (contoh -1.0 sampai +1.0)
Frekuensi dalam Hertz(Hz)
Waktu dalam sekon
Fase awal dalam radian
𝑦 𝑡 = 𝐴 . sin 2 . 𝜋 . 𝑓 . 𝑡 + ∅
Resynthesis Frekuensi
Memasukan nilai frekuensi nada/ pitch ke dalam gelombangsinyal sinus.
Resynthesis Fase
Memasukan nilai sudut fase hasil analisi fase ke dalamgelombang sinyal sinus.
16Hasil Resynthesis Frekuensi & Fasa
Menggunakan Amplitude Modulation17
Resynthesis Amplitudo
Sinyal Sinus Envelope
Sinyal Hasil
18
Nada asli Saron 1 Sintetik Saron 1 (fundamental saja)
Output Sinyal Sintetik
Sintetik Nada Monofoni
Sintetik Nada gabungan
Sintetik Saron 1 (fundamental+parsial)
Nada asli Saron 1 + Saron 5
Nada Sintetik Saron 1 + Saron 5 (fundamental saja)
Nada Sintetik Saron 1 + Saron 5 (fundamental+parsial)
Pengujian Nada Monofoni 19
Nada Asli Sintetik Fundamental Sintetik Fundamental +Parsial
Perbandingan FFT antara Sintetik frekuensi Fundamental
20Sintetik Frekuensi Fundamental + parsial
0 sampai 2000Hz 2000 Hz sampai 4000 Hz
Perbandingan plot FFT Saron asli dan sintetik
Plot Mean Absolute Error SARON1SL sintetik(fund. dan partial)
Plot Mean Square Error SARON1SL sintetik(fund. dan partial)
MAE rata-rata = 0.017449 MSE rata-rata = 0.00087818
Pengujian Nada Gabungan 21
Nada Asli Sintetik Fundamental Sintetik Fundamental +Parsial
Perbandingan FFT Sintetik Frekuensi Fundamental+
Parsial
22
s1pa asli
s1pa sintetik
Pitch Shift
s2pa sintetik s3pa sintetik s4pa sintetik
s5pa sintetik
s2pa asli s3pa asli s4pa asli s5pa asli
23Pengujian Pitch Shift
Frekuensi Sinyal Asli
Frekuensi Sinyal Sintetik
Error
SARON1SL 581 Hz 582 Hz 1 Hz
SARON2SL 668 Hz 668 Hz 0 Hz
SARON3SL 763 Hz 768 Hz 5 Hz
SARON5SL 873 Hz 882 Hz 9 Hz
SARON6SL 1013 Hz 1013 Hz 0 Hz
s1pa 465 Hz 466 Hz 1 Hz
s2pa 531 Hz 535 Hz 4 Hz
s3pa 613 Hz 615 Hz 2 Hz
s4pa 701 Hz 706 Hz 5 Hz
s5pa 799 Hz 811 Hz 12 Hz
550600650700750800850900950
10001050
SARON1SL SARON2SL SARON3SL SARON5SL SARON6SL
Frek
uens
i (H
z)
Kenaikan frekuensi Saron Slendro(SARONSL)
Nada Asli
Nada Sintetik
450
500
550
600
650
700
750
800
850
s1pa s2pa s3pa s4pa s5pa
Fre
ku
en
si (
Hz)
Kenaikan frekuensi Saron Slendro set ke-2
(spa)
Nada Asli
Nada Sintetik
Tabel kenaikan frekuensi Saron
24Pengujian Pitch Shift
NoJenis
Sintetik
KualitasNilai
MOSTidak Mirip(1)
Kurang mirip(2)
Cukup Mirip(3)
Mirip
(4)Sangat Mirip(5)
1 s1pa 0 1 5 15 12 4,15
2 s2pa 0 1 8 17 7 3,91
3 s3pa 1 10 10 7 5 3,15
4 s4pa 1 8 12 6 6 3,24
5 s5pa 3 12 5 9 4 2,97 0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
s1pa s2pa s3pa s4pa s5pa
Nila
i M
OS
SARON
Grafik MOS Pitch ShiftTable MOS Pitch Shift
Hasil suara Sintetik dalam
Lagu
25
lagu aslirekaman set 1
lagu sintetik dari set 1
lagu sintetikdari set 2
Lagu: Manyar Sewu
Notasi:
1’ . 6 . 1’ . 6 . 5 . 3 . 5 . 3
STFT lagu asli STFT lagu sintetik
Kesimpulan
Untuk membangkitkan suara sintetik, parameter frekuensi terdiridari fundamental dan partial. Keduanya digunakan untukmembuat timbre suara asli. Bila hanya dilakukan sintesis frekuensifundamental saja, maka suara khas gamelan belum terbentuk.Nilai Mean Absolute Error(MAE) saat keduanya disintetik adalah0.017449. Sedangkan nilai MAE dari sintesis frekuensifundamental saja adalah 0.018086 Jadi nilai error tersebut lebihkecil 0,000637.
Suara sintetik yang dihasilkan sudah mempunyai pitch yangsangat mendekati suara asli, dengan error frekuensi=1 Hz danerror magnitudo=4,2107.
26
27
top related