klasifikasi sinyal eeg menggunakan … · jurnal tif, vol. 2 no. 1, juli 2011 1 ... ngan serangan...
TRANSCRIPT
Jurnal TIF, Vol. 2 No. 1, Juli 2011
1
KLASIFIKASI SINYAL EEG MENGGUNAKAN KOEFISIEN AUTOREGRESIF, F‐SCORE, DAN LEAST SQUARES SUPPORT VECTOR MACHINE
Moch. Anang Karyawan1, Agus Zainal Arifin2 dan Ahmad Saikhu3
1, 2, 3 Jurusan Teknik Informatika, Fakultas Teknologi Informasi, Institut Teknologi Sepuluh Nopember, Surabaya, 60111
Email : [email protected]
ABSTRAK
Elektroensefalografi (EEG) banyak digunakan untuk penelitian fungsi otak dan gangguan neurologis.
Analisis secara visual tidak mungkin dilakukan secara rutin, sehingga sistem komputer telah diusulkan. Analisis sinyal EEG yang telah dikembangkan adalah menggunakan koefisien Autoregresif (AR) dan Least‐Square Support Vector Machine (LS‐SVM). Tiga masalah pada SVM yaitu; bagaimana memilih fungsi kernel, berapa jumlah fitur input yang optimal, dan bagaimana menentukan parameter kernel terbaik. Jumlah fitur dan nilai parameter kernel saling mempengaruhi, sehingga seleksi fitur diperlukan dalam membangun sistem klasifikasi. Pada penelitian ini diajukan metode klasifikasi sinyal EEG menggunakan koefisien AR, F‐Score, dan LS‐SVM. Koefisien AR diperoleh dari hasil proses ekstraksi fitur sinyal EEG menggunakan Burg AR. Fitur‐fitur hasil ekstraksi tersebut diseleksi dengan F‐Score. F‐Score diperoleh dengan menghitung nilai diskriminan fitur‐fitur dari dua kelas pada data training. Nilai F‐Score masing‐masing fitur diurutkan secara descending dan hasilnya digunakan untuk membuat kombinasi fitur. Kombinasi fitur tersebut digunakan sebagai input LS‐SVM. Berdasarkan hasil uji coba, metode yang diusulkan tersebut mampu meningkatkan rata‐rata hasil akurasi klasifikasi sinyal EEG sebesar 0,07% dari 99,57% menjadi 99,64%. Kata kunci : Sinyal EEG, Burg‐Autoregresive, Least Square Support Vector Machine, Features Selection
ABSTRACT
Electroencephalogram (EEG) is widely used to study brain function and neurological disorders. Visual analysis may not be done routinely, so that the computer system has been proposed. The autoregressive (AR) coefficient and the Least‐Square Support Vector Machine (LS‐SVM) has been used to analyze EEG signal. Three problems in the SVM, namely: how to choose a kernel function, how the optimal number of input features, and how to determine the best kernel parameters. The number of features and the value of required kernel parameters influence each other, so that feature selection is needed in building a classification system. In this study we propose a method of classification of EEG signals using AR coefficients, F‐Score, and LS‐SVM. AR coefficients obtained from the EEG signal feature extraction process using the Burg AR. The extracted features are selected with F‐Score. F‐Score is obtained by calculating the discriminant value of the features in the two classes of training data. F‐Score values of each feature are sorted in descending order and the results is used to make the combination of features. The combination of these features are used as input to LS‐SVM. Based on the results experiment, the proposed method was able to increase the average results of the EEG signal classification accuracy rate of 0.07% from 99.57% to 99.64%. Keyword : EEG Signal, Burg‐Autoregresive, Least Square Support Vector Machine, Features Selection
PENDAHULUAN
Aktivitas pada otak manusia menun‐
jukkan berbagai pola aktivasi baik dalam kondisi normal maupun abnormal. Kondisi
normal mencakup kondisi fisik (seperti tidur, terjaga, dan bekerja) dan kondisi men‐tal (seperti ketenangan, kebahagiaan, dan ke‐marahan). Kondisi abnormal terutama dia‐mati pada gangguan neurologis dan ketidak‐
Moch. Anang Karyawan, Klasifikasi Sinyal EEG Menggunakan Koefisien AR, F‐Score, dan LS‐SVM
2
seimbangan akibat pengaruh obat‐obatan, termasuk kejang pada epilepsi dan demensia [1]. Penelitian aktivitas otak memerlukan ci‐tra fungsional yang dihasilkan dari pengu‐kuran sinyal otak dengan electroencephalo‐gram (EEG), Magneto‐Enchepalography (MEG), dan functional Magnetic Resonance Imaging (fMRI).
Pengukuran sinyal otak dengan EEG adalah salah satu teknik yang relatif paling murah dibandingkan dengan MEG dan fMRI. EEG mempunyai resolusi temporal yang tinggi dan cepat merespon segala peru‐bahan aktivitas otak dibandingkan dengan MEG dan fMRI [2], sehingga penelitian si‐nyal EEG berkembang cepat. Perkembangan yang cepat ini karena EEG bersifat non‐invasif dan merupakan alat diagnostik yang praktis untuk penelitian berbagai kondisi otak, terutama kondisi abnormal pada kasus gangguan neurologis. Popularitas EEG kare‐na dua kelebihan utama: 1) biaya tenaga ahli khusus dan peralatan yang digunakan ren‐dah, dan 2) kenyamanan yang dirasakan oleh pasien [1].
Sinyal EEG merupakan sinyal yang sangat kompleks dan menjadi sumber infor‐masi utama untuk penelitian fungsi otak dan gangguan neurologis. Epilepsi adalah gang‐guan neurologis yang mempengaruhi lebih dari 50 juta orang di seluruh dunia. Epilepsi dianggap sebagai gangguan neurologis ke‐dua yang paling umum setelah stroke. Epi‐lepsi ditandai dengan kelebihan jumlah lis‐trik yang keluar dari sel‐sel otak, yang bisa menyebabkan kejang dan gerakan abnormal. Teknik pencitraan seperti MRI dapat digu‐nakan untuk mendiagnosis gangguan struk‐tural otak, tapi EEG telah menjadi prosedur rutin untuk memeriksa fungsi otak pada epilepsi [3].
Sinyal EEG pada serangan epilepsi me‐miliki pola karakteristik yang memungkin‐kan profesional kesehatan untuk membeda‐kannya dari kondisi normal (nonseizure). Tetapi, analisis secara visual tidak mungkin dilakukan secara rutin, karena sinyal EEG yang dihasilkan dari sistem monitoring EEG sangat besar dan cukup memakan waktu [4]. Masalah yang lain yang muncul adalah kurangnya perbedaan yang jelas pada sinyal EEG antara serangan epilepsi dan nonepilep‐si. Beberapa teknik deteksi otomatis telah
diuji coba untuk mempercepat dan mening‐katkan akurasi identifikasi bentuk gelom‐bang EEG patologis yang dihubungkan de‐ngan serangan epilepsi, dan diusulkan untuk mendeteksi lonjakan dalam EEG untuk memprediksi kejadian epilepsi [3].
Pang dkk. 2003, membandingkan kiner‐ja classifier berbasis jaringan saraf tiruan (JST) dan menyimpulkan bahwa antara JST yang dilatih dengan fitur yang dipilih menggu‐nakan algoritma seleksi fitur dan sinyal EEG asli dapat menghasilkan akurasi yang sama, dan berkisar dari 82,83% sampai dengan 86,61%. Bigan, 1998, menggunakan teknik wavelet untuk mengekstraksi fitur dari sinyal EEG untuk mengembangkan suatu sistem analisis otomatis dan identifikasi serangan epilepsi. Karakteristik EEG epilepsi menun‐jukkkan jumlah perubahan frekuensi yang lebih banyak dari EEG nonepilepsi. Jaringan saraf dengan multilayer perceptron digunakan untuk proses analisisnya [3].
Nigam dan Graupe, 2004 mengguna‐kan multistage nonlinear preprocessing filter yang digabungkan dengan artificial neural network (ANN) untuk deteksi otomatis sera‐ngan epilepsi pada sinyal EEG. Güler dkk., 2005 menggunakan recurrent neural networks (RNNs) dan ekstraksi fitur Lyapunov yang di‐training dengan algoritma Levenberg–Mar‐quardt. Übeyli, 2006 menggunakan multilayer perceptron neural network (MLPNN). Übeyli, 2010 menggunakan Least‐Square Support Vec‐tor Machine (LS‐SVM) dan koefisien Autore‐gressive (AR). Data sinyal EEG yang digu‐nakan adalah data sinyal EEG set A dan set E [4]. Sinyal EEG set A adalah sinyal EEG yang direkam dari sukarelawan sehat de‐ngan mata terbuka. Sinyal EEG set E adalah sinyal EEG yang direkam dari penderita epilepsi saat terjadi serangan [5] ( http://epi‐leptologie‐bonn.de/cms/front_content.php?i dcat=193&lang=3&changelang=3). Proses ek‐straksi fitur menggunakan analisis spektral Burg Autoregressive (Burg AR). Sebelas dari dua belas fitur hasil ekstraksi digunakan se‐bagai fitur input LS‐SVM. Tingkat akurasi yang dihasilkan adalah 99,56% [4].
Seleksi fitur adalah salah teknik terpen‐ting dan sering digunakan dalam pre‐proces‐sing aplikasi machine learning. Seleksi fitur adalah proses memilih subset dari fitur asli sehingga jumlah fitur berkurang secara opti‐
Jurnal TIF, Vol. 2 No. 1, Juli 2011
3
mal sesuai dengan kriteria yang ditentukan. Teknik ini terbukti efektif mengurangi fitur‐fitur yang tidak relevan dan berlebihan, me‐ningkatkan efisiensi dalam proses learning, dan meningkatkan kinerja learning seperti akurasi prediksi. Data dimensi tinggi dapat berisi banyak sekali informasi yang tidak re‐levan dan berlebihan yang sangat mungkin menurunkan kinerja dari algoritma learning. Oleh karena itu, seleksi fitur menjadi sangat diperlukan oleh aplikasi machine learning ke‐tika menghadapi data dengan dimensi yang tinggi [6].
Chen & Lin, 2005 mengusulkan metode kombinasi seleksi fitur dengan SVM [7]. Sa‐lah satu metode seleksi fitur yang diusulkan adalah F‐Score. F‐Score adalah sebuah teknik sederhana untuk menghitung diskriminan dari dua himpunan bilangan real [7]. Kombi‐nasi metode SVM dan F‐Score digunakan un‐tuk mendiagnosis penyakit kanker payudara dan menghasilkan tingkat akurasi yang lebih baik dari LS‐SVM [8]. Polat dan Gunes me‐ngusulkan seleksi fitur yang disebut kernel F‐Score feature selection (KFFS). KFFS terdiri da‐ri dua tahap, pertama fitur input ditransfor‐masikan ke ruang kernel dengan fungsi ker‐nel, kedua nilai F‐Score dalam ruang dimensi tinggi dihitung menggunakan rumus F‐score sehingga mean F‐score dihasilkan. Hanya fitur dengan F‐score lebih besar dari mean F‐score yang dipilih [9].
Jumlah fitur yang optimal adalah salah satu dari tiga masalah yang muncul pada SVM. Tiga masalah pada SVM termasuk juga LS‐SVM adalah: bagaimana memilih fungsi kernel, dan menentukan berapa jumlah fitur input yang optimal, dan bagaimana menen‐tukan parameter kernel terbaik. Masalah‐masalah tersebut penting karena jumlah fitur dan nilai parameter kernel yang diperlukan saling mempengaruhi. Dengan demikian, se‐leksi fitur diperlukan dalam membangun sis‐tem klasifikasi, karena dengan pembatasan/ pengurangan jumlah fitur input dalam clas‐sifier maka akan mengurangi kompleksitas komputasi [8].
Pada penelitian ini diajukan metode kombinasi seleksi fitur dengan F‐Score, analisis spektral Burg AR, dan LS‐SVM un‐tuk mengklasifikasikan sinyal EEG set A dan set E. Metode kombinasi seleksi fitur menggunakan F‐Score. Penambahan metode
kombinasi seleksi fitur tersebut diharapkan mampu meningkatkan hasil akurasi dan mendapatkan kombinasi fitur dengan aku‐rasi terbaik di antara kombinasi fitur yang ada.
TINJAUAN PUSTAKA
Sinyal EEG
Elektroensefalografi (EEG) adalah metode yang digunakan dalam mengukur aktivitas listrik spontan dari otak yang dipe‐roleh dengan menembakkan sinyal listrik ke neuron dalam otak [10]. Proses perekamam sinyal EEG dilakukan dalam waktu singkat, biasanya selama 20‐40 menit. Rekaman dipe‐roleh dengan menempatkan elektroda pada berbagai posisi pada kulit kepala [11].
Terdapat dua pendekatan untuk men‐dapatkan sinyal EEG yaitu pendekatan invasif dan non invasif [10]. Pendekatn non‐invasif dapat diterapkan berulang‐ulang untuk pasien, orang dewasa normal, dan anak‐anak dengan hampir tidak ada risiko atau pembatasan [11], sehingga hampir semua rekaman EEG dewasa ini dilakukan secara non‐invasif [10]. Data Sinyal EEG
Data sinyal EEG digital dapat diperoleh dari database yang tersedia di Universitas Bonn yang tersedia secara online dan dibuat oleh Dr. Ralph Andrzejak dari Pusat Epilepsi di Universitas Bonn, Jerman (http://epilepto logie‐bonn.de/cms/front_content.php?idcat= 193&lang=3&changelang=3). Selain itu data sinyal EEG dalam bentuk digital dapat dipe‐roleh di http://sccn.ucsd.edu/~arno/fam2data /publicly_available_EEG_data.html [5].
Data sinyal EEG dari Universitas Bonn terdiri atas lima kelas dataset yaitu A, B, C, D, dan E. Tiap dataset berisi 100 segmen EEG saluran tunggal dengan durasi selama 23.6 detik. Setiap segmen dipilih dan dipotong dari rekaman EEG multichannel secara konti‐nyu setelah inspeksi artefak secara visual, misalnya gerakan mata atau aktivitas otot.
Set A dan B adalah sinyal yang diambil dari rekaman EEG yang dilakukan pada lima sukarelawan sehat dengan skema penempat‐an elektroda standar (International 10‐20 sys‐tem). Relawan dalam kondisi santai dan terjaga dengan mata terbuka (untuk set A)
Moch. Anang Karyawan, Klasifikasi Sinyal EEG Menggunakan Koefisien AR, F‐Score, dan LS‐SVM
4
dan mata tertutup (untuk set B). Set C‐E berasal dari arsip EEG diagnosis presurgical. EEG dari lima pasien dipilih, dan semua telah mencapai kontrol kejang yang lengkap, setelah reseksi dari salah satu formasi hippo‐campal, sehingga didiagnosis dengan benar masuk zona epileptogenic. Sinyal set D dire‐kam saat zona epileptogenic, dan berada pada interval tanpa kejang dan set C berasal dari pembentukan hippocampus pada belahan yang berlawanan dari otak. Sementara set C dan D berisi aktivitas yang hanya diukur selama interval tanpa kejang, sedangkan set E hanya berisi aktivitas kejang. Data set A dan set E tersebut yang digunakan dalam penelitian ini.
Sesuai dengan referensi yang ada, semua sinyal EEG direkam dengan sistem amplifier dengan kanal 128. Digitalisasi data dengan frekuensi 173,61 sampel per detik menggunakan A/D converter 12 bit. Band pass filter diatur pada 0,53 40 Hz (12 dB / oct) [5]. Masing‐masing data sinyal EEG digital tersebut terdiri atas 4097 data diskrit. Plot potongan sinyal EEG set A dan set E yang digunakan dalam penelitian ini dalam ben‐tuk gelombang ditunjukkan Gambar 1. Model Autoregresif
Model autoregresif adalah salah satu dari kelompok formula prediksi linier yang mencoba untuk memprediksi output dari suatu sistem berdasarkan input dan output sebelumnya. Model yang hanya bergantung pada output sistem sebelumnya disebut model autoregressive (AR), sementara model yang hanya bergantung pada masukan sistem disebut model moving average (MA), dan model yang bergantung pada input dan output disebut model autoregressive‐moving‐average (ARMA). Sesuai dengan arti autore‐gresif, model ini melakukan proses regresi pada dirinya sendiri. Model autoregresif orde p (AR (p)), didefinisikan dengan persa‐maan: Y(t) = β0 + β1Y(t‐1) +... + βPY(t‐p) + et, (1) di mana: Y = variabel dependen Yt‐1, Yt‐p = kelambanan (lag) dari Y еt = residual (kesalahan pengganggu) p = orde (tingkat) AR
0 50 100 150 200 250 300-100
-80
-60
-40
-20
0
20
40
60
80
100
Samples
μ V
Plot of EEG Signal (Set-A)
(a)
0 50 100 150 200 250 300-2000
-1500
-1000
-500
0
500
1000
Samples
μ V
Plot of EEG Signal (Set-E)
(b)
Gambar 1. Bentuk Gelombang Potongan Sinyal EEG dengan Panjang 256 untuk Set A (a) dan
Set E (b)
Terdapat tiga metode estimasi parame‐ter/koefisien autoregresif dari sampel data yaitu pendekatan least squares (LS), Yule‐Walker (YW) dan Burg (Burg). Metode Burg adalah pendekatan estimasi parameter yang saat ini dianggap sebagai yang paling tepat. Berbeda dengan metode least squares dan Yule‐Walker, yang memperkirakan parameter autoregresif langsung, metode Burg terlebih dahulu memperkirakan koefisien refleksi, yang didefinisikan sebagai estimasi parame‐ter autoregresif terakhir untuk masing‐ma‐sing model orde p. Dengan demikian, estimasi parameter ditentukan mengguna‐kan algoritma Levinson‐Durbin. Koefisien refleksi merupakan estimasi bias dari koefisien korelasi parsial [12].
Metode Burg Autoregresif
Metode Burg adalah dikembangkan dari estimasi spektrum yangdikenal sebagai maximum entropy method (metode entropi maksimum). Bagian dari metode ini adalah
Jurnal TIF, Vol. 2 No. 1, Juli 2011
5
koefisien refleksi dihitung secara berurutan dengan meminimalkan mean‐squares error (MSE) prediksi maju dan mun‐dur [13].
F‐Score
F‐score adalah teknik sederhana yang mengukur diskriminan dua himpunan bila‐ngan real. Pada vektor training xk, dengan k = 1, 2, . . . , m, jika jumlah kasus positif dan negatif adalah n+ dan n‐, maka F‐score ma‐sing‐masing fitur i didefinisikan sebagai :
∑∑−+
=
−−
+=
++
+
−+
−−
+−−
−+−=
n
kiik
n
kiik
iiiii
xxn
xxn
xxxxF
1
2)()(,
1
2)()(,
2)(2)(
)(1
1)(1
1)()(
, (2) di mana xi, xi(+), xi(‐) adalah rata‐rata dari fitur ke‐i keseluruhan, dataset positif, dan negatif, xk,i(+) adalah fitur ke‐i dari kasus positif ke‐k, dan xk,i(‐) adalah fitur ke‐i dari kasus negatif ke‐k. Pembilang menunjukkan diskriminasi antara himpunan positif dan negatif, dan penyebut menunjukkan fitur‐fitur dalam dua himpunan. Semakin besar F‐score, ke‐mungkinan fitur lebih diskriminatif semakin besar pula [7]. Support Vector Machines (SVM)
SVM yang diusulkan oleh Vapnik [14] telah dipelajari secara ekstensif untuk klasifi‐kasi, regresi dan estimasi kepadatan. Gam‐bar 2 adalah arsitektur SVM. SVM memeta‐kan pola input ke ruang fitur dimensi yang lebih tinggi melalui pemetaan nonlinier berdasar teori yang dipilih. Bidang pemisah linier ini kemudian dibangun dalam ruang fitur dimensi tinggi. Dengan demikian, SVM adalah linear classifier di ruang parameter, tapi itu menjadi nonlinear classifier sebagai akibat dari pemetaan nonlinear dari ruang pola input ke ruang fitur dimensi tinggi. Bila data pelatihan berdimensi m adalah xi (i = 1, ..., M) dan masing‐masing kelas labelnya adalah yi, di mana yi = 1 dan yi = ‐1 untuk kelas 1 dan 2. Jika data input terpisah secara linier di ruang fitur, maka fungsi keputusan dapat ditentukan: D(x) = wtg(x) + b, (3) di mana g(x) adalah fungsi pemetaan yang memetakan x ke dalam ruang dimensi 1, w adalah vektor dimensi dan 1, dan b adalah
Gambar 2. Arsitektur SVM
skalar. Untuk memisahkan data secara linier, fungsi keputusan memenuhi kondisi berikut: yi(wtg(xi) + b) > 1 untuk i = 1, ..., M. (4)
Jika masalah terpisah secara linier dalam ruang fitur, maka fungsi keputusan yang memenuhi persamaan (4) jumlahnya tak terbatas. Di antara fungsi‐fungsi tersebut, diperlukan hyperplane dengan margin terbe‐sar antara dua kelas. Margin adalah jarak mi‐nimum yang memisahkan hyperplane terha‐dap data input dan ini dihasilkan dari |D(x)|/||w||. Sehingga didapatkan hyper‐plane pemisah dengan margin maksimal yang optimal memisahkan hyperplane.
Dengan asumsi bahwa margin adalah ρ, kondisi berikut harus memenuhi:
ρ≥||||
)(w
xDy ii untuk i = 1, ..., M. (5)
Hasil perkalian produk dari ρ dan ||w|| adalah tetap: ρ ||w|| =1. (6) Untuk mendapatkan hyperplane pemisah yang optimal dengan margin maksimal, w dengan ||w|| yang memenuhi persamaan (5) harus ditemukan. Persamaan (6) menga‐rahkan ke pemecahan masalah optimasi berikutnya. Dengan meminimalkan
wwt
21 , (7)
dan mengikuti batasan: yi(wtg(xi) + b) > 1 untuk i = 1, ..., M. (8) Bila data pelatihan tidak linier dipisahkan, digunakan slack variable ξi ke persamaan (8): yi(wtg(xi) + b) > 1‐ ξi, ξi > 0, untuk i = 1, ..., M. (9) Hyperplane pemisah yang optimal telah ditentukan sehingga maksimalisasi dari
Moch. Anang Karyawan, Klasifikasi Sinyal EEG Menggunakan Koefisien AR, F‐Score, dan LS‐SVM
6
margin dan meminimalisasi dari kesalahan training didapatkan. Dengan meminimalkan
∑=
+n
ii
t Cww122
1 ρξ , (10)
mengikuti batasan: yi(wtg(xi) + b) > 1‐ ξi, ξi > 0 untuk i = 1, ..., M, (11) di mana C adalah parameter yang menen‐tukan tradeoff antara margin maksimum dan kesalahan klasifikasi minimum, dan ρ adalah 1 atau 2. Jika ρ = 1, SVM disebut SVM dengan soft margin L1 (L1‐SVM), dan jika ρ = 2, SVM dengan soft margin L2 (L2‐SVM). Pada SVM konvensional, hyperplane pemisah yang optimal diperoleh dengan memecah‐kan masalah pemrograman kuadratik.
Fungsi kernel memungkinkan operasi yang akan dilakukan di ruang input bukan di ruang fitur dimensi tinggi. Beberapa contoh fungsi kernel adalah K(u, v) = vTu (SVM linier); K(u, v) = (vTu + 1)n (SVM polinomial derajat n); K(u, v) = exp(‐||u ‐ v||2 / 2σ2) (SVM fungsi radial bases – SVM RBF); K(u, v) = tanh(KvTy + ο) (neural SVM dua layer) di mana σ, ĸ, ο adalah konstanta [14, 15]. Namun, fungsi kernel yang tepat untuk suatu masalah tertentu tergantung pada data, dan sampai saat ini belum ada metode yang dianggap terbaik tentang cara memilih fungsi kernel.
Least Squares Support Vectors Machine (LS‐SVM)
Least Squares Support Vectors Machine (LS‐SVM) adalah salah satu modifikasi dari SVM [16]. Jika SVM dikarakteristik oleh per‐masalahan konveks quadratic programming dengan pembatas berupa pertidaksamaan, LS‐SVM sebaliknya, diformulasikan meng‐gunakan pembatas yang hanya berupa per‐samaan. Sehingga solusi LS‐SVM dihasilkan dengan menyelesaikan persamaan linier. Hal ini tentulah berbeda dengan SVM yang ma‐na solusinya dihasilkan melalui penyelesaian quadratic programming. Saat ini, LS‐SVM ba‐nyak dilakukan pada klasifikasi dan estimasi fungsi [16].
LS‐SVM di‐training dengan memini‐malkan
∑=
+n
ii
t Cww1
2
221 ξ , (12)
dan mengikuti batasan persamaan:
yi(wtg(xi) + b) > 1‐ ξi, ξi > 0 untuk i = 1, ..., M. (13)
Pada LS‐SVM, batasan persamaan di‐
gunakan sebagai pengganti pertidaksamaan yang digunakan pada SVM konvensional. Karena itu, solusi yang optimal dapat dipe‐roleh dengan menyelesaikan sekumpulan persamaan linier bukan dengan penyelesai‐an quadratic programming. Untuk menurun‐kan dua masalah persamaan (12) dan (13) digunakan Lagrange multiplier, yaitu :
∑∑==
+−+−+
=n
iii
tii
n
ii
t bxgwyCww
bwQ
11
2 }1))(({22
1),,,(
ξαξ
ξα ,
(14) di mana α = (α1, ..., αM)t adalah Lagrange multiplier yang bisa bernilai positif atau ne‐gatif pada rumus LS‐SVM. Kondisi yang optimum diperoleh dengan mendifferensial‐kan persamaan di atas terhadap w, ξi, b, dan αi dan persamaan dihasilkan sama dengan nol [16, 17].
Seperti pada SVM konvensional, fungsi kernel memungkinkan operasi yang akan dilakukan di ruang input bukan di ruang fitur dimensi tinggi. Beberapa penelitian menggunakan LS‐SVM dan fungsi kernel RBF (LS‐SVM RBF) secara empiris mengha‐silkan hasil yang optimal [4, 9, 16, 18]. Untuk masalah klasifikasi dua‐spiral yang kom‐pleks dapat ditemukan dengan LS‐SVM RBF dengan kinerja yang sangat baik dan kompu‐tasi rendah [16].
METODE PENELITIAN
Tahapan dalam metodologi penelitian
terdiri atas tiga, yaitu ekstraksi fitur data sinyal EEG, seleksi fitur dengan F‐Score, dan klasifikasi kombinasi fitur dengan LS‐SVM. Ekstraksi Fitur Data Sinyal EEG
Ekstraksi fitur adalah salah satu tahap yang penting pada sistem pengenalan pola. Ekstraksi fitur tidak dilakukan pada data sinyal EEG secara langsung, tetapi dilakukan melalui dua tahap. Tahap pertama adalah memecah data menjadi segmen‐segmen de‐ngan ukuran 256 data dari dua dataset sinyal EEG set A dan set E yang masing‐masing terdiri atas 100 buah segmen. Tiap segmen berisi 4097 buah data diskrit yang kemudian
Jurnal TIF, Vol. 2 No. 1, Juli 2011
7
dilakukan windowing (pemotongan) dengan panjang 256, seperti yang dilakukan oleh Übeyli [4], didapatkan segmen data yang lebih kecil sebanyak 4097/256 = 16 segmen. Jumlah segmen data keseluruhan yang diperoleh dari pemotongan sinyal EEG set A dan E adalah 2 x 100 x 16 = 3200 segmen data.
Tahap kedua adalah melakukan proses ekstraksi fitur pada potongan segmen data tersebut menggunakan Burg AR orde 10. Proses ekstraksi fitur dengan Burg AR orde 10 menghasilkan 11 koefisien AR, dan 1 residual (noise). Dua belas koefisien AR tersebut selanjutnya disebut sebagai fitur hasil ekstraksi. Koefisien AR yang pertama tidak digunakan karena nilainya selalu 1, sehingga jumlah fitur yang digunakan adalah 11. Jadi jumlah data yang digunakan adalah 3200 yang terdiri atas 11 fitur.
Data hasil ekstraksi fitur tersebut dibagi secara random untuk training dan testing menggunakan metode cross validation dengan prosorsi 50% data training dan 50% data testing. Pemilihan data training dan tes‐ting dilakukan baik untuk uji coba penentu‐an parameter LSV‐RBF maupun untuk uji coba dengan kombinasi seleksi fitur.
Seleksi Fitur
Seleksi fitur adalah tahap kedua dari metode penelitian. Proses seleksi fitur inilah yang membedakan penelitian ini dengan penelitian Übeyli [4]. Proses seleksi fitur dilakukan dengan menghitung nilai F‐Score dari data training. Perhitungan nilai F‐Score dari data training tersebut berbeda dengan metode yang kombinasi seleksi fitur yang diusulkan oleh Chen & Lin [7]. Pada metode Chen & Lin, perhitungan F‐Score dilakukan baik data training maupun testing, sehingga kombinasi seleksi fitur yang dihasilkan dari beberapa uji coba adalah sama. Sedangkan pada penelitian ini kemungkinan akan dida‐patkan kombinasi yang berbeda dari tiap uji coba yang dilakukan.
Perhitungan nilai F‐Score menggunakan rumus (2). Nilai F‐Score tersebut diurutkan secara descending untuk membuat kombinasi fitur yang akan digunakan baik untuk training maupun testing. Kombinasi fitur pertama dibuat dari fitur dengan nilai F‐Score terbesar. Kombinasi fitur kedua dibuat
dari fitur dengan nilai F‐Score terbesar perta‐ma dan terbesar kedua, dan seterusnya se‐hingga didapatkan sebelas macam kombina‐si fitur. Sebagai contoh, misal hasil pengurut‐an secara descending untuk F‐Score dari data training adalah Fitur 4 (F4), Fitur 1 (F1), Fitur 3 (F3), Fitur 7 (F7), Fitur 5 (F5), Fitur 10 (F10), Fitur 8 (F8), Fitur 2 (F2), Fitur 11 (F11), Fitur 6 (F6), dan Fitur 9 (F9). Urutan tersebut dapat ditulis (F4, F1, F3, F7, F5, F10, F8, F2, F11, F6, F9). Berdasarkan hasil pengurutan tersebut dapat dibuat 11 kombinasi fitur yaitu F4, F4F1, F4F1F3, F4F1F3F7, ..., F4F1F3F7F5F10F8F2F11F6F9.
Sebelas macam kombinasi tersebut menjadi input pada LS‐SVM dengan RBF kernel (LS‐SVM RBF). Kombinasi fitur model #1 digunakan sebagai input pada LS‐SVM RBF baik untuk proses training mapun testing. Proses training mapun testing tersebut kemudian diulang lagi untuk kombinasi fitur model #2, #3, #4, dan seterusnya sampai dengan model #11. Kombinasi fitur model #11, yaitu F4F1F3F7F5F10F8F2F11F6F9 merupakan kombinasi input LS‐SVM pada penelitian Übeyli [4]. Jadi hasil proses klasifikasi pada model kombinasi #11 merupakan represen‐tasi hasil klasifikasi untuk penelitian Übeyli.
Klasifikasi Kombinasi Fitur dengan LS‐SVM
Tahap ketiga dari metode penelitian adalah melakukan klasifikasi kombinasi fitur dengan LS‐SVM RBF. LS‐SVM RBF juga digunakan pada penelitian Übeyli [4]. Data training untuk masing‐masing kombinasi fitur yang dihasilkan di‐training dengan LS‐SVM RBF. Proses training dilakukan dengan nilai parameter LS‐SVM RBF (γ dan σ2) yang ditentukan secara trial and error melalui uji coba penentuan parameter percobaan. γ adalah adalah parameter regulerisasi, yang menentukan trade‐off antara margin maksi‐mum dan kesalahan klasifikasi minimum. Pada beberapa penelitian lain nilai γ disebut sebagai C penalty [4, 8]. Sedangkan σ2 adalah bandwidth untuk fungsi kernel RBF. Penentuan nilai awal dan akhir parameter γ dan σ2 secara trial and error dengan merujuk pada nilai yang terdapat pada manual toolbox Matlab LS‐SVMlab1.5 [19, 20]. Nilai parameter γ dan σ2 yang dipilih untuk proses training tiap kombinasi fitur adalah yang menghasilkan akurasi tertinggi dan waktu
Moch. Anang Karyawan, Klasifikasi Sinyal EEG Menggunakan Koefisien AR, F‐Score, dan LS‐SVM
8
komputasi terendah. Hasil training dari masing‐masing kom‐
binasi fitur pada classifer LS‐SVM RBF digu‐nakan untuk menguji kombinasi fitur data testing. Hasil prediksi class label tersebut dibandingkan dengan class label sebenarnya, sehingga penelitian ini termasuk supervised learning. Pengujian dilakukan dengan nilai parameter γ dan σ2 yang sama dengan saat training. Parameter Percobaan
Nilai parameter γ ditentukan pada variasi antara 1 sampai dengan 10, dengan interval 1. Nilai σ2 ditentukan pada variasi antara 1,0 sampai dengan 2,0 dengan interval 0,1. Penentuan parameter ini menggunakan seluruh fitur hasil ekstraksi dengan pembagian data 50% untuk training dan 50% untuk testing menggunakan metode cross valudation. Tingkat akurasi dan waktu komputasi yang dihasilkan dari gabungan nilai γ dan σ2 tersebut disimpan dalam bentuk tabel (matriks). Tingkat akurasi adalah perbandingan jumlah class label yang benar hasil prediksi dibandingkan dengan jumlah class label sesungguhnya. Sedangkan waktu komputasi adalah waktu yang diperlukan untuk proses training dan testing. Data nilai γ, σ2, tingkat akurasi dan waktu komputasi tersebut kemudian diurutkan secara descending berdasarkan tingkat akurasi, dan ascending berdasarkan waktu komputasi. Gabungan nilai γ dan σ2 yang menghasilkan tingkat akurasi tertinggi dan membutuhkan waktu komputasi terendah akan digunakan dalam uji coba.
Uji Coba
Uji coba klasifikasi dari kombinasi seleksi fitur dilakukan sebanyak sepuluh kali. Beberapa penelitian tidak menyebutkan secara eksplisit jumlah uji coba yang dilakukan, tetapi hanya menampilkan hasil terbaik dari uji coba yang telah dilakukan [4, 8]. Uji coba dimulai dengan pemilihan data training dan testing mengunakan metode cross validation sebanyak sepuluh kali. Selanjutnya adalah seleksi fitur dengan F‐Score dilakukan sebanyak sepuluh kali. Lalu dilakukan proses training dan testing dari kombinasi seleksi fitur F‐Score dengan LS‐SVM RBF. Data yang dihasilkan selama
Tabel 1. Matriks Konfusi
Prediksi Aktual
Positif Negatif
Positif Negatif
True Positive (TP) False Positive (TP)
False Negative (FN) True Negative (TN)
proses uji coba adalah tingkat akurasi, sensitivitas, spesifitas, waktu komputasi, dan kombinasi fitur.
Evaluasi
Evaluasi dilakukan dengan tujuan untuk mengevaluasi efektivitas metode dan sistem yang telah dibuat. Ukuran atau para‐ meter yang digunakan untuk evaluasi antara lain akurasi klasifikasi, sensitivitas, spesifi‐sitas, nilai prediksi positif, nilai prediksi negatif, kurva ROC dan matriks konfusi (confusion matrix). Matriks konfusi berisi in‐formasi tentang klasifikasi yang sebenarnya dan yang diperkirakan dari hasil sistem klasifikasi. Tabel 1 adalah matriks konfusi untuk dua kelas klasifikasi. Akurasi klasifi‐kasi, sensitivitas, spesifisitas, nilai prediksi positif dan nilai prediksi negatif dapat dide‐finisikan menggunakan elemen‐elemen ma‐triks konfusi sebagai berikut: • Akurasi (%) =
TNFNFPTPTNTP
++++ ,
• Sensitivitas (%) = FNTP
TP+
,
• Spesifisitas (%) = TNFP
TN+
,
• Nilai prediksi positif = 100×+ FPTPTP ,
• Nilai prediksi negatif = 100×+TNFN
TN .
Kurva ROC adalah teknik yang dapat diandalkan karena didasarkan pada nilai‐nilai true positive dan false positive sehingga menunjukkan trade‐off antara sensitivitas dan spesifisitas [8].
HASIL DAN PEMBAHASAN
Implementasi dilakukan menggunakan
Matlab 7.4.0 (R2007a) yang dilengkapi toolbox LS‐SVMlab1.5 [19, 20]. Ekstraksi Fitur
Proses ekstraksi fitur dilakukan terhadap 3200 segmen data sinyal EEG set A
Jurnal TIF, Vol. 2 No. 1, Juli 2011
9
dan set E. Proses ekstraksi fitur pada masing‐masing segmen data menggunakan Burg AR orde 10. Contoh hasil ekstraksi fitur untuk sinyal EEG set A dapat dilihat pada Tabel 2 dan set E pada Tabel 3. Rekapitulasi statistik koefisien AR dapat dilihat pada Tabel 4. Seleksi Fitur
Seleksi fitur dilakukan dengan menghitung nilai F‐Score dari data training. Contoh hasil perhitungan nilai F‐Score dapat dilihat pada Tabel 5. Berdasarkan tabel F‐Score yang sudah diurutkan tersebut dibuat kombinasi fitur seperti terlihat pada Tabel 6.
Uji Coba Penentuan Parameter LS‐SVM RBF
Data hasil uji coba penentuan parameter LS‐SVM berisi data akurasi dan waktu komputasi. Data tersebut kemudian diurutkan berdasarkan tingkat akurasi secara descending dan waktu komputasi secara ascending. Lima besar data hasil uji coba yang sudah diurutkan dapat dilihat pada Tabel 7. Tingkat akurasi tertinggi dan waktu komputasi terendah diperoleh dengan nilai γ = 3 dan nilai σ2 = 2. Nilai γ dan σ2 tersebut digunakan dalam uji coba klasifikasi dengan kombinasi seleksi fitur.
Uji Coba Klasifikasi dengan Kombinasi Seleksi Fitur
Hasil uji coba sebanyak sepuluh kali dengan γ = 3 dan σ2 = 2. Hasil sepuluh kali uji coba tersebut dapat dilihat pada Tabel 8. Klasifikasi sinyal EEG dengan akurasi terbaik sebesar 99,81% didapatkan untuk model kombinasi #8. Evaluasi
Evaluasi terhadap efektivitas metode yang dikembangkan dilakukan melalui pe‐ngukuran tingkat akurasi, waktu komputasi, dan model kombinasi yang dihasilkan. Evaluasi dilakukan dengan membandingkan hasil uji coba dengan penelitian‐penelitian sebelumnya. Parameter pengukuran yang digunakan adalah akurasi klasifikasi, sensiti‐vitas, spesifisitas, nilai prediksi positif dan nilai prediksi negatif, matriks konfusi dan kurva ROC.
Tabel 2. Hasil Ekstraksi Fitur dengan Burg AR Orde 10 untuk Sinyal EEG Set A
Koefisien AR Nilai
a(0) a(1) a(2) a(3) a(4) a(5) a(6) a(7) a(8) a(9) a(10) E
1,000 ‐1,805 1,020 0,031 ‐0,324 0,293 ‐0,209 ‐0,269 0,839 ‐0,731 0,215 47,751
Tabel 3. Hasil Ekstraksi Fitur dengan Burg AR Orde 10 untuk Sinyal EEG Set E
Koefisien AR Nilai
a(0) a(1) a(2) a(3) a(4) a(5) a(6) a(7) a(8) a(9) a(10) E
1,000 ‐2,171 1,566 0,151 ‐0,724 ‐0,062 0,753 ‐0,572 0,078 0,047 0,010
5319,029 Tabel 4. Rekapitulasi Statistik Hasil Ekstraksi Fitur dengan Burg AR Orde 10 untuk Sinyal EEG Set E
Varians Mean Koefisien AR Set A Set E Set A Set E
a(0) a(1) a(2) a(3) a(4) a(5) a(6) a(7) a(8) a(9) a(10) E
0,0000,049 0,131 0,049 0,022 0,043 0,036 0,026 0,133 0,090 0,013
7.826,407
0,0000,0800,3780,2870,1490,1490,0850,1030,0910,0550,009
7.758.810,035
1,000‐1,694 0,795 0,271‐0,355 0,049 0,050‐0,217 0,409‐0,309 0,058
101,590
1,000 ‐2,285 1,716 0,129 ‐0,825 0,045 0,609 ‐0,334 ‐0,156 0,207 ‐0,048
1.884,096
Moch. Anang Karyawan, Klasifikasi Sinyal EEG Menggunakan Koefisien AR, F‐Score, dan LS‐SVM
10
Tabel 5. Nilai F‐Score untuk masing‐masing Fitur
No. Fitur F‐Score 1 2 3 4 5 6 7 8 9 10 11
1,3705 0,8384 0,0345 0,6031 0,0005 1,3472 0,0524 0,7199 0,8994 0,2252 0,2092
Tabel 6. Kombinasi Fitur untuk F‐Score
Model Jumlah Fitur
F‐Score Kombinasi Fitur
#1 #2 #3 #4 #5 #6 #7 #8 #9 #10 #11
1 2 3 4 5 6 7 8 9 10 11
1.3705 1.3472 0.8994 0.8384 0.7199 0.6031 0.2252 0.2092 0.0524 0.0345 0.0005
F1 F1F6 F1F6F9 F1F6F9F2 F1F6F9F2F8 F1F6F9F2F8F4 F1F6F9F2F8F4F10 F1F6F9F2F8F4F10F11 F1F6F9F2F8F4F10F11F7 F1F6F9F2F8F4F10F11F7F3 F1F6F9F2F8F4F10F11F7F3F5
Tabel 7. Lima Besar Data Hasil Uji Coba Penentu‐an Parameter LS‐SVM RBF γ σ Akurasi (%) Waktu (detik) 3 2,0 99,50 51,47 3 1,9 99,50 51,61 4 1,8 99,50 56,73 4 1,9 99,50 57,59 4 2,0 99,50 59,61
Tingkat Akurasi Klasifikasi
Tabulasi data tingkat akurasi klasifikasi terhadap model kombinasi dari sepuluh kali uji coba untuk F‐Score dapat dilihat pada Tabel 8. Rata‐rata tingkat akurasi klasifikasi terbaik didapatkan untuk model #8 yaitu 99,64%. Pada model #11 (tanpa seleksi fitur) tingkat akurasi klasifikasi rata‐rata adalah 99,57%. Perbandingan tingkat akurasi dalam bentuk grafik antara metode yang diusulkan dengan metode peneliti sebelumnya dapat
Tingkat Akurasi Klasifikasi
99,00
99,10
99,20
99,30
99,40
99,50
99,60
99,70
99,80
99,90
1 2 3 4 5 6 7 8 9 10
Uji Coba
%
Übeyli#8 F-Score
Gambar 3. Grafik Perbandingan Akurasi
Klasifikasi antara Übeyli, #8 F‐Score
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1Receiver Operating Characteristic curve, area=0.99813, std = 0.0012492
1 - Specificity
Sen
sitiv
ity
Gambar 4. Kurva ROC untuk Hasil Klasifikasi
Terbaik Model #8 F‐Score
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1Receiver Operating Characteristic curve, area=0.9975, std = 0.001442
1 - Specificity
Sen
sitiv
ity
Gambar 5. Kurva ROC untuk Hasil Klasifikasi
Terbaik Model #11 (Übeyli)
Grafik Perbandingan Waktu Komputasi
46,00
48,00
50,00
52,00
54,00
56,00
58,00
60,00
62,00
1 2 3 4 5 6 7 8 9 10
Uji Coba
Wak
tu K
ompu
tasi
(det
ik)
Übeyli
F-Score
Gambar 6. Grafik Perbandingan Waktu Komptasi
antara Übeyli, #8 F‐Score, dan #8 P‐Score dilihat pada Gambar 3. Peningkatan akurasi juga dihasilkan pada penelitian Akay, 2009 [8]. Matriks konfusi hasil klasifikasi sinyal
Jurnal TIF, Vol. 2 No. 1, Juli 2011
11
Tabel 9. Matriks Konfusi untuk Hasil Klasifikasi Terbaik Model #8 F‐Score
Prediksi Aktual
Set A Set E
Set A Set E
799 2
1 798
Tabel 10. Matriks Konfusi untuk Hasil Klasifikasi Terbaik Model #11 (Übeyli)
Prediksi Aktual
Set A Set E
Set A Set E
799 3
1 797
Tabel 11. Model Kombinasi #8 pada F‐Score
No. Model Akurasi (%) Kombinasi
1 #8 99,63 F6F1F9F2F4F8F10F11 2 #8 99,69 F1F6F9F2F8F4F10F11 3 #8 99,50 F1F6F9F2F8F4F10F11 4 #8 99,56 F1F6F9F2F8F4F10F11 5 #8 99,81 F6F1F9F2F8F4F10F11 6 #8 99,44 F1F6F2F9F8F4F10F11 7 #8 99,75 F1F6F9F2F4F8F10F11 8 #8 99,63 F1F6F9F2F8F4F10F11 9 #8 99,69 F6F1F9F2F8F4F10F11 10 #8 99,69 F1F6F9F2F8F4F10F11
Rata‐rata 99,64
EEG yang terbaik untuk model #8 F‐Score dan #11 (Übeyli) dapat dilihat pada Tabel 9 dan 10, dalam bentuk kurva ROC dapat dilihat pada Gambar 4 dan 5.
Waktu Komputasi
Perbandingan waktu antara metode yang diusulkan dengan metode Übeyli dapat dilihat pada Gambar 6. Waktu komputasi adalah waktu yang dibutuhkan untuk proses training dan testing. Model kombinasi #8 membutuhkan rata‐rata waktu komputasi lebih lama dibandingkan dengan model #11, karena nilai parameter untuk LS‐SVM RBF yang digunakan adalah nilai parameter untuk sebelas fitur (model #11)..
Penelitian yang dilakukan oleh Akay, 2009 menggunakan F‐Score untuk kasus kanker payudara tidak menunjukkan secara eksplisit waktu komputasi yang diperlukan. Sedangkan salah satu alasan yang mendasari penelitian tersebut adalah membatasi jumlah fitur yang digunakan dalam classifier dapat meningkatkan akurasi dan mengurangi komputasi [8].
Model Kombinasi
Evaluasi model kombinasi ini bertujuan untuk menguji apakah model kombinasi dengan tingkat akurasi tertinggi tersebut merupakan kombinasi fitur yang tetap. Model kombinasi #8 dari sepuluh kali uji coba dapat dilihat pada Tabel 11. Model kombinasi #8 selama sepuluh kali uji coba
Tabel 8. Tabulasi Tingkat Akurasi Klasifikasi (%) terhadap Model Kombinasi pada F‐Score
Model No
#1 #2 #3 #4 #5 #6 #7 #8 #9 #10 #11
1 89,31 97,06 97,94 98,63 98,50 99,38 99,06 99,63 99,50 99,69 99,50
2 88,50 97,38 97,94 98,69 99,13 99,13 99,13 99,69 99,63 99,75 99,75
3 89,06 97,56 97,94 98,50 99,00 99,00 99,13 99,50 99,50 99,50 99,50
4 88,06 97,31 97,94 98,31 98,94 98,94 99,06 99,56 99,56 99,63 99,56
5 89,38 98,19 98,44 99,00 99,31 99,56 99,31 99,81 99,69 99,63 99,75
6 88,31 97,13 97,75 98,00 98,75 98,75 99,06 99,44 99,44 99,50 99,50
7 88,56 97,56 98,06 98,63 98,81 99,13 99,13 99,75 99,56 99,63 99,69
8 89,31 97,56 98,31 98,69 99,19 98,81 98,94 99,63 99,63 99,63 99,50
9 88,63 97,75 98,06 98,75 99,06 99,31 99,25 99,69 99,25 99,38 99,31
10 88,06 97,69 98,19 98,81 99,19 99,50 99,56 99,69 99,50 99,56 99,63
Rata2 88,72 97,52 98,06 98,60 98,99 99,15 99,16 99,64 99,53 99,59 99,57
Moch. Anang Karyawan, Klasifikasi Sinyal EEG Menggunakan Koefisien AR, F‐Score, dan LS‐SVM
12
adalah tetap yaitu F1F6F9F2F8F4F10F11.
KESIMPULAN
Penambahan metode kombinasi seleksi fitur F‐Score terbukti mampu meningkatkan tingkat akurasi rata‐rata klasifikasi sinyal EEG set A dan set E. Tingkat akurasi rata‐rata yang dihasilkan oleh F‐Score adalah 99,64%. Tingkat akurasi rata‐rata klasifikasi tanpa kombinasi seleksi fitur adalah 99,57%. Pengurangan jumlah fitur pada LS‐SVM RBF tidak secara langsung mengurangi waktu komputasi yang diperlukan untuk proses klasifikasi sinyal EEG set A dan set E, karena parameter classifier yang digunakan adalah untuk sebelas fitur. Hasil uji coba menunjuk‐kan bahwa model kombinasi dengan tingkat akurasi klasifikasi terbaik adalah tetap.
Penelitian tentang pengaruh parameter γ dan σ2 terhadap tingkat akurasi dan wak‐tu komputasi LS‐SVM RBF dapat diperluas dengan menambah rentang nilai γ dan σ2 yang digunakan. Optimasi parameter classi‐fier (LS‐SVM RBF) dengan jumlah fitur yang berbeda‐beda dapat digunakan untuk meng‐uji pengaruh pengurangan fitur terhadap tingkat akurasi dan waktu komputasi.
DAFTAR PUSTAKA
[1] Ghosh‐Dastidar, S. (2007). Models of
EEG data mining and classification in temporal lobe epilepsy: wavelet‐chaos‐neural network methodology and spiking neural networks. Dissertation, The Ohio State University.
[2] Ningrum, R.M., Purwananto, Y. & Soe‐laiman, R. (2010). Ekstraksi fitur EEG de‐ngan menggunakan faktorisasi kernel matriks nonnegatif, Tugas Akhir, Teknik Informa‐tika, Fakultas Teknologi Informasi, ITS.
[3] Begg, R., Lai, D.T.H. & Palaniswami, M. (2008). Computational intelligence in biomedical engineering. First Edition. CRC Press.
[4] Übeylï, E. D. (2010a). Least squares support vector machines employing model‐based me‐thods coefficients for analysis of
EEG signals, Expert Systems with Applications 37, (2010), 233–239.
[5] Andrzejak, R. G., Lehnertz, K., Mormann, F., Rieke, C., David, P., & Elger, C. E. (2001). Indications of nonli‐near deterministic and finite‐dimensional structures in time series of brain electrical activity: Dependence on recording region and brain state. Physical Review E, 64, 061907.
[6] Yu, L. & Liu, H. (2003). Feature selection for high‐dimensional data: a fast correlati‐on‐based filter solution. Proceedings of the Twentieth International Conference on Machine Learning (ICML‐2003), Washington DC.
[7] Chen, Y. W., & Lin, C. J. (2005). Combi‐ning SVMs with various feature selection strategies. Available from http://www. csie.ntu.edu.tw/~cjlin/papers/features.pdf.
[8] Akay, M.F. (2009). Support vector machi‐nes combined with feature selection for breast cancer diagnosis. Expert Systems with Applications 36, 3240–3247.
[9] Polat, K., & Günes, S (2009). A new feature selection method on classification of medical datasets: Kernel F‐score feature selection. Expert Systems with Applica‐tions, 36, 10367–10373.
[10] Talwar, D. (2004). Primer of EEG with a Mini‐Atlas 31, 378.
[11] Teplan, M. (2002), Fundamentals of EEG measurements, Measmt. Sci. Rev., Vol. 2.
[12] De Hoon, M.J.L., Van Der Hagen, T.H.J.J., Schoonewelle, H., and Van Dam, H. Why Yule‐Walker should not be used for autoregressive modelling, Interfa‐culty Reactor Institute, Delft University of Technology, Delft, Netherlands, Unpublished.
[13] Kamel, N. & Baharudin, Z. (2007). Short term load forecast using Burg autoregre‐ssive technique, International Conference on Intelligent and Advanced Systems 2007, 912‐916.
[14] Vapnik, V. (1995). The nature of statistical learning theory. New York:
Jurnal TIF, Vol. 2 No. 1, Juli 2011
13
Springer‐Verlag.
[15] Cortes, C., & Vapnik, V (1995). Support vector networks. Machine Learning, 20(3), 273–297.
[16] Suykens, J. A. K., & Vandewalle, J (1999). Least squares support vector machine classifiers. Neural Processing Letters, 9 (3), 293–300.
[17] Tsujinishi, D., & Abe, S. (2003). Fuzzy least squares support vector machines for multiclass problems. Neural Networks, 16, 785–792.
[18] Übeylï, E. D., Cvetkovic, D., Holland, G., Cosic, I. (2010b). Analysis of sleep EEG activity during hypopnoea episodes by least squares support vector machine em‐ploying AR coefficients, Expert Systems with Applications 37, 4463–4467.
[19] Pelckmans K., Suykens J.A.K., Van Gestel T., De Brabanter J., Lukas L., Hamers B., De Moor B. & Vandewalle J. (2002). LS‐SVMlab: a Matlab/C toolbox for Least Squares Support Vector Machines. Internal Report 02‐44, ESAT‐SISTA, K.U.Leuven (Leuven, Belgium), (pre‐sented at NIPS2002 Vancouver in the demo track).
[20] Pelckmans, K., Suykens, J.A.K., Van Gestel, T., De Brabanter, J., Lukas, L., Hamers B., De Moor, B. & Vandewalle, J. (2003). LS‐SVMlab Toolbox User’s Guide version 1.5. Katholieke Univer‐siteit Leuven Department of Electrical Engineering, ESAT‐SCD‐SISTA Kas‐teelpark Arenberg 10, B‐3001 Leuven‐Heverlee, http://www.esat.kuleuven.ac. be/sista/lssvmlab/, ESAT‐SCD‐SISTA Technical Report 02‐145.