pengenalan suara pada manusia

39
MAKALAH TEORI DASAR SUARA SINYAL PERCAKAPAN Diajukan Untuk Memenuhi Tugas Mata Kuliah Pengendalian Bising Disusun Oleh : Fadel Khalifah Ibrahim (D12112107) Rusdianto Hamid (D12112271) PROGRAM STUDI TEKNIK LINGKUNGAN JURUSAN SIPIL FAKULTAS TEKNIK UNIVERSITAS HASANUDDIN GOWA 2013

Upload: khaira-khya-arisandy

Post on 26-Dec-2015

86 views

Category:

Documents


0 download

DESCRIPTION

Suara

TRANSCRIPT

Page 1: Pengenalan Suara Pada Manusia

MAKALAH TEORI DASAR SUARA

SINYAL PERCAKAPAN

Diajukan Untuk Memenuhi Tugas Mata Kuliah

Pengendalian Bising

Disusun Oleh :

Fadel Khalifah Ibrahim (D12112107)

Rusdianto Hamid (D12112271)

PROGRAM STUDI TEKNIK LINGKUNGAN

JURUSAN SIPIL

FAKULTAS TEKNIK

UNIVERSITAS HASANUDDIN

GOWA

2013

Page 2: Pengenalan Suara Pada Manusia

KATA PENGANTAR

Puji syukur kami panjatkan kehadirat Tuhan Yang Maha Esa karena dengan rahmat,

karunia, serta taufik dan hidayah-Nya lah kami dapat menyelesaikan penyusunan makalah ini

untuk memenuhi tugas mata kuliah “Pengendalian Bising” dengan judul “Sinyal

Percakapan”

Makalah ini dibuat dalam rangka memenuhi tugas dan persyaratan kurikulum pada

Program Studi Teknik Lingkungan, Fakultas Teknik, Universitas Hasanuddin, Gowa,

Sulawesi Selatan.

Dalam penyusunan makalah ini, penulis mengucapkan banyak terimakasih kepada Ibu

Dr. Ir. Hj. Sumarni Hamid Aly, M.T. selaku Dosen mata kuliah Pengendalian Bising yang

telah memberikan tugas ini kepada kami.

Penulis sangat berharap makalah ini dapat berguna dalam rangka menambah wawasan

serta pengetahuan mengenai pengertian, jenis-jenis sinyal, proses keluarnya suara, aplikasi

dan proses penangkapan sinyal oleh manusia.

Penulis juga menyadari sepenuhnya bahwa di dalam penyusunan makalah ini masih

terdapat kekurangan-kekurangan. Oleh karena itu, penulis mengharapkan adanya kritik, saran

dan usulan demi perbaikan di masa yang akan datang, mengingat tidak ada sesuatu yang

sempurna tanpa adanya saran yang membangun.

Akhir kata, semoga makalah sederhana ini dapat bermanfaat bagi semua pihak

Gowa, 14 Februari 2014

Penyusun

i

Page 3: Pengenalan Suara Pada Manusia

DAFTAR ISI

Halaman Judul............................................................................................................Kata Pengantar........................................................................................................... iDaftar Isi .................................................................................................................... iiBAB I PENDAHULUAN.......................................................................................... 1

I. 1 Latar Belakang ..................................................................................... 1I. 2 Rumusan Masalah ............................................................................... 2I. 3 Batasan Masalah ................................................................................... 2I. 4 Tujuan Penelitian.................................................................................. 2I. 5 Manfaat dan Urgensi ............................................................................ 2

BAB II TINJAUAN PUSTAKA................................................................................ 4BAB III METODOLOGI PENELITIAN................................................................... 10

BAB IV HASIL DAN PEMBAHASAN................................................................... 16

BAB V Penutup................................................................................................... 30V.1 Kesimpulan............................................................................................. 30V.2 Saran....................................................................................................... 30

DAFTAR PUSTAKA................................................................................................ 32LAMPIRAN

ii

Page 4: Pengenalan Suara Pada Manusia

BAB I

PENDAHULUAN

1.1. Latar belakang

Sinyal percakapan merupakan kombinasi kompleks dari variasi tekanan udara yang

melewati pita suara dan vocal tract, yaitu mulut, lidah, gigi, bibir, dan langit-langit mulut.

Speech (wicara) dihasilkan dari sebuah kerjasama antara lungs (paru-paru), glottis

(dengan vocal cords) dan articulation tract (mouth atau mulut dan nose cavity/rongga

hidung).

Sinyal percakapan adalah sinyal yang dihasilkan dari suara manusia sewaktu

melakukan percakapan. Sinyal percakapan merupakan kombinasi kompleks dari variasi

tekanan udara yang melewati pita suara dan vocal tract, yaitu mulut, lidah, gigi, bibir, dan

langit-langit mulut.

Sinyal percakapan pada manusia dapat melalui komunikasi langsung, seperti alat-alat

komunikasi diantaranya telephone, handphone, radio dan televisi. Sinyal yang di pancarkan

oleh alat-alat komunikasi portable pada dewasa ini bisa berupa sinya digital maupun sinyal

analog.

Sinyal percakapan yang di terima oleh manusia, baik melalui komunikasi langsung

maupun melalui alat-alat komunikasi, pada intinya akan di pancarkan dalam bentuk

gelombang suara yang akan di tangkap oleh indra pendengaran manusia untuk selanjutnya di

proses oleh otak sehingga menimbulkan sebuah respon berupa tindakan.

1.2. Rumusan masalah

1. Apa yang dimaksud dengan suara dan penyebab timbulnya suara?

2. Apa yang dimaksud dengan sinyal percakapan?

3. Bagaimana proses produksi suara pada manusia?

4. Apa yang dimaksud dengan sinyal analog dan digital?

5. Bagaimana proses pengenalan suara pada manusia?

6. Apa yang dimaksud dengan sinyal percakapan silence, unvoiced, dan voiced ?

7. Bagaimana proses penerimaan sinyal percakapan pada manusia?

1

Page 5: Pengenalan Suara Pada Manusia

1.3. Tujuan

1. Mengetahui dan memahami definisi suara dan penyebab timbulnya suara

2. Mengetahui dan memahami definisi dari sinyal percakapan

3. Dapat memahami proses produksi dan penerimaan suara pada manusia

4. Dapat memahami dan membedakan sinyal analog dan sinyal digital

5. Dapat menjelaskan tentang jenis-jenis sinyal percakapan pada manusia

2

Page 6: Pengenalan Suara Pada Manusia

BAB II

PEMBAHASAN

II.1 Pengenalan Suara pada Manusia

Sinyal percakapan adalah sinyal yang dihasilkan dari suara manusia sewaktu

melakukan percakapan. Sinyal percakapan merupakan kombinasi kompleks dari variasi

tekanan udara yang melewati pita suara dan vocal tract, yaitu mulut, lidah, gigi, bibir, dan

langit-langit mulut. Speech (wicara) dihasilkan dari sebuah kerjasama antara lungs

(paru-paru), glottis (dengan vocal cords) dan articulation tract (mouth atau mulut dan

nose cavity/rongga hidung). Sinyal suara terdiri dari serangkaian suara yang masing–

masing menyimpan sepotong informasi. Berdasarkan cara menghasilkannya, suara dapat

dibagi menjadi voiced dan unvoiced. Voiced sounds atau suara ucapan dihasilkan dari

getaran pita suara, sedangkan unvoiced sounds dihasilkan dari gesekan antara udara

dengan vocal tract (berawal di awal bukaan pita suara atau glottis dan berakhir di bibir) .

Sinyal percakapan memiliki beberapa karakteristik, seperti pitch dan intensitas

suara yang berguna dalam melakukan analisis sinyal suara. Pitch adalah frekuensi dari

sinyal atau yang sering disebut intonasi. Intensitas suara adalah tingkat kekuatan suara.

Impuls tekanan pada umumnya disebut sebagai pitch impulses dan frekuensi sinyal

tekanan adalah pitch frequency atau fundamental frequency. Sederet impuls (fungsi tekanan

suara) dihasilkan oleh pita suara untuk sebuah suara. Hal ini merupakan bagian dari

3

Page 7: Pengenalan Suara Pada Manusia

sinyal voice (suara) yang mendefinisikan speech melody (melodi wicara). Ketika

berbicara dengan pitch yang stabil, suara sinyal wicara monotonous tetapi dalam kasus

normal sebuah perubahan permanen pada frekuensi terjadi. Impuls pitch merangsang

udara dalam mulut dan untuk suara tertentu (nasals) juga merangsang nasal cavity

(rongga hidung). Ketika rongga beresonasi, timbul radiasi sebuah gelombang suara

yang merupakan sinyal/percakapan. Kedua rongga beraksi sebagai resonators dengan

karakteristik frekuensi resonansi masing–masing yang disebut formant frequencies,

sehingga formant merupakan variasi resonasi yang dihasilkan oleh vocal tract. Pada

saat rongga mulut mengalami perubahan besar, dihasilkan beragam pola ucapan suara yang

berbeda. Di dalam kasus unvoiced sounds, keluaran pada vocal tract lebih menyerupai

noise atau derau.

Sinyal adalah besaran fisis yang berubah menurut waktu, ruang atau variabelvariabel

bebas lainnya. Contoh sinyal : sinyal ucapan.

Biasanya sinyal ini berbentuk tanda-tanda, lampu-lampu, suara-suara, dan lain-

lain. Dalam istilah teknik, sinyal itu ialah besaran yang berubah dalam waktu dan atau dalam

ruang, dan membawa suatu informasi.

Secara sistematis, sinyal adalah fungsi dari satu atau lebih variabel independen.

Proses ini dilakukan melalui pemodelan sinyal. Pada umumnya variabel independen untuk

sinyal satu dimensi adalah waktu. Jika variabel independennya kontinu, maka sinyal tersebut

disebut sebagai sinyal waktu kontinu (continuous-time signal). Jika variabel

independennya diskrit, maka sinyal tersebut disebut sebagai sinyal waktu diskrit

(discrete-time signal). Sinyal waktu kontinu didefinisikan setiap waktu t dalam sebuah

interval yang biasanya tidak terbatas, sedangkan sinyal waktu diskrit didefinisikan pada

waktu diskrit, dan biasanya berupa urutan angka.

4

Page 8: Pengenalan Suara Pada Manusia

Sinyal waktu kontinu dengan amplitudo kontinu biasanya disebut sebagai sinyal

analog. Contoh sinyal analog adalah sinyal suara. Sinyal waktu diskrit dengan

amplitudo bernilai diskrit yang direpresentasikan oleh digit angka yang terbatas (finite),

biasanya disebut sebagai sinyal digital.

II.1.1 Sinyal analog

Sinyal analog atau sinyal waktu kontinyu adalah sinyal yang memiliki nilai real pada

setiap waktu. Sinyal kontinyu merupakan suatu sinyal yang berbentuk gelombang

sinusoidal dan merupakan variabel yang berdiri sendiri. Pada sinyal kontinyu, variabel

indipendent (yang berdiri sendiri) terjadi terus-menerus dan kemudian sinyal dinyatakan

sebagai sebuah kesatuan nilai dari variabel independent. Dengan menggunakan sinyal

analog, maka jangkauan transmisi data dapat mencapai jarak yang jauh, tetapi sinyal ini

mudah terpengaruh oleh noise.Gelombang pada sinyal analog yang umumnya berbentuk

gelombang sinus memiliki tiga variable dasar, yaitu amplitudo, frekuensi dan phase.

- Amplitudo merupakan ukuran tinggi rendahnya tegangan dari sinyal analog.

- Frekuensi adalah jumlah gelombang sinyal analog dalam satuan detik.

- Phase adalah besar sudut dari sinyal analog pada saat tertentu.

Salah satu contoh sinyal suara yang paling mudah adalah suara.

II.1.2 Sinyal digital

Sinyal digital merupakan hasil teknologi yang dapat mengubah sinyal menjadi

kombinasi urutan bilangan 0 dan 1 (juga dengan biner), sehingga tidak mudah terpengaruh

oleh derau, proses informasinya pun mudah, cepat dan akurat, tetapi transmisi dengan

sinyal digital hanya mencapai jarak jangkau pengiriman data yang relatif dekat.

Biasanya sinyal ini juga dikenal dengan sinyal diskrit. Sinyal yang mempunyai dua

keadaan ini biasa disebut dengan bit. Bit merupakan istilah khas pada sinyal digital.

Sebuah bit dapat berupa nol (0) atau satu (1).

5

Page 9: Pengenalan Suara Pada Manusia

Sinyal digital merupakan hasil teknologi yang dapat mengubah sinyal menjadi

kombinasi urutan bilangan 0 dan 1 (juga dengan biner), sehingga tidak mudah terpengaruh

oleh derau, proses informasinya pun mudah, cepat dan akurat, tetapi transmisi dengan

sinyal digital hanya mencapai jarak jangkau pengiriman data yang relatif dekat.

Biasanya sinyal ini juga dikenal dengan sinyal diskrit. Sinyal yang mempunyai dua

keadaan ini biasa disebut dengan bit. Bit merupakan istilah khas pada sinyal digital.

Sebuah bit dapat berupa nol (0) atau satu (1). Kemungkinan nilai untuk sebuah bit

adalah 2 buah (21). Kemungkinan nilai untuk 2 bit adalah sebanyak 4 (22), berupa 00,

01, 10, dan 11. Secara umum, jumlah kemungkinan nilai yang terbentuk oleh kombinasi n

bit adalah sebesar 2n buah.

System digital merupakan bentuk sampling dari sitem analog digital pada

dasarnya di code-kan dalam bentuk biner (atau Hexa) besarnya nilai suatu system digital

dibatasi oleh lebarnya/jumlah bit (bandwidth). Jumlah bit juga sangat mempengaruhi

nilai akurasi sistem digital.Signal digital ini memiliki berbagai keistimewaan yang unik yang

tidak dapat ditemukan pada teknologi analog yaitu :

Mampu mengirimkan informasi dengan kecepatan cahaya yang dapat membuat

informasi dapat dikirim dengan kecepatan tinggi.

Penggunaan yang berulang-ulang terhadap informasi tidak mempengaruhi kualitas

dan kuantitas informsi itu sendiri.

Informasi dapat dengan mudah diproses dan dimodifikasi ke dalam berbagai bentuk.

Dapat memproses informasi dalam jumlah yang sangat besar dan mengirimnya

secara interaktif.

Pengolahan sinyal digital memerlukan komponen-komponen digital, register, counter,

decoder, mikroprosessor, mikrokontroler dan sebagainya.

6

Page 10: Pengenalan Suara Pada Manusia

Saat ini pengolahan sinyal banyak dilakukan secara digital, karena kelebihannya

antara lain :

1. Untuk menyimpan hasil pengolahan, sinyal digital lebih mudah dibandingkan

sinyal analog. Untuk menyimpan sinyal digital dapat menggunakan media digital

seperti CD, DVD, Flash Disk, Hardisk. Sedangkan media penyimpanan sinyal

analog adalah pita tape magnetik.

2. Lebih kebal terhadap noise karena bekerja pada level ‘0’ dan ‘1’.

3. Lebih kebal terhadap perubahan temperatur.

4. Lebih mudah pemrosesannya.

II.2 Elemen Dasar Sistem Pemrosesan Sinyal Digital

Sebagian besar sinyal-sinyal yang ditemukan dalam sains dan teknologi adalah

analog yaitu sinyal-sinyal yang merupakan fungsi dari suatu variabel kontinyu, seperti

waktu dan ruang, dan biasanya mengambil nilai -nilai dalam interval yang kontinyu.

Sinyal -sinyal seperti itu dapat diproses secara langsung dengan sistem analog yang

tepat atau penggandaan frekuensi yang bermaksud mengubah karakteristiknya atau

mengambil beberapa informasi yang diinginkan. Itu artinya sinyal telah diproses secara

langsung dalam ben tuk analognya, dengan sinyal masukan maupun keluarannya adalah

sinyal analog. Proses ini diilustrasikan pada gambar berikut :

Pemrosesan sinyal digital menyediakan suatu metode alternatif untuk pemrosesan sinyal

analog, seperti diilustrasikan pada gambar berikut:

Untuk melakukan pemrosesan sinyal digital, diperlukan suatu interface yang

dinamakan Analog to Digital Converter (ADC). Keluaran pengkoversian ADC adalah

sinyal digital yang cocok dengan masukan terhadap prosesor digital.

7

Page 11: Pengenalan Suara Pada Manusia

Untuk pemakaian dengan keluaran digital dari prosesor sinyal digital akan

disampaikan kepada pemakai dalam bentuk analog. Untuk itu, diperlukan sebuah interface

lain untuk mengubah sinyal digital menjadi sinyal analog, yang dinamakan dengan

Digital to Analog Converter (DAC). Namun pada beberapa aplikasi, pengkonversian

DAC tidak diperlukan, dikarenakan aplikasi tersebut hanya melakukan analisis sinyal

dengan informasi yang ingin disampaikan dalam bentuk digital. Program sistem aplikasi

yang akan dibangun merupakan salah satunya.

II.3 Proses produksi suara

Proses produksi suara pada manusia dapat dibagi menjadi tiga buah proses fisiologis,

yaitu : pembentukan aliran udara dari paru-paru, perubahan aliran udara dari paru-paru

menjadi suara, baik voiced, maupun unvoiced yang dikenal dengan istilah phonation, dan

artikulasi yaitu proses modulasi/ pengaturan suara menjadi bunyi yang spesifik.

Organ tubuh yang terlibat pada proses produksi suara adalah : paru-paru, tenggorokan

(trachea), laring (larynx), faring (pharynx), pita suara (vocal cord), rongga mulut (oral

cavity), rongga hidung (nasal cavity), lidah (tongue), dan bibir (lips), seperti dapat dilihat

pada gambar diatas!

Organ tubuh ini dapat dikelompokkan menjadi tiga bagian utama, yaitu : vocal

tract (berawal di awal bukaan pita suara atau glottis, dan berakhir di bibir),nasal tract (dari

velum sampai nostril), dan source generator (terdiri dari paru-paru, tenggorokan, dan larynx).

Ukuran vocal tract bervariasi untuk setiap individu, namun untuk laki-laki dewasa rata-rata

panjangnya sekitar 17 cm. Luas dari vocal tract juga bervariasi antara 0 (ketika seluruhnya

tertutup) hingga sekitar 20 cm2. Ketika velum, organ yang memiliki fungsi sebagai pintu

penghubung antara vocal tract dengan nasal tract, terbuka, maka secara akustik nasal

tract akan bergandengan dengan vocal tract untuk menghasilkan suara nasal.

8

Page 12: Pengenalan Suara Pada Manusia

Aliran udara yang dihasilkan dorongan otot paru-paru bersifat konstan. Ketika pita

suara dalam keadaan berkontraksi, aliran udara yang lewat membuatnya bergetar. Aliran

udara tersebut dipotong-potong oleh gerakan pita suara menjadi sinyal pulsa yang

bersifat quasi-periodik. Sinyal pulsa tersebut kemudian mengalami modulasi frekuensi ketika

melewati pharynx, rongga mulut ataupun pada rongga hidung. Sinyal suara yang dihasilkan

pada proses ini dinamakan sinyal voiced. Namun, apabila pita suara dalam keadaan relaksasi,

maka aliran udara akan berusaha melewati celah sempit pada permulaan vocal tract sehingga

alirannya menjadi turbulen, proses ini akan menghasilkan sinyal unvoiced. Ketika sumber

suara melalui vocal tract, kandungan frekuensinya mengalami modulasi sehingga terjadi

resonansi padavocal tract yang disebut formants. Apabila sinyal suara yang dihasilkan adalah

sinyal voiced, terutama vokal, maka pada selang waktu yang singkat bentukvocal

tract relative konstan (berubah secara lambat) sehingga bentuk vocal tract dapat diperkirakan

dari bentuk spektral sinyal voiced.

Aliran udara yang melewati pita suara dapat dibedakan menjadi phonation, 

bisikan, frication, kompresi, vibrasi ataupun kombinasi

diantaranya. Phonatedexcitation terjadi bila aliran udara dimodulasi oleh pita

suara. Whispered excitation dihasilkan oleh aliran udara yang bergerak cepat masuk ke dalam

lorong bukaan segitiga kecil antara arytenoids cartilage di belakang pita suara yang hampir

tertutup. Frication excitation dihasilkan oleh desakan di vocal

tract. Compression excitation dihasilkan akibat pelepasan udara melalui vocal tract yang

tertutup dengan tekanan tinggi. Vibration excitation disebabkan oleh udara yang dipaksa

memasuki rusang selain pita suara, khususnya lidah. Suara yang dihasilkan

oleh Phonated excitation disebut voiced. Suara yang dihasilkan

oleh Phonated excitation ditambah frication disebut mixed voiced,sedangkan yang dihasilkan

oleh selain itu disebut unvoiced. Karakteristik suara tiap individu bersifat unik karena

terdapat perbedaan dalam hal panjang maupun bentuk vocal tract.

II.3.1 Pengenalan Suara pada Manusia

Pada sistem pengenalan suara oleh manusia terdapat tiga organ penting yang saling

berhubungan yaitu : telinga yang berperan sebagai transduser dengan menerima sinyal

masukan suara dan mengubahnya menjadi sinyal syaraf, jaringan syaraf yang berfungsi

9

Page 13: Pengenalan Suara Pada Manusia

mentransmisikan sinyal ke otak, dan otak yang akan mengklasifikasi dan mengidentifikasi

informasi yang terkandung dalam sinyal masukan.

10

Page 14: Pengenalan Suara Pada Manusia

II.3.2 Karakteristik Telinga

Telinga terbagi menjadi tiga bagian, yaitu bagian luar, tengah, dan dalam.

Pinna, sebagai bagian luar telinga, berfungsi sebagai corong, untuk mengumpulkan

sinyal suara menuju auditory canal sehingga dapat memberikan kesan arah sinyal suara yang

diterima.

Auditory canal adalah struktur berbentuk pipa lurus sepanjang 2,7 cm, dengan diameter

sekitar 0,7 cm, yang pada bagian ujungnya terdapat selaput membrane, yaitu gendang telinga.

Membran ini merupakan pintu masuk telinga bagian tengah, yaitu ruangan berisi udara

dengan volume sebesar 2 cm3, yang terdiri dari tiga buah tulang,

yaitu malleus (martil), incus(landasan), dan stapes (sanggurdi). Bagian ini terhubung dengan

tenggorokan melalui Eustachian tube. Getaran pada gendang telinga ditransmisikan

kemalleus melalui incus, dan stapes, yaitu membentuk oval window.

Telinga bagian dalam (labyrinth) memiliki tiga bagian, yaitu vestibule (ruang pintu

masuk), semicular canal, dan cochlea. Vestibule terhubung dengan telinga bagian tengah

melalui dua jalur, yaitu oval window, dan round window. Keduanya tertutup untuk mencegah

keluarnya cairan yang mengisi telinga telinga bagian dalam. Pada cochlea, yang berstruktur

seperti rumah siput, terdapat syaraf pendengaran. Syaraf ini memanjang sampai ke basilar

membrane. Pada bagian atas basilar membrane terdapat organ of corty yang memiliki empat

baris sel rambut (sekitar 3 x 104 sel seluruhnya).

II.4 Proses pendengaran

Proses pendengaran pada telinga manusia dijelaskan sebagai berikut :

Sinyal suara memasuki saluran telinga dan variasi tekanan yang dihasilkannya

menekan gendang telinga. Karena sisi bagian dalam dari gendang telinga mempunyai tekanan

yang nilainya dijaga konstan maka gendang telinga akan bergetar.

Getaran dari gendang telinga disalurkan pada tiga rangkaian tulang

yaitu; martil, incus dan stapes. Mekanisme ini dirancang untuk mengkopel variasi suara dari

udara luar ke telinga bagian dalam. Karena luas permukaan penampang yang

ditekan stapes lebih kecil dari luas penampang gendang telinga maka tekanan suara yang

sampai ke telinga bagaian dalam bertambah besar.

11

Page 15: Pengenalan Suara Pada Manusia

Cairan pada cochlea bergetar dengan frekuensi yang sama dengan gelombang yang

datang. Basilar membrane kemudian memisahkan sinyal berdasarkan frekuensinya. Basilar

membrane berstruktur kuat dan panjang di daerah sekitar oval window namun bersifat lentur

pada bagian ujungnya. Frekuensi resonansi yang dihasilkan membrane tersebut berbeda

sepanjang dimensi basilar membrane. Dimana resonansi frekuensi tinggi terjadi pada bagian

bagian basilar membraneyang berada dekat dengan oval window, sedangkan resonansi

frekuensi rendah terjadi pada daerah ujung lainnya. Syaraf yang berada pada mambran

kemudian mendeteksi posisi terjadinya resonansi yang juga akan menentukan frekuensi suara

yang datang. Ukuran dari basilar membrane rata-rata sekitar 35 mm. Dari ukuran panjang

tersebut dapat dihasilkan 10 resolusi frekuensi, sehingga pada setiap 3.5 mm panjang

membran terdapat 1 oktaf frekuensi resonansi.

II.5 Sinyal Suara Ucapan

Sinyal suara ucapan manusia dapat dipandang sebagai sinyal yang berubah lambat

terhadap waktu (slowly time varying signal), jika diamati pada selang waktu yang singkat

yaitu 5-100 ms. Pada selang waktu tersebut, katakteristik sinyal suara ucapan dapat dianggap

stasioner. Untuk selang waktu yang lebih panjang (dengan orde 0.2 detik atau lebih),

karakteristik sinyal berubah untuk merefleksikan suara berbeda yang diucapkan.

II.5.1 Klasifikasi berdasarkan sinyal eksitasi

Berdasarkan sinyal eksitasi yang dihasilkan pada proses produksi suara, sinyal suara

ucapan dapat dibagi menjadi tiga bagian yaitu silence, unvoiced, dan voiced:

12

Page 16: Pengenalan Suara Pada Manusia

Sinyal silence : sinyal pada saat tidak terjadi proses produksi suara ucapan, dan

sinyal yang diterima oleh pendengar dianggap sebagai bising latar belakang.

Sinyal unvoiced : terjadi pada saat pita suara tidak bergetar, dimana sinyal eksitasi

berupa sinyal random.

Sinyal voiced : terjadi jika pita suara bergetar, yaitu pada saat sinyal eksitasi

berupa sinyal pulsa kuasi-periodik. Selama terjadinya sinyal voiced ini, pita suara

bergetar pada frekuensi fundamental – inilah yang dikenal sebagaipitch dari suara

tersebut.

II.6 Analisis Sinyal Ucapan

Informasi yang terdapat di dalam sebuah sinyal ucapan dapat dianalisis dengan

berbagi cara. Beberapa peneliti telah membagi beberapa level pendekatan untuk

menggambarkan informasi tersebut, yaitu level akustik, fonetik, fonologi, morfologi, sintatik,

dan semantik.

II.6.1 Level Akustik

Sinyal ucapan merupakan variasi tekanan udara yang dihasilkan oleh sistem

artikulasi. Untuk menganalisa aspek-aspek akustik dari sebuah sinyal ucapan, dapat

dilakukan dengan transformasi dari bentuk sinyal ucapan menjadi  sinyal listrik dengan

menggunakan tranduser seperti microphone, telepon, dan sebagainya. Setelah melalui

berbagai pengolahan sinyal digital, maka akan di peroleh informasi yang menunjukkan sifat-

sifat akustik dari sinyal ucapan tersebut yang meliputi frekuensi fundamental (F0), intensitas,

dan distribusi energi spektral.

II.6.2 Level Fonetik

Level ini menggambarkan bagaimana suatu sinyal suara diproduksi oleh organ-organ

di dalam tubuh manusia.

II.6.3 Level Fonologi

Di dalam level ini, dikenal istilah fonem yang merupakan unit terkecil yang

membentuk sebuah kalimat atau ucapan.  Deskripsi ini memuat informasi durasi, intensitas,

dan pitch dari fonem-fonem yang membangun  kalimat tersebut.

13

Page 17: Pengenalan Suara Pada Manusia

II.6.4 Level Morfologi

Susunan beberapa fonem akan menghasilkan kata. Morfologi menggambarkan

berbagai bentukan kata yang terdiri atas awalan (prefiks), sisipan (infiks), dan akhiran

(sufiks).

II.6.5 Level Sintatik

Aspek sintatik berfungsi untuk mengatur susunan kata agar membentuk kalimat yang

benar.

II.6.6 Level Semantik

Sebuah kalimat bisa jadi tidak mengandung makna sama sekali sehingga seringkali

harus dibuat aturan dasar dalam menyusun kalimat yang bisa menghasilkan makna tertentu.

Tujuan dari aspek semantik ini adalah untuk meneliti  makna kata tertentu di dalam kalimat

dan kaitannya satu sama lain.

Pada penelitian ini untuk level morfologi, sintatik, dan semantik diabaikan karena

penelitian ini hanya menekankan  pada analisis karakter suara yang berkaitan dengan

parameter-parameter fisis seperti frekuensi fundamental(F0), durasi fonem dan intensitas

suara.

Intonasi Sebagai Aspek Akustik Sinyal Ucapan

Intonasi (prosodi) sebagai aspek akustik sinyal suara sangat membantu di

dalam mengidentifikasi setiap segmen akustik dengan fonem. Setiap fonem dihasilkan

terutama oleh sistem vokal selama artikulasi yang selanjutnya mempengaruhi

dinamika spektrum spektral suara (dalam hal ini formant). Pengucapan suatu kata

dapat secara substansial bervariasi di dalam intonasinya mempengaruhi idetitas kata.

14

Page 18: Pengenalan Suara Pada Manusia

Fonem dapat menjadi panjang atau pendek, keras atau lemah, dan memiliki

pola pitch (nada) yang bervariasi.

Fenomena intonasi dapat direpresentasikan ke dalam beberapa level antara

lain adalah sebagai berikut :

1. Level Akustik

Terdiri atas beberapa komponen penting yaitu Frekuensi Fundamental (F0),

amplitudo, dan durasi sinyal.

2. Level  Perseptual

Merepresentasikan fenomena intonasi sebagaimana yang didengar oleh

pendengarnya. Beberapa komponennya antara lain pitch (nada),  keras atau lemahnya

suara, dan  panjang atau pendeknya suara.

3. Level Bahasa (Linguistik)

Merepresentasikan fenomena prosodi ke dalam bentuk simbol atau tanda.

Beberapa komponennya antara lain bunyi (tone), intonasi, dan aspek tekanan.

Menonjolkan suku kata yang mendapat tekanan terhadap suku kata yang lain

yang tidak mendapat tekanan adalah fungsi utama sebuah intonasi (prosodi). Suku

kata yang mendapat tekanan menjadi lebih panjang, lebih intens, dan memiliki  pola

F0 yang menyebabkan mereka lebih menonjol dibanding suku kata lainnya.

Parameter-parameter yang diperlukan dalam Pengidentifikasian Suara 

Manusia Pitch Pitch digunakan sebagai standar tinggi-rendah dari sebuah tone atau

suara. Sinyal suara umumnya merupakan proses secara fisis yang terdiri dari dua

bagian: yaitu sebagai hasil dari sumber suara (pita suara) dan sebagai hasil dari

penyaringan (oleh lidah, bibir, dan gigi). menganalisa pitch berarti mencoba untuk

menangkap frekuensi dasar sumber bunyi dari keseluruhan proses pengucapan suara.

Frekuensi dasar sendiri merupakan frekuensi yang dominan yang dikeluarkan oleh

sumber bunyi. Frekuensi dasar merupakan parameter paling kuat untuk mengetahui

korelasi bagaimana suatu suara diterima oleh pendengar ditinjau dari segi intonasi dan

tekanan suaranya.

1. Formant

15

Page 19: Pengenalan Suara Pada Manusia

Frekuensi fundamental dikenal juga dengan F0 yang koheren dalam bentuk

transisi formant F1, F2, dan sebagainya. Komponen frekuensi dominan yang

mengkarakterisasi fonem-fonem yang berhubungan dengan komponen frekuensi

resonansi dari sistem vokal didefinisikan sebagai formant. Suara yang terucapkan,

secara khusus adalah vokal, biasanya memiliki 3 buah formant dan seringkali disebut

sebagai formant kesatu, kedua, dan ketiga, dimulai dengan  komponen frekuensi

terendah. Ketiganya selalu dituliskan sebagai F1, F2, dan F3.  formant 4 dan formant

5 dbutuhkan untuk mendapatkan nilai parameter formant yang lebih detail karena bila

sinyal suara yang kita olah hanya memiliki formant yang kurang dari 3 buah, maka

dapat dipastikan analisa terhadap data tersebut akan gagal.

2. Durasi Fonem

Salah satu komponen terpenting di dalam intonasi adalah durasi sinyal. Setiap

fonem yang memberikan kontribusi dalam menentukan pola intonasi suatu kalimat.

Durasi fonem ini sangat dipengaruhi oleh tekanan dan kecepatan bicara. Durasi

sebuah fonem vokal sangat dipengaruhi oleh tekanan, sementara durasi sebuah

konsonan umumnya memiliki variasi tekanan yang lebih kecil.

Menurut Douglas O’Shugnessy(1.200) suatu ucapan dalam percakapan

melibatkan 150-250 kata permenit, termasuk jeda yang masing-masing rata-rata

sepanjang 6-50 ms. Durasi fonem bervariasi karena faktor seperti gaya bicara

(membaca atau bercakap-cakap). Durasi suku kata umumnya sekitar 200ms dengan

vokal yang mendapat tekanan sekitar 130 ms dan fonem lain sekitar 70ms. Durasi

fonem bermacam-macam untuk fonem yang berbeda karakteristiknya.

3. Durasi dan Kekerasan Suara

Bagaimana kekerasan suara dari sebuah suara yang bersifat impulsif

menyamai kekerasan suara dari suara yang diberikan secara kontinyu pada tingkatan

yang sama?. Beberapa eksperimen telah menetapkan bahwa telinga merata-ratakan

energi suara sekitar lebih dari 200ms, maka kekerasan suara  yang bersifat impulsif

akan bertambah dengan durasi hingga mencapai nilai tersebut. Dengan kata lain,

tingkat kekerasan suara akan bertambah 10 dB ketika durasi bertambah dengan faktor

10. Dari sini dapat diketahui bahwa berapa lamanya durasi yang dilakukan membantu

dalam adaptasi pendengaran terhadap kekerasan suara, terutama untuk suara yang

sifatnya impulsif atau muncul tidak kontinyu.

16

Page 20: Pengenalan Suara Pada Manusia

4. Durasi dan Pitch

Lamanya durasi dapat mempengaruhi persepsi pitch.

Kebergantungan pitchterhadap durasi mengikuti prinsip ketikpastian akustik!

Berdasarkan pengamatan yang dilakukan Rossing dan Houtsma pada tahun 1986,

ketika durasi pitch jatuh hingga di bawah 25 ms, pitch dirasakan berubah, walaupun

batasan ini berbeda untuk beberapa pengamat.

5. Durasi dan Timbre

Durasi dari sinyal suara membedakan panjang pendeknya sinyal suara dengan

domain waktu. Dalam timbre musikal, lamanya durasi dapat membagi nada ke dalam

dua jenis yaitu : nada kontinyu dan nada transien. Persepsi timbre dalam suatu

permainan musik yang melibatkan banyak alat musik dipengaruhi oleh durasinya.

Seorang pendengar yang diminta untuk menebak jenis alat musik akan menebak

dengan benar untuk alat musik yang dimainkan dengan durasi yang lebih lama

dibandingkan dengan alat musik yang dimainkan hanya sesaat (transien).

6. Intensitas Suara

Intensitas bunyi menentukan  keras lemahnya suara pada bagian tertentu dari

suatu kalimat. Telinga kita sangat peka (sensitive) dan dapat mendeteksi intensitas-

intensitas suara dalam orde 10-13 W/m2.  Ini setara dengan gerakan selaput telinga

sebesar 10-12 m. Intensitas suara minimum yang masih dapat didengar dinamakan

ambang pendengaran (threshold of hearing). Intensitas suara biasanya dinyatakan

dalam desibel di atas ambang pendengaran karena kekerasan suara (loudness) kira-

kira adalah sebanding dengan logaritma dari intensitas. Pedoman nol desibel untuk

intensitas suara sudah ditentukan standarnya yaitu pada 10-12W/m2 pada 1000 Hz 

(yaitu ambang pendengaran pada 1000Hz). [6]

7. Spektogram

Spektogram suara melukiskan variasi-variasi dalam batas yang pendek yaitu

variasi intensitas dan frekuensi dalam bentuk grafik. Variasi tersebut memberikan

banyak informasi yang bermanfaat tentang artikulasi suara. Pola spektogram yang

dihasilkan untuk setiap ucapan akan memiliki perbedaan. Bahkan ketika dua orang

mengucapkan kata yang sama artikulasi mereka sama, namun tidak identik. Sehingga

spektogram mereka akan menunjukkan kemiripan juga perbedaan.

17

Page 21: Pengenalan Suara Pada Manusia

18

Page 22: Pengenalan Suara Pada Manusia

Metode Principal Component Analysis (PCA)

Principal Component Analysis (PCA) merupakan suatu metode reduksi

variabel-variabel dalam suatu matrik. Data-data suara yang telah ditentukan nilai-nilai

parameternya dibentuk menjadi sebuah matrik. Metode ini digunakan untuk mencari

distribusi sinyal suara dan parameter fisis yang paling dominan pada sinyal suara 

tersebut

Jaringan Syaraf Tiruan

Jaringan syaraf tiruan (JST) adalah system pemroses informasi yang memiliki

karakteristik mirip dengan jaringan syaraf biologi. JST dibentuk sebagai generalisasi

model matematika dari jaringan syaraf biologi, dengan asumsi bahwa:

Pemrosesan informasi terjadi pada banyak elemen sederhana (neuron).

Sinyal dikirim diantara neuron-neuron melalui penghubung-penghubung.

Penghubung antar neuron memiliki bobot yang akan memperkuat atau

memperlemah sinyal.

Untuk menentukan output, setiap neuron menggunakan fungsi aktivasi

(biasanya bukan fungsi linier) yang dikenakan pada jumlahan input yang diterima.

Besarnya output ini selanjutnya dibandingkan dengan suatu batas ambang.

JST ditentukan oleh 3 hal, yaitu :

Pola hubungan antar neuron (arsitektur jaringan).

Metoda untuk menentukan bobot penghubung (algoritma)

Fungsi aktivasi.

Besarnya impuls yang diterima oleh Y mengikuti fungsi aktifasi y = f(net).

Apabila nilai fungsi aktifasi cukup kuat, maka sinyal akan diteruskan. Nilai fungsi

aktifasi (keluaran model jaringan) juga dapat dipakai sebagai dasar untuk merubah

bobot.

8. Algoritma Belajar Pada Jaringan Syaraf Tiruan

Ide dasar jaringan syaraf tiruan adalah konsep belajar. Jaringan-jaringan

belajar melakukan generalisasi karakteristik tingkah laku obyek. Jika dilihat dari

sudut pandang manusia, hal ini sama seperti bagaimana manusia belajar sesuatu.

19

Page 23: Pengenalan Suara Pada Manusia

Manusia mengenal obyek dengan mengatur otak untuk menggolongkan atau

melakukan generalisasi terhadap obyek-obyek tersebut. Manusia menyimpan ilmu

pengetahuannya ka dalam otak yang berisikan  synapsis, neuron, dan lainnya.

Jaringan saraf menyimpan ilmu pengetahuannya dalam nilai bobot sambungan

(seperti synapsis dalam otak manusia) dan elemen-elemen (neurons) yang

menghasilkan kaluaran.

Jaringan-jaringan saraf membangun model-model system yang berubah-ubah,

yang direpresentasikan dengan proses stokastik peubah waktu melalui beberapa ruang

vektor (Rumelhart & Mc. Clelland, 1986). Oleh karena itu, untuk vektor masukan,

jaringan-jaringan merupakan pola-pola dari model setiap saat dan vektor keluaran

merupakan suatu aksi yang berhubungan, yang ditunjukkan atau digolongkan oleh

jaringan-jaringan tadi melalui masukan.

Untuk dapat menyelesaikan suatu permasalahan, jaringan saraf tiruan

melakukan algoritma belajar, yaitu bagaimana sebuah konfigurasi jaringan saraf

tiruan dapat dilatih untuk mempelajari data historis yang ada. Dengan pelatihan ini,

pengetahuan yang terdapat pada data dapat diserap dan direpresentasikan oleh harga-

harga bobot koneksinya. Berdasarkan cara memodifikasi bobotnya, ada 2 macam

pelatihan yang dikenal yaitu dengan supervise (supervised) dan tanpa supervise.

Dalam pelatihan dengan supervise, terdapat sejumlah pasangan data

(masukan-target keluaran) yang dipakai untuk melatih jaringan hingga diperoleh

bobot yang diinginkan. Pasangan data tersebut berfungsi sebagai “guru” untuk

melatih jaringan hingga diperoleh bentuk yang terbaik. “Guru” akan memberikan

informasi yang jelas tentang bagaimana system harus mengubah dirinya untuk

meningkatkan unjuk kerjanya.

Pada setiap kali pelatihan, suatu input diberikan ke jaringan. Jaringan akan

memproses dan megeluarkan keluaran. Selisih antara keluaran jaringan dengan target

(keluaran yang diinginkan) merupakan kesalahan yang terjadi. Jaringan akan

memodifikasi bobot sesuai dengan kesalahan tersebut. Propagasi balik merupakan

salah satu model yang menggunakan pelatihan dengan supervisi.

Sebagai ilustrasi, pelatihan dengan supervise dapat diandaikan sebagai skripsi

yang dibimbing oleh seorang dosen. Pada setiap kali pengumpulan berkas skripsi,

20

Page 24: Pengenalan Suara Pada Manusia

dosen akan mengkritik, mengarahkan, dan meminta perbaikan agar kualitas skripsi

meningkat.

Sebaliknya, dalam pelatihan tanpa supervisi (unsupervised learning) tidak ada

“guru” yang akan mengarahkan proses pelatihan. Dalam pelatihannya, perubahan

bobot jaringan dilakukan berdasarkan parameter tertentu dan jaringan dimodifikasi

menurut ukuran parameter tersebut.

Sedangkan, dalam pelatihan tanpa supervise dapat dibayangkan sebagai

skripsi tanpa dosen pembimbing. Mahasiswa mengerjakan skripsi sebaik-baiknya

berdasarkan ukuran tertentu (misal dibandingkan dengan skripsi yang sudah ada

sebelumnya atau dibandingkan dengan skripsi hasil temannya).

Model pelatihan dengan supervisi lebih banyak digunakan dan terbukti cocok

dipakai dalam berbagai aplikasi. Akan tetapi kelemahan utama pelatihan dengan

supervisi  adalah dalam hal pertumbuhan waktu komputasinya yang berorder

eksponensial. Ini berarti untuk data pelatihan yang cukup banyak, prosesnya menjadi

sangat lambat.

9. Arsitektur Propagasi Balik

Kelemahan JST yang terdiri dari layar tunggal membuat perkembangan JST

terhenti pada sekitar tahun 1970-an. Penemuan propagasi balik yang terdiri dari

beberapa layar membuka kembali cakrawala. Terlebih setelah berhasil ditemukannya

berbagai aplikasi aplikasi yang dapat diselesaikan dengan propagasi balik, membuat

JST semakin diminati orang.

JST dengan layar tunggal memiliki keterbatasaan dalam pengenalan pola.

Kelemahan ini bisa ditanggulangi dengan menambahkan satu/ beberapa layar

tersembunyi diantara layar masukan dan keluaran. Meskipun penggunaan lebih dari

satu layar tersembunyi memiliki kelebihan manfaat untuk beberapa kasus, tetapi

pelatihannya membutuhkan waktu yang lama. Maka umumnya orang mulai mencoba

dengan sebuah layar tersembunyi dahulu.

Seperti halnya model JST lain, propagasi balik melatih jaringan untuk

mendapatkan keseimbangan antara kemampuan jaringan untuk mengenali pola yang

digunakan selama pelatihan serta kemampuan jaringan untuk memberikan respon

21

Page 25: Pengenalan Suara Pada Manusia

yang benar terhadap pola masukan yang serupa (tetapi tidak sama) dengan pola yang

dipakai selama pelatihan.

Propagasi Balik memiliki beberapa unit yang ada dalam satu atau lebih layar

tersembunyi. JST Propagasi Balik merupakan model JST yang paling banyak

digunakan dalam edukasi. Arsitektur dan proses belajar yang sederhana sangat

memudahkan untuk dipelajari.

Pelatihan Propagasi Balik

Pelatihan propagasi balik meliputi 3 fase. Fase pertama adalah fase maju. Pola

masukan dihitung maju mulai dari layer masukan hingga layer keluaran menggunakan

fungsi aktivasi yang ditentukan. Fase kedua adalah fase mundur. Selisih antara

keluaran jaringan dengan target yang diinginkan merupakan keslahan yang terjadi.

Kesalahan tersebut dipropagasikan mundur, dimulai dari garis yang berhubungan

langsung dengan unit-unit di layer keluaran. Fase ketiga adalah modifikasi bobot

untuk menurunkan keslahan yang terjadi.

Pelatihan propagasi balik menggunakan metode pencarian titik minimum

untuk mencari bobot dengan error minimum. Dalam proses pencarian ini dikenal dua

macam metode yaitu metode incremental dan metode kelompok (batch). Dalam

metode incremental, bobot diubah setiap kali pola masukkan diberikan ke jaringan.

Sebaliknya dalam metode kelompok, bobot diubah setelah semua pola masukkan

diberikan ke jaringan. Error dan suku perubahan perubahan bobot yang terjadi dalam

setiap pola masukkan dijumlahkan untuk menghasilkan bobot yang baru. Matlab

menggunkan metode pelatihan kelompok dalam iterasinya. Perubahan bobot

dilakukan per-epoch (per kala).

22

Page 26: Pengenalan Suara Pada Manusia

BAB III

PENUTUP

III.1 Kesimpulan

Berdasarkan uraian diatas mengenai sinyal percakapan, dapat disimpulkan bahwa:

1. Suara adalah fenomena fisik yang dihasilkan oleh getaran benda, getaran suatu

benda yang berupa sinyal analog dengan amplitudo yang berubah secara kontinyu

terhadap waktu.

2. Sinyal percakapan adalah sinyal yang dihasilkan dari suara manusia sewaktu

melakukan percakapan. .

3. Proses produksi suara pada manusia dapat dibagi menjadi tiga buah proses fisiologis,

yaitu : pembentukan aliran udara dari paru-paru, perubahan aliran udara dari paru-

paru menjadi suara, baik voiced, maupun unvoiced yang dikenal dengan

istilah phonation, dan artikulasi yaitu proses modulasi/ pengaturan suara menjadi

bunyi yang spesifik.

4. Proses pendengaran pada telinga manusia yaitu, Sinyal suara memasuki saluran

telinga dan variasi tekanan yang dihasilkannya menekan gendang telinga. Karena sisi

bagian dalam dari gendang telinga mempunyai tekanan yang nilainya dijaga konstan

maka gendang telinga akan bergetar.

5. Sinyal analog atau sinyal waktu kontinyu adalah sinyal yang memiliki nilai real pada

setiap waktu. Sedangkan Sinyal digital merupakan hasil teknologi yang dapat

mengubah sinyal menjadi kombinasi urutan bilangan 0 dan 1 (juga dengan biner),

6. Sinyal percakapan pada manusia secara garis besar dibedakan atas 3 macam yaitu :

voice, unvoiced an silent.

III.2 Saran

Berdasarkan pembahasan diatas penulis menyarankan :

1. memperhatikan dan mengontrol volume suara dilingkungan sekitar,

agar tidak menimbulkan gangguan atau kebisingan

23

Page 27: Pengenalan Suara Pada Manusia

2. Menjaga kesehatan organ pendengaran, agara dapat berfungsi

dengan baik

24