soft skill (teknologi interface)

22
U n i v e r s i t a s G u n a d a r m a Teknologi Interface Nama Kelompok : 1. Imam Setiawan Rahmat 13110466 2. Sarip 16110389 3. Sumaryanto 16110740 4. Apryan Muchamad S 10110975 5. Imam Maulana 13110459

Upload: setiawan-da-juaros

Post on 21-Oct-2015

103 views

Category:

Documents


2 download

DESCRIPTION

Anggota Kelompok :1. Apryan Muchamad S 101109752. Imam Setiawan Rahmat 131104663. Imam Maulana 131104594. Sarip 161103895. Sumaryanto 16110740

TRANSCRIPT

Page 1: Soft Skill (Teknologi  Interface)

U n i v e r s i t a s G u n a d a r m a

“ Teknologi Interface ”

Nama Kelompok :

1. Imam Setiawan Rahmat 13110466

2. Sarip 16110389

3. Sumaryanto 16110740

4. Apryan Muchamad S 10110975

5. Imam Maulana 13110459

Page 2: Soft Skill (Teknologi  Interface)

Teknologi Interface

Interface (Antarmuka) adalah penghubung antara dua sistem atau alat. Media penghubung antara satu

subsistem dengan subsistem lainnya. Interface meliputi :

1. Perangkat yang dipakai untuk mengerjakan sesuatu, dan perangkat yang secara tidak langsung

mengontrol perangkat lunak.

2. Piranti input atau output

3. Prosedur pemakaian perangkat

Teknologi interface adalah sebuah teknologi dimana dua zat atau benda yang berbeda saling bertemu,

dan digunakan juga secara metafora untuk perbatasan antara benda yang satu dengan yang lainnya.

Secara khusus interface juga dapat diartikan yaitu suatu fungsi atribut atau sensor dari suatu system

yaitu perangkat lunak (software), aplikasi , kendaraan (alat transfortasi) dan lain-lain, yang

berhubungan dengan pengoperasiannya oleh user.

Secara umum telematika merupakan bertemunya sistem jaringan komunikasi dengan teknologi

informasi. Jadi, interface telematika adalah atribut sensor dari pertemuan sistem jaringan komunikasi

dan teknologi informasi yang berhubungan dengan pengoperasian oleh pengguna, sehingga

memudahkan pengguna dalam melakukan kegiatan yang menggunakan jaringan

Terdapat beberapa teknologi yang berhubungan dengan telematika yaitu :

1. Head Up Displays System

Head Up Displays adalah setiap tampilan transparan yang menyajikan data tanpa mengharuskan

pengguna untuk melihat dari sudut pandang yang biasa. Asal usul nama berasal dari pilot yang dapat

melihat informasi dengan kepala "up" dan melihat ke depan, bukan miring ke bawah melihat

instrumen yang lebih rendah.

HUDs menurut wikipedia dibagi menjadi empat generasi mencerminkan teknologi yang digunakan

untuk menghasilkan gambar :

a. Generasi Pertama

Page 3: Soft Skill (Teknologi  Interface)

Gunakan CRT untuk menghasilkan sebuah gambar pada layar fosfor,memiliki

kelemahan dari lapisan fosfor layar merendahkan dari waktu ke waktu.

Mayoritas HUDs beroperasi saat ini adalah jenis ini.

b. Generasi Kedua

Gunakan sumber keadaan menyala terang, misalnya LED, yang dimodulasi

oleh layar LCD untuk menampilkan gambar.

c. Generasi Ketiga

Pandu gelombang optik untuk menghasilkan gambar secara langsung di

Combiner daripada menggunakan sistem proyeksi.

d. Generasi Keempat

Gunakan laser scanning untuk menampilkan gambar dan gambar video pada

media transparan yang jelas.

Contoh :

Aplikasi khusus pesawat militer termasuk sistem senjata dan data sensor

seperti : penerapan sasaran (TD), Vc-penutupan kecepatan dengan target,

range-target, waypoint, Peluncuran Penerimaan Daerah (LAR),senjata

pencari, status senjata.

Terdapat 5 Macam Teknologi HUD yaitu :

CRT (Cathode Ray Tube) – Hal yang sama untuk semua HUD adalah sumber dari gambar yang

ditampilkan, CRT, yang dikemudikan oleh generator. Tanda generator mengirimkan informasi ke

CRT berbentuk koordinat x dan y. Hal itu merupakan tugas dari CRT untuk menggambarkan

koordinat senagai piksel, yaitu grafik. CRT membuat piksel dengan menciptakan suatu sinar elektonil,

yang menyerang permukaan tabung (tube).

Refractive HUD – Dari CRT, sinar diproduksi secara paralel dengan sebuah lensa collimating. Sinar

paralel tersebut diproyeksikan ke kaca semitrasnparan (kaca gabungan) dan memantul ke mata pilot.

Salah satu keuntungan dari reaktif HUD adalah kemampuan pilot untuk menggerakkan kepalanya dan

sekaligus melihat gambar yang ditampilkan pada kaca gabungan.

Reflective HUD – Kerugian dari HUD reflektif adalah akibatnya pada besarnya tingkat kompleksitas

yang terlibat dalam meproduksi penggabungan lekungan dari segi materi dan rekayasa. Keuntungan

besarnya adalah kemampuan pada peningkatan tanda brightness (terang), meminimalisir redaman

Page 4: Soft Skill (Teknologi  Interface)

cahaya dari pemandangan visual eksternal dan adanya kemungkinan untuk menghemat ruang di

kokpit, karena lensa collimating yang tidak diperlukan.

System Architecture – HUD komputer mengumpulkan informasi dari sumber – sumber seperti IRS

(Inertial Reference System), ADC (Air Data Computer), radio altimeter, gyros, radio navigasi dan

kontrol kokpit. Diterjemahkan ke dalam koordinat x dan y, komputer HUD selanjutnya akan

menyediakan informasi yang dibutuhkan untuk hal apa yang akan ditampilkan pada HUD ke

generator simbol. Berdasarkan informasi ini, generator simbol menghasilkan koordinat yang

diperlukan pada grafik, yang akan dikirmkan ke unit display (CRT) dan ditampilkan sebagai simbol

grafik pada permukaan tabung. Kebanyakan HUD militer mudah memberikan atau melewatkan

isyarat kemudi FD melalui generator simbol. HUD memperhitungkan isyarat kemudi pada komputer

HUD dan hal tersebut membuatnya sebagai sistem „standalone‟. Sipil HUD merupakan fail-passive

dan mencakup pemeriksaan internal yang besar mulai dari data sampai pada simbol generator.

Kebanyakan perselisihan perhitungan dirancang untuk mencegah data palsu tampil.

Display Clutter – Salah satu perhatian penting dengan simbologi HUD adalah kecenderungan

perancang untuk memasukkan data terlalu banyak, sehingga menghasilkan kekacauan tampilan.

Kekacauan tampilan ini jauh dari eksklusif untuk HUD, tetapi hal ini sangat kritis pada saat melihat

ke arah tampilan. Setiap simbologi yang tampil pada sebuah HUD harus melayani atau memiliki

sebuah tujuan dan mengarahkan peningkatan performa. Kenyataannya, bukan piksel tunggal yang

dapat menerangi kecuali dia secara langsung mengarahkan pada penigkatan. Prinsip yang diterapkan

pada perancangan HUD adalah „ketika dalam keraguan, tinggalkan saja‟.

2. Tangible User Interface

Sebuah user interface yang nyata (TUI) adalah sebuah antarmuka pengguna di mana

seseorang berinteraksi dengan informasi digital melalui lingkungan fisik. Nama awal Graspable User

Interface, yang tidak lagi digunakan.

Karakteristik Tangible User Interface

a. Representasi fisik adalah komputasi digabungkan dengan informasi

digital yang mendasari

b. Representasi fisik mewujudkan mekanisme kontrol interaktif.

Page 5: Soft Skill (Teknologi  Interface)

c. Representasi fisik adalah perseptual digabungkan dengan representasi

digital secara efektif dimediasi.

d. Keadaan fisik tangibles mencakup aspek kunci dari negara digital sistem.

Contoh :

Contoh TUI adalah sistem Topobo. Blok di Topobo seperti blok LEGO yang bisa diambil bersama-

sama. tetapi juga dapat bergerak sendiri menggunakan komponen bermotor. Seseorang dapat

mendorong, menarik, dan memutar blok-blok, dan blok-blok bisa menghafal gerakan-gerakan ini dan

replay mereka.

Dasar Model Dari TUI

Antarmuka antara manusia dan informasi membutuhkan dua komponen utama, yaitu input dan output,

atau kontrol dan representasi. Kontrol memungkinkan pengguna untuk memanipulasi informasi,

sedangkan representasi eksternal dianggap sebagai indera manusia. Gambar 2.9 menampilkan model

sederhana yang terdiri dari kontrol, representasi dan informasi.

TUI menggunakan representasi nyata dari informasi yang juga berfungsi sebagai mekanisme kontrol

secara langsung pada informasi digital. Dengan merepresentasikan informasi pada kedua bentuk

tangible dan intangible, pengguna dapat lebih secara langsung menekankan representasi digital

dengan menggunakan tangan mereka.

Representasi Tangible Sebagai Kontrol

Gambar 1 menggambarkan ide utama dari TUI untuk memberikan representasi (physical dan

graspable)nyata eksternal ke informasi digital. Represenntasi tangible membantu jemabatan batas

antara fisik dan dunia fisik. Representasi tangible juga adalah komputasi digabungkan dengan kontrol

terhadap dasar informasi digital dan model komputasi.

Page 6: Soft Skill (Teknologi  Interface)

Fungsi dari representasi tangible adalah sebagai pengendali fisik interaktif. Upaya TUI untuk

mewujudkan informasi digital dalam bentuk fisik, memaksimalkan kelangsungan informasi dengan

manipulasi sambungan ke dasar perhitungan. Melalui pemanipulasian fisik dari representasi tangible,

representasi digital diubah.

Representasi Intangible – Representasi tangible (berwujud) memungkinkan perwujudan fisik secara

langsung digabungkan ke informasi digita. Namun, ia memiliki kemampuan terbatas.untuk mewakili

perubahan banyak materi atau properti (sifat) fisik. Tidak seperti penempaan pixel pada komputer,

untuk mengubah suatu objek fisik dalam bentuk, posisi, atau properti dalam real-time sangat sulit.

Dalam perbandingan dengan “bit”, “atom” sangat kaku, mengambil massa dan ruang.

Ada beberapa jenis TUI yang telah digerakkan dari representasi berwujud (benda fisik) sebagai pusat

dari umpan balik. Contohnya adalah inTouch ((Brave, et al., 1998), curlybot (Frei, et al., 2000a), dan

topobo (Undian, et al, 2004). Jenis kekuatan umpan balik TUI ini tidak tergantung pada representasi

berwujud, sejak umpan balik aktif melalui representasi berwujud sebagai saluran tampilan utama.

Page 7: Soft Skill (Teknologi  Interface)

Genre Aplikasi TUI

TUI memiliki berbagai macam aplikasi domain. Ada terdpat 7 genre untuk aplikasi yang

menjanjikan,, yaitu:

Tangible Telepresence – Genre ini merupakan komunikasi antar-pribadi yang mengambil keuntungan

dari interasiksi haptic yang diggunakan untuk menengahi representasi tangible dan kontrol.Genre ini

bergantung pda pemetaan reprensentasi input haptic jarak jauh. Tangible telepresence, dasar

mekanismenya dalah sinkronisasi objek terdistribusi dan gestural simulasi kehadiran artefak, sepertu

gerakan atau getaran, yang memungkunka peserta jarak jauh untuk menyampaikan manipulasi

hapticmereka dari pendistribusian objek fisik. Contohnya: inTouch (Berani dan Dahley, 1997),

HandJive (Fogg, et al, 1998), dan ComTouch (Chang, et al . 2002).

Tangible With Kinetic Memory – Penggunaan gerak kinestetik dan gerakan untuk meningkarkan

pembelajaran konsep lain merupakan domain lain yang menjanjikan. Mainan pendidikan untuk

mewujudkan catatan dan konsep bermain sudah dieksplorasi dengan menggunakan teknologi aktuasi

dan mengambil keuntungan dari i/o kebetulan dari TUI. Gerak dalam ruang fisik menerangi

hubungan matematika simetris di alam, dan gerakan kinetik dapat digunakan untuk mengajarkan

kepada anak-anak konsep yang relevan dengan program dan geometri diferensial serta bercerita.

Contoh dari genre ini adalah Curlybot (Frei, et, al, 2000) dan topobo (undian, et al, 2004) merupakan

mainan yan menyaring ide-ide yang berkaitan dengan gerak tubuh dan bentuk pergerakan dinamis,

fisik dan bercerita (strory telling).

Constructive Assembly – Domain lainnya adalah pendekatan peraktian konstruktif yang menarik

inspirasi dari LEGO TM dan blok bangunana, pembangunan pada interkoneksi unsur fisik modular.

Domain ini terutama berkaitan dengan kesesuain fisik antara obyek dan hubungan kinetik antara

potongan-potongan yang memungkinkan konstruksi yang lebih besar dan pergerakan varietas. Contoh

domain ini adalah perakitan konstruksi yang dipelopori oleh Aish dan Frazer di akhir tahun 1970-an.

Aish membangun BBS untuk analisis kinerja panas (thermal), dan Frazer membangun serangkaian

pemodelan alat cerdas sperti Universal Constructor untuk pemodelan san simulasi. Contoh terbaru

adalah AlgoBlock (Suzuki dan Kato, 1993), ActiveCube (Kitamura, et al, 2001), Blok System

(Zuckerman dan resnick 2004), dll.

Tokens and Constraints – Token dan kendala (constraint) adalah pendekatan lain TUI untuk

mengoperasikan informasi digital abstrak menggunakan mekanisme kendala (Ullmer, et al, 2005).

Token adalah diskrit, benda fisik spasial reconfigurable yang mewakili digital informasi atau operasi.

Kendal membatasi daerah dimana tanda dapat ditempatkan. Kendala yang dipetakan ke operasi digital

atau properti yang diterapkan pada penempatan token dengan batasan-batasan.Kendala yang sering

diwujudkan sebagai struktur fisik yang mekanisme salurannya menetukan bagaimana token dapat

Page 8: Soft Skill (Teknologi  Interface)

dimanipulasi, padahal sering membatasi pergerakannya pada dimensi fisik. Contohnya adalah media

Blocks (Ullmer, et al, 1998), LogJam(Cohen, et al, 1999(, Tangible Query Interface (Ullmer, et al,

2003), dll

Interactive Surfaces (table top TUI) – Interaktif permukaan lain adalah pendekatan yang menjanjikan

untuk mendukung kolaborasi desain dan simulasi yang telah dieksplorasi oleh banyak peneliti dalam

tahun terakhir untuk mendukung berbagai aplikasi spasial. Digital Desk (Wallner, et al, 1993) adlah

karya perintis dalam genre ini, dan berbegai TUI meja dikembangkan menggunakan beberapa artefak

berwujud dalam bingkai umum dari permukaan kerja horizontal. Contohnya adalah metaDesk (Ulmer

dan Ishi, 1997), AudioPad(Patten, et all, 2002), Desain Jaringan IP Workbeach (Kobayashi, et al,

2003), dll.

Continuous Plastic TUI – Keterbatasan dari TUI sebelumnya adalah kurangnya kemampuan untuk

mengubah bentuk representasi berwujud selama berinteraksi. Pengguna harus menggunakan standar

himpunan objek fixed-form, hanya mengubah hubungan spasial diantara mereka, tetapi tidak bentuk

individual objek itu sendiri. Alih-alih menggunakan benda diskrit dengan bentuk tetap, jenis baru dari

sistem TUI memanfaatkan bahan tangible secara berlanjut, seperti tanah liat dan pasir yang

dikembangkan untuk memberikan bentuk cepat dan patung untuk desain landscape. Contohnya adalah

illumniating Clay (Piper, et al, 2002), dan SandSpcape (Ishii, et al, 2004).

Augmented Everyday Objects – Peningkatan benda-benada yang familiar setiap harinya adalah

pendekatan desain penting dari TUI untuk memperpendek lantai dan membuatnya mudah untuk

memahami konsep-konsep dasar. Contohnya adalah Notebook Audio(Stifelman, 1996),

LumiTouch(Chang, et al, 2001), I/O Brush (Ryokai, et al, 2004), dll.

3. Computer Vision

Computer Vision adalah ilmu dan teknologi mesin yang melihat, di mana dalam hal ini berarti

bahwa mesin mampu mengekstrak informasi dari gambar yang diperlukan untuk menyelesaikan tugas

tertentu. Visi komputer berkaitan dengan teori di balik sistem buatan bahwa ekstrak informasi dari

gambar. Data gambar mengambil banyak bentuk, seperti urutan video, pandangan dari beberapa

kamera, atau data multi-dimensi dari scanner medis.

Contoh :

Contoh aplikasi dari visi komputer mencakup sistem untuk :

a. Pengendalian proses

Page 9: Soft Skill (Teknologi  Interface)

b. Mendeteksi peristiwa

c. Mengorganisir informasi

d. Modeling benda atau lingkungan

e. Interaksi

Computer vision merupakan proses otomatis yang mengintegrasikan sejumlah besar proses

untuk persepsi visual, seperti akuisisi citra, pengolahan citra, pengenalan dan membuat

keputusan. Computer vision mencoba meniru cara kerja sistem visual manusia (human vision)

yang sesungguhnya sangat kompleks. Untuk itu, computer vision diharapkan memiliki

kemmpuan tingkat tinggi sebagaiman human visual. Kemampuan itu diantaranya adalah:

Object detection → Apakah sebuah objek ada pada scene? Jika begiru, dimana

batasan-batasannya..?

Recognation → Menempatkan label pada objek.

Description → Menugaskan properti kepada objek.

3D Inference → Menafsirkan adegan 3D dari 2D yang dilihat.

Interpreting motion → Menafsirkan gerakan.

Computer Vision sering didefinisikan sebagai salah satu cabang ilmu pengetahuan yang

mempelajari bagaimana komputer dapat mengenali obyek yang diamati/ diobservasi. Cabang

ilmu ini bersama intelijensia semu (Artificial Intelligence) akan mampu menghasilkan sistem

intelijen visual (Visual Intelligence System). Computer Vision adalah kombinasi antara

Pengolahan Citra dan Pengenalan Pola yang hubungan antara ketiganya dapat dilihat pada

gambar 1. Pengolahan citra merupakan proses awal dari computer vision, sedangkan

pengenalan pola merupakan proses menginterpretasikan citra.

Page 10: Soft Skill (Teknologi  Interface)

Gambar1. Hubungan Antara Computer Vision, Pengolahan Citra, dan Pengenalan Pola

Pengolahan Citra (Image Processing) merupakan bidang yang berhubungan dengan proses

transformasi citra/gambar (image). Proses ini bertujuan untuk mendapatkan kualitas citra

yang lebih baik. Sedangkan Pengenalan Pola (Pattern Recognition) berhubungan dengan

proses identifikasi obyek pada citra atau interpretasi citra. Proses ini bertujuan untuk

mengekstrak informasi/pesan yang disampaikan oleh gambar/citra.

Untuk mendukung tugas dari computer vision, aka ada beberapa fungsi pendukung yang

ditambahkan ke dalam sistemini, yaitu:

Proses penangkapan citra/gamabr (image acquisition)

Proses pengolahan citra (image processing)

Analisa data citra (image analysis)

Proses pemahaman data citra (image understanding)

Proses dan Hirarki Pada Computer Vision

Ada terdapat 3 proses yang terjadi dalam computer vision, yaitu:

Memperoleh atau mengakuisisi citra digital.

Operasi pengolahan citra.

Menganalisis dan menginterpretasi citra dan menggunakan hasil pemrosesan untuk

tujuan tertentu, misal memandu robot, mengontrol peralatan, dll.

Page 11: Soft Skill (Teknologi  Interface)

Gambar2. Proses Pada Computer Vision

Hirarki pada computer vision ada 3 tahap, yaitu:

Pengolahan Tingkat Rendah (Image to image) → Menghilangkan noise, dan

peningkatan gambar (enchament image).

Pengolahan Tingkat Menengah (Image to dimbolic) → Kumpulan garis / vektor yang

merepresentasikan batas sebuah obyek PADA citra.

Pengolah Tingkat Tinggi (Simbolic to simbolic) → Representasi simbolik batas- batas

obyek menghasilkan nama obyek tersebut.

Sebelum membuat aplikasi computer vision, maka perlu dibuat pertimbangan dan

perancangannya. Pertimbangan dan perancangan tersebut dapat dilakukan dalam 3 tahap,

yaitu:

♥ Informasi apa yang ingin diperoleh dan bagaimana informasi tersebut dimanifestasikan ke

dalam citra.

♥ Pengetahuan apa yang diperlukan untuk memperoleh informasi.

Untuk menentukan hubungan antara intensitas piksel dan sifat-sifat citra diperlukan suatu

model, misalnya adalah:

♦ Scene model: jenis features, textures, smoothness.

♦ Illumination model: posisi dan karakteristik sumber cahaya serta sifat-sifat

reflektansi permukaan obyek .

Page 12: Soft Skill (Teknologi  Interface)

♦ Sensor model: posisi dan kinerja optik dari kamera yang digunakan, noise dan

distorsi pada proses dijitasi .

♥ Kecepatan pemrosesan dan representasi pengetahuan.

Page 13: Soft Skill (Teknologi  Interface)

Aplikasi Computer Vision

Sebagai teknologi disiplin, visi komputer berusaha untuk menerapkan teori dan model untuk

pembangunan sistem visi komputer. Aplikasi pada visi komputer mencakup berbagai macam

sistem, yaitu:

1. Pengendalian proses (misalnya, sebuah robot industri atau kendaraan otonom).

2. Mendeteksi peristiwa (misalnya, untuk pengawasan visual atau orang menghitung).

3. Mengorganisir informasi (misalnya, untuk pengindeksan database foto dan gambar

urutan).

4. Modeling benda atau lingkungan (misalnya, industri inspeksi, analisis gambar medis /

topografis).

5. Interaksi (misalnya, sebagai input ke perangkat untuk interaksi manusia komputer).

6. Sub-domain visi komputer meliputi adegan rekonstruksi, acara deteksi, pelacakan

video, pengenalan obyek, belajar, pengindeksan, gerak estimasi, dan gambar restorasi.

Gambar3. Hasil Proses Computer Vision Pada Shape Recovery Dan Cell Segementation

Page 14: Soft Skill (Teknologi  Interface)

4. Browsing Audio Data

Data audio berarti data yang bersifat audio seperti musik, lagu, suara dan sebagainya. Sebuah

metode browsing jaringan disesiakan untuk browsing video / audio data yang ditembak oleh sebuah

IP kamera.

Contoh :

Sebagai kemajuan teknologi jaringan, semakin banyak diterapkan jaringan

produk yang dibuat-buat terus-menerus. Salah satu yang paling umum

diterapkan jaringan yang dikenal adalah produk kamera IP,yang dapat

menampilkan isi (video / audio data) melalui Internet. Kamera IP biasanya

terhubung ke jaringan melalui router, dan memiliki sebuah IP (Internet

Protocol) address setelah operasi sambungan.

Browsing Audio Data merupakan metode browsing jaringan yang digunakan untuk browsing video /

audio data yang ditangkap oleh sebuah IP kamera. Sebuah komputer lokal digabungkan ke LAN

(local area network) untuk mendeteksi IP kamera. Jaringan video / audio metode browsing mencakupi

langkah-langkah sebagai berikut :

Menjalankan sebuah program aplikasi komputer lokal untuk mendapatkan kode identifikasi

yang disimpan dalam kamera IP.

Transmisi untuk mendaftarkan kode identifikasi ke DDNS ( Dynamic Domain Name Server)

oleh program aplikasi.

Mendapatkan kamera IP pribadi alamat dan alamat server pribadi sehingga pasangan IP

kamera dan kontrol kamera IP melalui kamera IP pribadi alamat dan alamat server pribadi

compile ke layanan server melalui alamat server pribadi sehingga untuk mendapatkan video /

audio data yang ditangkap oleh kamera IP, dimana server layanan menangkap video / audio

data melalui Internet.

Browsing audio data tidak semudah browsing dokumen cetak, karena adanya sifat temporal suara.

Ketika melakukan browsing terhadap dokumen, kita dapat dengan cepat mengalihkan fokus perhatian

dengan membaca sepintas isi dari dokumen tersebut. Kita dapat mengetahui ukuran dan struktur

dokumen, dan menggunakan memori spasial visual untuk mengingat dan mencari spesifik topik.

Namun, ketika browsing suatu rekaman audio, kita harus berulang kali memainkan dan melompati

bagian tertentu, tanpa memainkannya, kita tidak bisa menyadari suara atau isinya. Kita harus

mendengarkan semua stream audio untuk dapat menangkap semua isinya.

Page 15: Soft Skill (Teknologi  Interface)

5. Speech Recognation

Speech recognation (ASR) adalah suatu pengembangan teknik dan sistem yang

memungkinkan komputer untuk menerima masukan berupa kata yang diucapkan. Teknologi

ini memungkinkan suatu perangkat untuk mengenali dan memahami kata-kata yang

diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal digital tersebut dengan suatu

pola tertentu yang tersimpan dalam suatu perangkat.

Speech Recognation (juga dikenal sebagai pengenalan suara otomatis atau pengenalan suara otomatis

atau pengenalan pembicaraan kata-kata untuk teks. Pengenalan pembicaraan adalah solusi yang lebih

luas yang mengacu pada teknologi yang dapat mengenali pidato tanpa ditargetkan pada pembicara

tunggal seperti pusat panggilan sistem yang dapat mengenali suara sewenang-wenang.

Contoh :

Aplikasi perawata kesehatan. dalam metode perawatan kesehatan domain,

bahkan di bangunmeningkatkan teknologi pengenalan suara (transcriptionist

medis (MTs) belum menjadi ibunya.

Pengenalan ucapan (speech recognation) dalam perkembangan teknologinya merupakan

bagian dari pengenalan suara (proses identifikasi seseorang berdasarkan suaranya).

Pengenalan suara sendiri terbagi menjadi du kategori, yaitu:

Piranti pengenalan kata (word recognation) yang mampu merespon ucapan-ucapan

secara indovidu atau perintah-perintah yang menggunakan teknik yang dikenal

sebagai speaker verification. Pertama kali sistem akan membangkitkan suatu template

untuk mengenali suara user.

Piranti pengenalan kalimat (speech recognation) yang mampu mengenali hubungan

antar kata terucap di dalam kalimat atau frase. Teknik - teknik statistik dipakai dalam

hal pola perekaman suara yang akan dicocokkan dengan kata-kata terucap.

Jenis-Jenis Pengenalan Ucapan

Page 16: Soft Skill (Teknologi  Interface)

Berdasarkan kemampuan dalam mengenal kata yang diucapkan, terdapat 5 jenis pengenalan

kata, yaitu :

Kata-kata yang terisolasi : Proses pengidentifikasian kata yang hanya dapat mengenal

kata yang diucapkan jika kata tersebut memiliki jeda waktu pengucapan antar kata

Kata-kata yang berhubungan : Proses pengidentifikasian kata yang mirip dengan kata-

kata terisolasi, namun membutuhkan jeda waktu pengucapan antar kata yang lebih

singkat

Kata-kata yang berkelanjutan : Proses pengidentifikasian kata yang sudah lebih maju

karena dapat mengenal kata-kata yang diucapkan secara berkesinambungan dengan

jeda waktu yang sangat sedikit atau tanpa jeda waktu. Proses pengenalan suara ini

sangat rumit karena membutuhkan metode khusus untuk membedakan kata-kata yang

diucapkan tanpa jeda waktu. Pengguna perangkat ini dapat mengucapkan kata-kata

secara natural

Kata-kata spontan: Proses pengidentifikasian kata yang dapat mengenal kata-kata

yang diucapkan secara spontan tanpa jeda waktu antar kata

Verifikasi atau identifikasi suara: Proses pengidentifikasian kata yang tidak hanya

mampu mengenal kata, namun juga mengidentifikasi siapa yang berbicara

Prinsip Dasar Speech Recognation

Semua metode dasar proses pengenalan suara terdiri dari dua fase operasi, yaitu:

Proses training. Pada proses ini sistem belajar dari referensi pola yang berupa

perbedaan pola sinyal suara misal frase, kata, fonem yang akan mengisi vocabulari

dari sistem. Setiap referensi di pelajari dari kata yang dikatakan yang kemudian

disimpan dalam template dan telah mengalami metode untuk merata-rata dan

karakteristik statistik dan parameter statistik.

Proses recognation. Pada proses ini sistem akan diberikan inputan yang belum

diketahui dan akan di identifikasi berdasarkan pola template yang telah didapatkan

pada proses training.

Page 17: Soft Skill (Teknologi  Interface)

Pada umumnya, suatu sistem pengenalan suara terdiri dari beberapa modul utama, yaitu:

Signal processign frontend digunakan untuk mengkonversi sinyal suara kedalam

bentuk sequence feature vector yang akan digunakan pada saat klasifikasi.

Accoustic modelling digunakan untuk memodelkan secara statistik hasil training yang

telah dilakukan kedalam sebuah template.

Language modelling digunakan untuk memodelkan bentuk kata baik berupa kata,

fonem, ataupun kalimat.

Gambar1. Blok Diagram Speech Recognation

Alat Pengenal Suara (Speech Recognizer)

Alat pengenal ucapan, yang sering disebut dengan speech recognizer, membutuhkan sampel

kata sebenarnya yang diucapkan dari pengguna. Sampel kata akan didigitalisasi, disimpan

dalam komputer, dan kemudian digunakan sebagai basis data dalam mencocokkan kata yang

diucapkan selanjutnya. Sebagian besar alat pengenal ucapan sifatnya masih tergantung

kepada pengeras suara. Alat ini hanya dapat mengenal kata yang diucapkan dari satu atau dua

orang saja dan hanya bisa mengenal kata-kata terpisah, yaitu kata-kata yang dalam

penyampaiannya terdapat jeda antar kata. Hanya sebagian kecil dari peralatan yang

menggunakan teknologi ini yang sifatnya tidak tergantung pada pengeras suara. Alat ini

sudah dapat mengenal kata yang diucapkan oleh banyak orang dan juga dapat mengenal kata-

kata kontinu, atau kata-kata yang dalam penyampaiannya tidak terdapat jeda antar kata.

Page 18: Soft Skill (Teknologi  Interface)

Aplikasi dari alat pengenal suara dapata ditemukan dalam berbagai bidang, diantaranya

adalah:

1. Bidang komunikasi

Komando Suara – Komando Suara adalah suatu program pada komputer yang

melakukan perintah berdasarkan komando suara dari pengguna. Contohnya pada

aplikasi Microsoft Voice yang berbasis bahasa Inggris. Ketika pengguna mengatakan

“Mulai kalkulator” dengan intonasi dan tata bahasa yang sesuai, komputer akan

segera membuka aplikasi kalkulator. Jika komando suara yang diberikan sesuai

dengan daftar perintah yang tersedia, aplikasi akan memastikan komando suara

dengan menampilkan tulisan “Apakah Anda meminta saya untuk „mulai

kalkulator‟?”. Untuk melakukan verifikasi, pengguna cukup mengatakan “Lakukan”

dan komputer akan langsung beroperasi.

Pendiktean – Pendiktean adalah sebuah proses mendikte yang sekarang ini banyak

dimanfaatkan dalam pembuatan laporan atau penelitian. Contohnya pada aplikasi

Microsoft Dictation yang merupakan aplikasi yang dapat menuliskan apa yang

diucapkan oleh pengguna secara otomatis.

Telepon – Pada telepon, teknologi pengenal ucapan digunakan pada proses penekanan

tombol otomatis yang dapat menelpon nomor tujuan dengan komando suara.

2. Bidang Kesehatan

Alat pengenal ucapan banyak digunakan dalam bidang kesehatan untuk membantu para

penyandang cacat dalam beraktivitas. Contohnya pada aplikasi Antarmuka Suara Pengguna

atau Voice User Interface (VUI) yang menggunakan teknologi pengenal ucapan dimana

pengendalian saklar lampu misalnya, tidak perlu dilakukan secara manual dengan

menggerakkan saklar tetapi cukup dengan mengeluarkan perintah dalam bentuk ucapan

sebagai saklarnya. Metode ini membantu manusia yang secara fisik tidak dapat

menggerakkan saklar karena cacat pada tangan misalnya. Penerapan VUI ini tidak hanya

untuk lampu saja tapi bisa juga untuk aplikasi-aplikasi kontrol yang lain.

Page 19: Soft Skill (Teknologi  Interface)

Gambar 2 Voice User Interface (VUI)

3. Bidang militer

Pelatihan Penerbangan – Aplikasi alat pengenal ucapan dalam bidang militer adalah

pada pengatur lalu-lintas udara atau yang dikenal dengan Air Traffic Controllers

(ATC) yang dipakai oleh para pilot untuk mendapatkan keterangan mengenai keadaan

lalu-lintas udara seperti radar, cuaca, dan navigasi. Alat pengenal ucapan digunakan

sebagai pengganti operator yang memberikan informasi kepada pilot dengan cara

berdialog.

Helikopter – Aplikasi alat pengenal ucapan pada helikopter digunakan untuk

berkomunikasi lewat radio dan menyesuaikan sistem navigasi. Alat ini sangat

diperlukan pada helikopter karena ketika terbang, sangat banyak gangguan yang akan

menyulitkan pilot bila harus berkomunikasi dan menyesuaikan navigasi dengan

terlebih dahulu memencet tombol tertentu

6. Speech Syntesis

Pidato sintesis adalah produksi buatan manusia pidato. Sebuah sistem komputer yang digunakan

untuk tujuan ini disebut synthesizer-speech.

Speech synthesis juga sebuah kemampuan bicara manusia yang dibuat oleh manusia (artificial).

Sebuah sistem komputer digunakan untuk tujuan ini yang disebut sebagai speech synthesizer, dan

dapat diimplementasikan ke dalam software atau hardware. Sebagai contoh sebuah sistem text-to-

speech (TTS) yang dapat mengkonversikan teks dengan bahasa biasa menjadi suara.

Page 20: Soft Skill (Teknologi  Interface)

Synthesized speech dapat diciptakan dengan menggabungkan beberapa potongan-potongan dari

pembicaraan/pidato yang sudah direkam dalam sebuah basis data. Kualitas dari sebuah speech

synthesizer dilihat dari kemiripannya dengan suara manusia dan kemampuannya untuk bisa dipahami.

Program TTS yang jelas dapat membantu orang dengan gangguan visual atau ketidakmampuan

membaca, untuk mendengarkan pada pekerjaan yang tertulis dalam komputer. Banyak Sistem Operasi

komputer yang telah dimasukkan speech synthesizer sejak tahun 1980-an.

Teknologi Speech Synthesis

Yang paling penting dalam kualitas sistem speech synthesis adalah kealamian dan kejelasannya.

Kealamaian menjelaskan bagaimana dekatnya suara output dengan suara manusia, sementara

kejelasan adalah dengan kemudahan di mana output tersebut dapat dipahami. Speech synthesizer yang

ideal adalah yang alami dan jelas. Sistem speech synthesis biasanya mencoba untuk memaksimalkan

kedua karakteristik.

Dua teknologi utama dalam pembuatan gelombang suara synthetic speech adalah Concatenative

Synthesis dan Formant Synthesis. Setiap teknologi mempunyai kekuatan dan kelemahannya, dan

penggunaan yang ditujukan dari sistem synthesis akan menentukkan pendekatan mana yang

digunakana.

Concatenative Synthesis

Concantenative synthesis didasarkan dengan penggabungan dari segmen-segmen dari pembicaraan

yang sudah direkam. Secara umum, concatenative synthesis memproduksi synthesized speech dengan

suara yang paling alami. Tetapi, perbedaan antara variasi alami dalam pembicaraaan dan sifat dari

teknik otomasi untuk pensegmentasian gelombang suara terkadang menghasilkan kesalahan suara

dalam output.

Formant Synthesis

Formant synthesis tidak menggunakan pembicaraan manusia sebagai sample pada runtime. Daripada

itu, synthesized speech yang dihasilkan dibuat dengan additive synthesis dan sebuah model akustik

(physical modelling synthesis). Parameter seperti frekuensi dasar, penyuaraan, dan tingkat kebisingan

di variasikan dari waktu ke waktu untuk menciptakan gelombang buatan (artificial) dari sebuah

pembicaraan. Banyak sistem yang berdasarkan formant synthesis menciptakan pembicaraan yang

seperti robot yang tidak mungkin dapat dikenal sebagai suara manusia.

Tetapi, kealamian maksimum bukan selalu tujuan dari sebuah sistem speech synthesis, dan sistem

formant synthesis mempunyai keuntungan dari sistem concatenative. Pembicaraan yang di-formant

synthesis-kan dapat menjadi sangat jelas, bahkan dalam kecepatan yang tinggi, sehingga menghindari

kesalahan suara yang sering dialami sistem concatenative.

Formant synthesis biasanya program yang lebih kecil dari concatenative sistem karena ia tidak

menggunakan basis data dari sampel-sampel pembicaraan. Oleh karena itu formant synthesis dapat

Page 21: Soft Skill (Teknologi  Interface)

ditanamkan dalam sistem yang mempunyai memory dan microprosesor yang terbatas. Karena sistem

yang berdasarkan formant mempunyai kendali penuh dari sluruh aspek dari hasil pembicaraan, variasi

yang luas dari prosodi dan intonasi dapat dihasilkan, menyampaikan tidak hanya pertanyaan dan

pernyataan tetapi juga emosi dan nada suara.

Page 22: Soft Skill (Teknologi  Interface)

Daftar Pustaka

1] http://macuy-marucuy.blogspot.com/2010/11/teknologi-interface.html

2] http://diehermawan.blogspot.com/2012/11/teknologi-interface.html

3] http://catatandigital15.wordpress.com/2012/11/17/teknologi-interface/

4] http://catatandigital15.wordpress.com/2012/11/17/teknologi-interface/

5] http://freezcha.wordpress.com/2010/11/16/browsing-audio-data/

6] http://ranggaadhityap.blogspot.com/2011/11/speech-synthesis.html