bab i

BAB I

PENDAHULUAN

1.1 Latar Belakang

Pada prinsipnya teknologi dibuat untuk mempermudah dan membantu

manusia dalam melakukan pekerjaannya. Saat ini perkembangan teknologi sudah

sangat pesat. Salah satunya adalah Artificial Intelligent atau kecerdasan buatan.

Aplikasi dari teknologi ini adalah Biometric Recognition. Biometrik merupakan

suatu metoda yang digunakan untuk mengenali manusia berdasarkan pada satu

atau lebih ciri-ciri fisik atau tingkah laku yang unik. Salah satu jenis teknologi

biometrik adalah pengenalan suara (voice recognition). Suara yang dimaksudkan

adalah sinyal suara yang dihasilkan langsung dari indera bicara pengakses. Voice

recognition memiliki dua bagian, yaitu speech recognition dan speaker

recognition. Speech recognition adalah proses identifikasi suara berdasarkan kata

yang diucapkan. Adapun speaker recognition merupakan proses pengenalan suara

berdasarkan orang yang berbicara.

Hampir semua sistem pengenalan suara melakukan ekstraksi parameter untuk

menampilkan bentuk sinyal dari kata yang diucapkan. Salah satu dari ekstraksi

parameter dapat dilakukan dengan menggunakan Mel Frequency Cepstrum

Coefficients (MFCC). Untuk pemodelan ucapan manusia dalam suatu sistem

pengenalan ucapan dapat dilakukan dengan menggunakan pemodelan statistik.

Salah satu pemodelan statistik adalah Hidden Markov Model (HMM). HMM

1

mampu memberikan mekanisme yang efisien untuk memodelkan secara statistik

keragaman dalam ucapan. Selain itu, HMM juga memiliki pelatihan yang efisien.

Penelitian tentang isolated word Recognition merupakan teknik paling dasar

pada pengenalan ucapan [1]. Juga merupakan bentuk pengenalan ucapan yang

cepat dan umum digunakan, namun memiliki keterbatasan pada aplikasinya.

Karena kata-kata yeng terisolasi jarang terjadi. Disisi lain bentuk continous

speech recognition merupakan teknik yang cukup kompleks dalam komputasinya

karena membutuhkan proses pelatihan dalam jumlah cukup banyak. Banyak

keperluan aplikasi berada diantara dua pendekatan diatas. Umumya tidak

memerlukan keseluruhan rangkaian kata untuk dikenali. Untuk jenis aplikasi ini

dapat diselesaikan dengan menggunakan teknik connected word recognition. Pada

teknik connected word recognition kata yang dapat dikenali bisa terdiri dari dua

kata ataupun lebih. Contoh aplikasinya antara lain pemanggilan melalui ucapan

(voice dialing) pada telepon, perintah berbasis kata, diktasi, dan sebagainya.

Perintah berbasis kata dapat digunakan untuk memerintahkan komputer

dengan suara untuk menjalankan komputer, seperti mematikan, menyalakan, dan

menjalankan perintah-perintah yang ingin dioperasikan di layar komputer.

Telah ada beberapa penelitian yang berkaitan dengan speech recognition dan

connected word recognition, diantaranya yaitu:

1. Fitrilina [2] dalam penelitiannya yang berjudul “Pengenalan Ucapan Jenis

Isolated Word Recognition Berdasarkan Koefisien Parameter Linier dengan

Menggunakan Continuous Hidden Markov Model (CHMM) Tipe Bakis” yang

2

membahas tentang pengenalan ucapan menggunakan parameter linier dan

CHMM.

2. Afrizal Rio[1] dalam penelitiannya yang berjudul ”Pengenalan Ucapan

dalam Tipe Connected Digit Recognition dengan Menggunakan Continuous

Hidden Markov Model” yang membahas tentang Pengenalan ucapan yang

digunakan untuk mengenali angka satu sampai sembilan, dimana parameter

ucapan yang digunakan yaitu spektrum frekuensi yang disegmentasi dan

proses pengenalannya menggunakan CHMM.

3. Siska Aulia [5] dalam penelitiannya yang berjudul “Implementasi

Pengenalan Kata Dengan Metode Mel Frequency Cepstrum Coeffecient Dan

Hidden Markov Model Untuk Mengontrol Gerak Robot Mobil Penjejak

Identifikasi Warna”, aplikasi pengenalan suara diimplementasikan pada robot

mobil untuk mendeteksi warna sesuai dengan perintah yang diucapkan.

Berdasarkan pemikiran inilah penulis mengangkat tugas akhir yang berjudul:

“Perancangan Sistem Pengenalan Ucapan Tipe Connected Word Dengan Metode

MFCC Dan Hidden Markov Model (HMM) Untuk Mengakses Aplikasi

Komputer”.

Pada tugas akhir ini output dari pengenalan ucapan akan digunakan sebagai input

atau perintah untuk mengakses (membuka dan menutup) aplikasi yang ada

dikomputer. Perintah tersebut dalam pengucapannya dieja atas dua kata.

1.2 Tujuan Penelitian

3

Penelitian tugas akhir ini bertujuan untuk :

1. Merancang sistem pengenalan ucapan tipe connected word recognition.

2. Menganalisa kinerja sistem pengenalan ucapan tipe connected word

recognition dengan menggunakan metode Mel Frequency Cepstrum

Coefficient (MFCC) dan Hidden Markov Model (HMM) pada akses

aplikasi komputer.

1.3 Manfaat Penelitian

Tugas akhir ini diharapkan dapat memberikan gambaran tentang konsep

sistem pengenalan ucapan tipe connected word recognition. Hasil tugas akhir ini

nantinya dapat dikembangkan dan dimanfaatkan pada sistem command & control

untuk menjalankan aplikasi komputer, untuk pengontrolan alat-alat di industri

ataupun pengontrolan robotik, diktasi dan lain-lain.

1.4 Batasan Masalah

Adapun batasan masalah dari tugas akhir ini adalah:

1. Tugas akhir ini dirancang dengan menggunakan perangkat lunak Matlab

R.2010a dengan input masukan adalah suara manusia dari microphone

dengan format suara “.wav”.

2. Input kata yang dapat dikenali hanya terdiri dari dua kata.

3. Kata yang dapat dikenali adalah perpaduan antara kata utama dengan kata

yang kedua, dimana kata pertama terdiri dari “buka dan tutup” dan kata

kedua terdiri dari “word, excel, dan powerpoint”.

4

4. Sistem hanya dapat mengenali kata yang terbatas pada kata yang telah

disebutkan diatas.

5. Sistem yang dirancang ini hanya mengetahui pola kata sedangkan

indentitas sumber suara diabaikan.

6. Sistem pengenalan ucapan ini menggunakan jenis connected word

recognition. Pada proses ekstraksi parameter digunakan metode Mel

Frequency Cepstrum Coefficient (MFCC), sedangkan untuk training dan

testing pola pengenalan suara digunakan metoda Hidden Markov Model .

7. Sinyal diasumsikan ideal, yaitu tidak memperhitungkan noise.

1.5 Sistematika Penulisan

Bab I Pendahuluan, berisi tentang latar belakang, tujuan

penelitian, manfaat penelitian, batasan masalah, dan

sistematika penulisan.

Bab II Penjelasan teori dasar pengolahan sinyal suara yang terdiri dari

ekstraksi parameter menggunakan metoda Mel Frequency

Cepstrum Coefficients (MFCC) dan penggunaan metoda

Hidden Markov Model (HMM) dalam pengenalan ucapan tipe

connected word recognition, serta teori mengenai array dan

membuka aplikasi komputer dengan perintah suara.

Bab III Berisi tentang rancangan dan langkah-langkah dalam proses

pengenalan pembicara menggunakan metoda Mel Frequency

Cepstrum Coefficients (MFCC) dan pengenalan ucapan yang

5

menggunakan Hidden Markov Model (HMM) untuk

mengakses aplikasi komputer.

Bab IV Hasil penelitian dan analisis serta pembahasan dari penelitian

tugas akhir ini.

Bab V Penutup yang berisi kesimpulan dan saran.

6

bab i

Documents