bab i
TRANSCRIPT
BAB I
PENDAHULUAN
1.1 Latar Belakang
Pada prinsipnya teknologi dibuat untuk mempermudah dan membantu
manusia dalam melakukan pekerjaannya. Saat ini perkembangan teknologi sudah
sangat pesat. Salah satunya adalah Artificial Intelligent atau kecerdasan buatan.
Aplikasi dari teknologi ini adalah Biometric Recognition. Biometrik merupakan
suatu metoda yang digunakan untuk mengenali manusia berdasarkan pada satu
atau lebih ciri-ciri fisik atau tingkah laku yang unik. Salah satu jenis teknologi
biometrik adalah pengenalan suara (voice recognition). Suara yang dimaksudkan
adalah sinyal suara yang dihasilkan langsung dari indera bicara pengakses. Voice
recognition memiliki dua bagian, yaitu speech recognition dan speaker
recognition. Speech recognition adalah proses identifikasi suara berdasarkan kata
yang diucapkan. Adapun speaker recognition merupakan proses pengenalan suara
berdasarkan orang yang berbicara.
Hampir semua sistem pengenalan suara melakukan ekstraksi parameter untuk
menampilkan bentuk sinyal dari kata yang diucapkan. Salah satu dari ekstraksi
parameter dapat dilakukan dengan menggunakan Mel Frequency Cepstrum
Coefficients (MFCC). Untuk pemodelan ucapan manusia dalam suatu sistem
pengenalan ucapan dapat dilakukan dengan menggunakan pemodelan statistik.
Salah satu pemodelan statistik adalah Hidden Markov Model (HMM). HMM
1
mampu memberikan mekanisme yang efisien untuk memodelkan secara statistik
keragaman dalam ucapan. Selain itu, HMM juga memiliki pelatihan yang efisien.
Penelitian tentang isolated word Recognition merupakan teknik paling dasar
pada pengenalan ucapan [1]. Juga merupakan bentuk pengenalan ucapan yang
cepat dan umum digunakan, namun memiliki keterbatasan pada aplikasinya.
Karena kata-kata yeng terisolasi jarang terjadi. Disisi lain bentuk continous
speech recognition merupakan teknik yang cukup kompleks dalam komputasinya
karena membutuhkan proses pelatihan dalam jumlah cukup banyak. Banyak
keperluan aplikasi berada diantara dua pendekatan diatas. Umumya tidak
memerlukan keseluruhan rangkaian kata untuk dikenali. Untuk jenis aplikasi ini
dapat diselesaikan dengan menggunakan teknik connected word recognition. Pada
teknik connected word recognition kata yang dapat dikenali bisa terdiri dari dua
kata ataupun lebih. Contoh aplikasinya antara lain pemanggilan melalui ucapan
(voice dialing) pada telepon, perintah berbasis kata, diktasi, dan sebagainya.
Perintah berbasis kata dapat digunakan untuk memerintahkan komputer
dengan suara untuk menjalankan komputer, seperti mematikan, menyalakan, dan
menjalankan perintah-perintah yang ingin dioperasikan di layar komputer.
Telah ada beberapa penelitian yang berkaitan dengan speech recognition dan
connected word recognition, diantaranya yaitu:
1. Fitrilina [2] dalam penelitiannya yang berjudul “Pengenalan Ucapan Jenis
Isolated Word Recognition Berdasarkan Koefisien Parameter Linier dengan
Menggunakan Continuous Hidden Markov Model (CHMM) Tipe Bakis” yang
2
membahas tentang pengenalan ucapan menggunakan parameter linier dan
CHMM.
2. Afrizal Rio[1] dalam penelitiannya yang berjudul ”Pengenalan Ucapan
dalam Tipe Connected Digit Recognition dengan Menggunakan Continuous
Hidden Markov Model” yang membahas tentang Pengenalan ucapan yang
digunakan untuk mengenali angka satu sampai sembilan, dimana parameter
ucapan yang digunakan yaitu spektrum frekuensi yang disegmentasi dan
proses pengenalannya menggunakan CHMM.
3. Siska Aulia [5] dalam penelitiannya yang berjudul “Implementasi
Pengenalan Kata Dengan Metode Mel Frequency Cepstrum Coeffecient Dan
Hidden Markov Model Untuk Mengontrol Gerak Robot Mobil Penjejak
Identifikasi Warna”, aplikasi pengenalan suara diimplementasikan pada robot
mobil untuk mendeteksi warna sesuai dengan perintah yang diucapkan.
Berdasarkan pemikiran inilah penulis mengangkat tugas akhir yang berjudul:
“Perancangan Sistem Pengenalan Ucapan Tipe Connected Word Dengan Metode
MFCC Dan Hidden Markov Model (HMM) Untuk Mengakses Aplikasi
Komputer”.
Pada tugas akhir ini output dari pengenalan ucapan akan digunakan sebagai input
atau perintah untuk mengakses (membuka dan menutup) aplikasi yang ada
dikomputer. Perintah tersebut dalam pengucapannya dieja atas dua kata.
1.2 Tujuan Penelitian
3
Penelitian tugas akhir ini bertujuan untuk :
1. Merancang sistem pengenalan ucapan tipe connected word recognition.
2. Menganalisa kinerja sistem pengenalan ucapan tipe connected word
recognition dengan menggunakan metode Mel Frequency Cepstrum
Coefficient (MFCC) dan Hidden Markov Model (HMM) pada akses
aplikasi komputer.
1.3 Manfaat Penelitian
Tugas akhir ini diharapkan dapat memberikan gambaran tentang konsep
sistem pengenalan ucapan tipe connected word recognition. Hasil tugas akhir ini
nantinya dapat dikembangkan dan dimanfaatkan pada sistem command & control
untuk menjalankan aplikasi komputer, untuk pengontrolan alat-alat di industri
ataupun pengontrolan robotik, diktasi dan lain-lain.
1.4 Batasan Masalah
Adapun batasan masalah dari tugas akhir ini adalah:
1. Tugas akhir ini dirancang dengan menggunakan perangkat lunak Matlab
R.2010a dengan input masukan adalah suara manusia dari microphone
dengan format suara “.wav”.
2. Input kata yang dapat dikenali hanya terdiri dari dua kata.
3. Kata yang dapat dikenali adalah perpaduan antara kata utama dengan kata
yang kedua, dimana kata pertama terdiri dari “buka dan tutup” dan kata
kedua terdiri dari “word, excel, dan powerpoint”.
4
4. Sistem hanya dapat mengenali kata yang terbatas pada kata yang telah
disebutkan diatas.
5. Sistem yang dirancang ini hanya mengetahui pola kata sedangkan
indentitas sumber suara diabaikan.
6. Sistem pengenalan ucapan ini menggunakan jenis connected word
recognition. Pada proses ekstraksi parameter digunakan metode Mel
Frequency Cepstrum Coefficient (MFCC), sedangkan untuk training dan
testing pola pengenalan suara digunakan metoda Hidden Markov Model .
7. Sinyal diasumsikan ideal, yaitu tidak memperhitungkan noise.
1.5 Sistematika Penulisan
Bab I Pendahuluan, berisi tentang latar belakang, tujuan
penelitian, manfaat penelitian, batasan masalah, dan
sistematika penulisan.
Bab II Penjelasan teori dasar pengolahan sinyal suara yang terdiri dari
ekstraksi parameter menggunakan metoda Mel Frequency
Cepstrum Coefficients (MFCC) dan penggunaan metoda
Hidden Markov Model (HMM) dalam pengenalan ucapan tipe
connected word recognition, serta teori mengenai array dan
membuka aplikasi komputer dengan perintah suara.
Bab III Berisi tentang rancangan dan langkah-langkah dalam proses
pengenalan pembicara menggunakan metoda Mel Frequency
Cepstrum Coefficients (MFCC) dan pengenalan ucapan yang
5
menggunakan Hidden Markov Model (HMM) untuk
mengakses aplikasi komputer.
Bab IV Hasil penelitian dan analisis serta pembahasan dari penelitian
tugas akhir ini.
Bab V Penutup yang berisi kesimpulan dan saran.
6