perangkat lunak untuk membuka aplikasi pada komputer dengan perintah suara menggunakan metode
TRANSCRIPT
7/18/2019 Perangkat Lunak Untuk Membuka Aplikasi Pada Komputer Dengan Perintah Suara Menggunakan Metode
http://slidepdf.com/reader/full/perangkat-lunak-untuk-membuka-aplikasi-pada-komputer-dengan-perintah-suara 1/7
PERANGKAT LUNAK UNTUK MEMBUKA APLIKASI PADA KOMPUTER
DENGAN PERINTAH SUARA MENGGUNAKAN METODE
MEL FREQUENCY CEPSTRUM COEFFICIENTS
Bobi Tri Yuliansyah
II D (Dua)
Program Studi Informatika
Fakultas Teknik
Universitas Muhammadiyah Bengkulu
Email bobby!amsen"gmail#$om
ABSTRAK
Perangkat lunak yang dibangun %ada tugas
akhir ini adalah sebuah %rogram yang da%at
membuka a%likasi %ada kom%uter menggunakan
%erintah suara &voice command '# Se$ara umum
suara yang masuk akan di$o$okan dengan data
suara yang telah ada#
(ika hasil dari %en$o$okan sama) maka
sistem akan mengeksekusi a%likasi yang telah
ditentukan sebelumnya# Permasalahannya adalah
bagaimana kom%uter da%at mengerti %erintah yang
diu$a%kan oleh manusia#
Metode yang digunakan dalam feature
e*tra$tion adalah Mel frequency Cepstrum
Coefficients &MF++'# Dalam MF++ sendiri
terda%an tu!uh taha%an yaitu) Pre-emphasis, Frame
Blockin, !indo"in, Fast Fourier #ransform,
Mel Frequency !apin, Discrete Cosine
#ransform dan Cepstral $ifterin # Untuk
mengurangi ,aktu %emrosesan saat %en$o$okan
suara maka digunakan -.Means +lustering untuk
membuat vektor data sebagai re%resentasi dari
keseluruhan sam%el data yang ada# /%likasi voice
command ini dibangun menggunakan Mi$rosoftvisual basi$ 0#
Pada %engu!ian dida%atkan %ersentase
keberhasilan sebesar 12)34 dalam hal keakuratan
%erintah suara yang diu!ikan terhada% seribu
sam%el data yang ada# Data tersebut dida%atkan
dari se%uluh orang yang terdiri dari lima orang
,anita dan lima orang %ria# Untuk memaksimalkan
%erforma a%likasi) di%erlukansuasana lingkungan
yang tenang) agar a%likasi da%at ber!alan dengan
benar# Kata Kunci : %oice Command, Mel Frequency
Cepstrum Coefficients (MFCC)
1. PENDAHULUAN
Manusia meru%akan mahluk sosial yang
memerlukan komunikasi dengan sesamanya dalam
kehidu%an sehari.hari# Suara meru%akan salah satu
media komunikasi yang %aling sering dan
umum digunakan oleh manusia# Manusia da%at
mem%roduksi suaranya dengan mudah tan%a
memerlukan energi yang besar# Suara
meru%akan salah satu $ara alami manusia untuk
berkomunikasi# Dengan suara manusia da%at
memberikan informasi mau%un %erintah# 5leh
karena itu dibutuhkan suatu teknologi yang
memungkinkan manusia da%at berkomunikasi
melalui suara untuk berinteraksi dengan kom%uter &voice command '#Perkembangan teknologi) yang
semakin %esat telah men$i%takan sebuah dunia
informasi#
6al ini semakin memi$u kebutuhan akan
adanya kemudahan dalam berinteraksi dengan
kom%uter & Suara manusia meru%akan salah satu
bentuk 'iometric yang da%at digunakan untuk
person identification& Selain itu dibandingkan
'iometric person authentication yang lain)
%engenalan suara %embi$ara & speaker reconition'tidak membutuhkan biaya yang besar# Perangkat
lunak %engenalan suara ini meru%akan $ikal bakal
mun$ulnya %erangkat lunak %engenalan suara
&voice reconition'#
Dengan adanya %erangkat lunak %engenalan
suara) manusia $uku% memberika %erintah.%erintah
se$ara lisan ke%ada kom%uter selayaknya
memberikan %erintah ke%ada orang lain# Perangkat
lunak yang dibuat dalam tugas akhir ini meru%akan
salah satu bagian dari artificial intellient yang
mere%likasikan organ %endengaran manusia untuk
da%at mengenali %erintah %embi$ara berdasarkan
Tugas Statistika IID
Universitas Mua!!a"i#a $engku%u 7
7/18/2019 Perangkat Lunak Untuk Membuka Aplikasi Pada Komputer Dengan Perintah Suara Menggunakan Metode
http://slidepdf.com/reader/full/perangkat-lunak-untuk-membuka-aplikasi-pada-komputer-dengan-perintah-suara 2/7
suara yang dimasukan# Perangkat lunak ini da%at
meminimalisir %enggunaan mouse#
Perangkat lunak ini dibuat dengan
menggunakan metode MF++ & Mel Frequency
Cepstrum Coefficients' feature etraction dan
didukung dengan -Means clusterin& MF++
feature etraction mengkonversikan sinyal suarakedalam bebera%a vektor data berguna bagi %roses
%engenalan %embi$ara# Terda%at 1 taha%an dalam
MF++ yaitu Pre *mphasi+e, Frame
Blockin,!indo"in, Fast Fourier #ransform,
Mel Frequency !arpin, Discrete Cosine
#ransform, dan Cepstral $ifterin& 6asil dari
MF++ feature etraction berukuran besar)
sehingga membutuhkan ,aktu %roses yang lama
bila langsung digunakan untuk %roses %engenalan
suara# 5leh karena itu) dibutuhkan %eranan darimetode -Means clusterin untuk membuat
bebera%a vektor %usat sebagai ,akil dari
kesuluruhan vektor data yang ada#
Metode Mel Frequency Cepstrum
Coefficients ini memiliki bebera%a kelebihan
diantaranya adalah mam%u menangka% informasi
%enting dalam sinyal suara) menghasilkan data
seminimal mungkin tan%a menghilangkan
informasi.informasi yang ada) dan mere%likasikan
organ %endengaran manusia dalam melakukan %erse%si terhada% sinyal suara#
Berdasarkan uraian di atas) %embangunan
%erangkat lunak ini da%at memudahkan user dalam
berinteraksi dengan kom%uter menggunakan
%erintah suara& 5leh karena itu) tugas akhir ini
diberi !udul Perangkat 8unak Untuk Membuka
/%likasi Pada -om%uter Dengan Perintah Suara
Menggunakan Metode Mel Frequency Cepstrum
Coefficients (MFCC) #
1.1 Maksud Dan Tujuan
1.1.1 Maksud
Maksud dari %enulisan tugas akhir ini adalah
untuk membangun %erangkat lunak yang
da%at membuka a%likasi di kom%uter dengan
%erintah suara menggunakan metode Mel
Frequency Cepstrum Coefficients &MF++' untuk
mem%ermudah user berinteraksi dengan kom%uter#
1.1.2 Tujuan
/da%un tu!uan dari tugas akhir ini adalahsebagai alat yang mem%ermudah manusia untuk
berinteraksi dengan kom%uter#
2. MODEL, ANALISA, DESAIN DAN
IMPLEMENTASI
Proses voice command %ada sistem da%at
di!elaskan sebagai berikut# Pertama.tama)
%engguna menentukan kata yang akan di!adikan
sebagai %erintah untuk membuka a%likasi tertentu
kemudian mengu$a%kannya %ada microfone )danmemilih a%likasi a%a yang akan dibuka oleh
%erintah tersebut#
Sistem akan menyim%an data tersebut dalam
sebuah database# Setelah itu barulah %engguna
mengu$a%kan kata yang men!adi %erintah tadi#
Sistem akan men$o$okan sinyal suara yang masuk
dengan data yang terda%at dalam tem%late# (ika
data sinyal sama) maka kom%uter akan
mengeksekusi a%likasi yang telah ditentukan
sebelumnya#
Feature etraction mengkonversikan sinal
suara kedalam bebera%a vektor data berguna bagi %roses %engenalan suara# Dalam MF++ & Mel
Frequency Cepstrum Coefficients ' sendiri terda%at
tu!uh taha%an yaitu Pre *mphasi+e, Frame
Blockin, !indo"in, Fast Fourier #ransform,
Mel Frequency !arpin, Discrete Cosine
#ransform, dan Cepstral lifterin )yang telah
di!elaskan %ada bab sebelumnya# Data hasil MF++
& Mel Frequency Cepstrum Coefficients ' Feature
etraction kemudian akan memasuki taha% -
Means Clusterin taha% ini membuat bebera%a
vektor %usat sebagai ,akil dari kesuluruhan vektor
data yang ada# Taha% men$o$okan sinyal adalah
taha% %erhitungan pro'a'ilitas kemiri%an %ola dari
tia%.tia% model sinyal yang mem%unyai
pro'a'ilitas kemiri%an yang tertinggi dan
berdasarkan %ada template&
2.1 Suara
Pada sistem %engenalan suara oleh manusia
terda%at tiga organ %enting yang saling
berhubungan yaitu telinga yang ber%eran sebagai
transduser dengan menerima sinyal masukan suara
dan mengubahnya men!adi sinyal syaraf) !aringan
Tugas Statistika IID
Universitas Mua!!a"i#a $engku%u 9
7/18/2019 Perangkat Lunak Untuk Membuka Aplikasi Pada Komputer Dengan Perintah Suara Menggunakan Metode
http://slidepdf.com/reader/full/perangkat-lunak-untuk-membuka-aplikasi-pada-komputer-dengan-perintah-suara 3/7
syaraf yang berfungsi mentransmisikan sinyal ke
otak) dan otak yang akan mengklasifikasi dan
mengidentifikasi informasi yang terkandung dalam
sinyal masukan#
2.2 Analss P!n"!nalan Suara
Dalam a%likasi ini terda%at : taha%an yaitu)
MF++) -. Means Clusterin ) %en$o$okan sinyal)
dan eksekusi %rogram# Se$ara umum %rogram
mengikuti alur berikut ini
2.2.1 Pr! Pr#$!ssn"
Sinyal suara yang akan di%roses bersifat
analog sehingga !ika akan dilakukan %engolahan
se$ara digital) sinyal suara tersebut harus
dikonversi men!adi sinyal digital) beru%a urutan
angka dengan tingkat %resisi tertentu yang
dinamakan analo to diital conversion denganmenggunakan analo-todiital converter &/D+'&
-onse% -er!a /D+ terdiri dari tiga %roses
-eterangan konse% ker!a /D+
7# amplin adalah konversi sinyal kontinu dalam
domain ,aktu men!adi sinyal diskrit) melalui
%roses samplin sinyal %ada selang ,aktutertentu#
Sehingga !ika *2&t' adalah sinyal in%ut) maka
out%utnya adalah *2&nT') dengan T adalah
interval samplin #
& -uantisasi adalah %roses untuk membulatkan
nilai data kedalam bilangan bilangan tertentu
yang telah ditentukan terlebih dahulu&
;# Codin ) %ada %roses ini) tia% nilai diskrit yang
telah dida%at) dire%resentasikan dengan angka
binary n.bit#
%.1.1 Akuss Da&a
Data beru%a sinyal suara di%eroleh dengan
$ara merekam suara melalui mikrofon yang
dihubungkan dengan kom%uter# Perekaman suara
di dalam a%likasi menggunakan frekuensi sam%ling
standar <2226=#
Suara dengan format #"av ini bisa
menggunakan 70 'its> sample dan 7 untuk channel
mono& Durasi suara yang direkam a%abila lebih
%endek lebih mudah untuk diambil %erbedaanfiturnya# Dalam analisis ini digunakan $ontoh
durasi rekaman yang diambil adalah 9 detik#
dimana
? @ data sam%ling sinyal
Fs @ frekuensi sam%ling
dt @ durasi rekaman &detik'
bit @ !umlah bit resolusi
! @ 7 untuk mono atau 9 untuk stereo
2.2.% M'((
Tugas Statistika IID
Universitas Mua!!a"i#a $engku%u ;
7/18/2019 Perangkat Lunak Untuk Membuka Aplikasi Pada Komputer Dengan Perintah Suara Menggunakan Metode
http://slidepdf.com/reader/full/perangkat-lunak-untuk-membuka-aplikasi-pada-komputer-dengan-perintah-suara 4/7
Metode Mel Frequency Cepstrum
Coefficients &MF++' ini menggunakan bebera%a
%arameter yang akan ber%eran %enting dalam
menentukan tingkat keberhasilan %engenalan
sinal suara# Berikut ini adalah keseluruhan %roses
MF++ Feature etraction
2.2.%.1 Pr!)E*+ass
Pre-emphasis dilakukan untuk mem%er.baiki
sinal dari gangguan noise, sehingga da%at
meningkatkan tingkat akurasi dari %roses feature
etraction& Default dari nilai al%ha yang digunakan
dalam %roses pre-emphasis filterin adalah 2)A1#
2.2.%.2 'ra*! Bl#$kn"
6asil %erekaman suara meru%akan sinyal
analog yang berada dalam domain ,aktu yang
bersifat variant time) yaitu suatu fungsi yang
bergantung ,aktu# 5leh karena itu sinyal tersebut
harus di%otong.%otong dalam slot.slot ,aktu
tertentu agar da%at diangga% invariant# Sinyal suara
di%otong se%an!ang 92 milidetik #Setia% %otongan
tersebut disebut frame#
Untuk menghitung !umlah Frame digunakan
rumus
(umlah frame @ && I.'>M'C7'
I @ Sam%le rate
@ Sam%le %oint & Sam%le rate ,aktu framing
&s''
M @ >9
Potongan frame digambarkan se%erti gambar
diba,ah ini
2.2.%.% -nd#n"
Fungsi ,indo, yang %aling sering
digunakan dalam a%likasi s%eaker re$ognation
adalah 6amming indo,# Fungsi ini
menghasilkan sidelobe level yang tidak terlalu
tinggi &kurang lebih .:;dB' selain itu noise yang
dihasilkan %un tidak terlalu besar &kurang lebih
7#;0 BIS'#
indo, hamming
2.2.%./ ''T
FFT &Fast Fourier Transform' adalah teknik
%erhitungan $e%at dari DFT# FFT adalah DFT
dengan teknik %erhitungan yang $e%at dengan
memanfaatkan sifat %eriodikal dari transformasi
fourier# Perhatikan definisi dari FFT
/tau da%at dituliskan dengan
Untuk melihat nilai hasil FFT digunakan rumus
Tugas Statistika IID
Universitas Mua!!a"i#a $engku%u :
7/18/2019 Perangkat Lunak Untuk Membuka Aplikasi Pada Komputer Dengan Perintah Suara Menggunakan Metode
http://slidepdf.com/reader/full/perangkat-lunak-untuk-membuka-aplikasi-pada-komputer-dengan-perintah-suara 5/7
2.2.%.0 'l&!rank
Filter'ank menggunakan re%resentasi
konvolusi dalam melakukan filter terhada% sinyal#
-onvolusi da%at dilakukan dengan melakukan
multi%likasi antara s%ektrum sinyal dengan
koefisien filter'ank # Berikut ini adalah rumus yang
digunaka dalam %erhitungan filter'ank s#
2.2.%. D(T
Proses ini meru%akan langkah akhir dari
feature etraction# 6asil dari D+T ini adalah fitur.
fitur yang dibutuhkan oleh %enulis untuk
melakukan %roses analisa terhada% %engenalan
suara tersebut#
Menggunakan rumus
2.2.%.3 (!+s&ral L4&!rn"
6asil dari fungsi D+T adalah $e%strum
yang sebenarnya sudah meru%akan hasil akhir
dari %roses feature etraction# Teta%i) untuk
meningkatkan kualitas %engenalan) maka $e%strum
hasil dari D+T harus mengalami cepstral lifterin&
8 @ !umlah $e%stral $oeffi$ients
@ inde* dari $e%stral $oeffi$ients
2.2./ K)M!ans (lus&!rn"
Clusterin meru%akan faktor yanng %aling
fundamental dalam pattern reconation# Masalah
utama dari clusterin adalah menda%atkan
bebera%a nilai vektor %usat yang da%at me,akili
keseluruhan vektor dari hasil feature etraction# -.
means Clusterin adalah salah satu metode yangdigunakan untuk mem%artisi vektor hasil feature
etraction ke dalam k vektor %usat;G#
-Means Clusterin adalah %rroses
memetakan vektor.vektor yang berada %ada
lingku% ,ilayah yang luas besar men!adi se!umlah
tertentu &k' vektor# ilayah yang ter,akili oleh
vektor %usat hasil dari %roses kuantisasi disebut
sebagai cluster # Sebuah vektor %usat hasil dari
%roses kuantisasi dikenal sebagai code"ords#Sedangkan kum%ulan dari vektor %usat dikenal
sebagai code'ooks# Hambar berikut menun!ukan
hasil ilustrasi -Means Clusterin&
Ga*ar . 'ra*n"
-euntungan dari diim%lementasikannya . Means
Clusterin dalam mere%resentasikan speech
spectral vectors adalah
7# Mengurangi storae memory yang digunakan
untuk analisis informasi s%ektral#
9# Mengurangi %erhitungan yang digunakanuntuk menentukan kemiri%an dari vektor
s%ektral#
-elemahan dari %enggunaan . Means Clusterin
code'ooks dalam mere%resentasikan speech
spectral vectors adalah
7# Timbulnya s%ektral distorsi# 6al ini ter!adi
karena vektor yang dianalisa bukanlah vektor
asli) teta%i sudah mengalami %roses kuantisasi
9# torae yang digunakan untuk menyim%ancode'ooks vektor sering kali men!adi masalah#
Untuk !umlah code'ooks yang besar)
membutuhkan storage yang $uku% besar !uga#
2.2.0 P!n$#$#kan suara
Untuk da%at membuka a%likasi yang
diinginkan) maka data sinal baru yang masuk
akan di$o$okan dengan data yang telah ada dalam
data'ase sebelumnya# Setia% vektor dari model
yang diu!i$obakan) dibandingkan dan dihitung
euclidean distance-nya dengan semua vektor yang
ada %ada salah satu model database se$ara
bergantian#
Tugas Statistika IID
Universitas Mua!!a"i#a $engku%u 3
7/18/2019 Perangkat Lunak Untuk Membuka Aplikasi Pada Komputer Dengan Perintah Suara Menggunakan Metode
http://slidepdf.com/reader/full/perangkat-lunak-untuk-membuka-aplikasi-pada-komputer-dengan-perintah-suara 6/7
-emudian diambil distance yang %aling
minimum antara sebuah vektor %ada model yang
diu!i $obakan dengan semua vektor yang ada %ada
salah satu model database# Sehingga dida%atkan
minimum distance#
Berikut ini adalah gambar %erhitungan distan$e
6itung minimal distan$e dari setia%
$odebook yang ada# Disitulah diangga% sebagai
kemiri%an sinyal#
%. HASIL DAN DISKUSI
Dalam %engu!ian %engenalan suara ini)
terda%at 72 orang yang men!adi bahan u!i untuk
a%likasi voice command # Diantaranya terda%at
lima orang ,anita dan lima orang %ria dengan usia
antara 92 tahun sam%ai 9: tahun# Setia% orang
menda%atkan kesem%atan sebanyak 72 kali untuk
setia% a%likasi#
Sehingga dalam satu kata terda%at 722 kali
%er$obaan# Perhitungan akurasi) digunakan untuk
mengetahui sebera%a besar kesuksesan a%likasi
voi$e $ommand ini# -eterangan dikenali
meru%akan ke$o$okan %erintah dengan a%likasi
yang dieksekusi#
%.1 Hasl P!n"ujan P!rn&a
Dari hasil %ersentase masing.masing kata
maka dida%atkan nilai %ersentase keseluruhan
yaitu
75+84+61+69+66+73+82+60+62+73
10
∗ 722 4 @
705
10 ∗ 722 4 @ 12)3 4
%.1.1 Gra4k Hasl P!n"ujan
Berikut ini adalah grafik keseluruhan hasil
%engu!ian dari se%uluh a%likasi yang diu!ikan
/. KESIMPULAN DAN SARAN
-esim%ulan meru%akan ringkasan yang
diambil dari hasil analisis yang telah dilakukan#
Berisi tentang hasil kiner!a metode Mel Frequency
Cepstrum Coefficients &MF++' %ada a%likasi voice
command yang telah dibuat# Sedangkan saran
ditu!ukan ke%ada %engguna agar da%at
memaksimalkan kiner!a %erangkat lunak voice
command ini#
/.1 K!s*+ulan
Berdasarkan analisis yang telah dilakukanterhada% %embangunan a%likasi voice command
menggunakan metode mel freuen$y $e%strum
$oeffi$ients &MF++' maka da%at disim%ulkan
bah,a
7# /%likasi ini memiliki tingkat keberhasilan
sekitar 12)3 4#
9# -eberhasilan a%likasi ini masih tergantung
%ada sebera%a besar noise yang datang#
;# Metode Mel Freuen$y +e%strum $oeffisien
&MF++' ini da%at di%akai sebagai metode
yang baik dalam melakukan feature e*tra$tion#
:# Tingkat sensitifitas mi$ro%hone yang
digunakan !uga da%at mem%engaruhi hasil dari
a%likasi ini#
3# Pengguna da%at berinteraksi dengan kom%uter
menggunakan %erintah suara#
/.2 Saran
Tugas Statistika IID
Universitas Mua!!a"i#a $engku%u 0
7/18/2019 Perangkat Lunak Untuk Membuka Aplikasi Pada Komputer Dengan Perintah Suara Menggunakan Metode
http://slidepdf.com/reader/full/perangkat-lunak-untuk-membuka-aplikasi-pada-komputer-dengan-perintah-suara 7/7
/gar %erangkat lunak ini da%at berkembang
ke de%annya) %enulis menyarankan bebera%a hal
sebagai berikut yaitu
7# Meningkatkan kemam%uan sistem untuk
membedakan suara noise# Menambahkan
modul.modul %erintah se%erti short$ut %ada
a%likasi mi$rosoft ,ord dan lain.lain#9# /gar a%likasi voice command ini da%at
bermanfaat bagi %engguna kom%uter yang
mengalami $a$at fisik) maka di%erlukan
%erluasan %erintah %ada a%likasi#
;# Untuk kede%annya dihara%kan a%likasi ini
da%at meng$over semua %erintah dalam
kom%uter) sehingga da%at membantu interkasi
manusia dengan kom%uter men!adi lebih
mudah#
:# Dihara%kan ada metode yang benar.benar
da%at menghilangkan noise) sehingga
keberhasilan a%likasi akan semakin besar
DA'TAR PUSTAKA
-usumade,i) S#) .rtificial /ntellient ) ed# H# Ilmu#
922;) Yogyakarta#
%eo%le#revoledu#$om>$ardi#teknomo# &$ited 9277
7: !uni'#
%ra,ira) i#) soft"are pem'uka aplikasi komputer&
922A#
Bala)/#) %oice command reconation system 'ased
mfcc #922;#
Bimanto) I,an#) Multimedia Diital ,ed#andi#922;)
Yogyakarta
hadi)%#) penelompokan usia 'erdasarkan suara
menunakan metode -meansClusterin&922A#
Somantri)y #) penenalan pem'icara denan
ekstraksi ciri MFCC& 9220#
tanud!a!a) h#) penolahan sinyal diital 0sistem
pemrosesan sinyal ) ed# andi# 922A)
yogyakarta
Jesma,an)a#) /ll /bout Te$hnology# &$ited 9277
92 maret'
Tugas Statistika IID
Universitas Mua!!a"i#a $engku%u 1