aplikasi pengolahan suara

5/20/2018 Aplikasi Pengolahan Suara

1/19

Kelompok 7

Moh. Arif Samsul Rizal (07650152)

Fakri

Ali Saluki

Fuad

Yusron

APLIKASI PENGOLAHAN SUARA


2/19

Pengenalan pola (pattern recognition) dapatdiartikan sebagai proses klasifikasi dari objek atau pola

menjadi beberapa kategori atau kelas. Dan bertujuan

untuk pengambilan keputusan (Theodoridis and

Koutroumbas 2006, 1).

Pola adalah bentuk atau model (atau, lebih abstrak,

suatu set peraturan) yang dapat dipakai untuk membuat

atau untuk menghasilkan suatu atau bagian dari

sesuatu, khususnya jika sesuatu yang ditimbulkan

mempunyai sejenis pola dasar yang dapat ditunjukkan

atau terlihat, yang mana dapat dikatakan

mempertunjukan pola.


3/19

SINYALSebuah sinyal adalah variasi dari variabel seperti gelombang

tekanan udara dari suara, warna dari gambar, kedalaman sebuahpermukaan, temperature dari tubuh, tegangan atau arus darisebuah konduktor atau sistem biologis, cahaya, sinyalelektromagnetik radio, harga-harga barang, atau volume dan beratdari suatu objek. Sebuah sinyal membawa informasi mengenaisatu atau lebih atribut mengenai status, komposisi, arahpergerakan dan tujuan dari sumber. Dapat dikatakan, sebuahsinyal adalah sebuah media untuk membawa informasi mengenaikeadaan masa lalu, masa sekarang, dan masa yang akan datangdari suatu variabel (Vaseghi 2007, 3). Sinyal dapat diklarifikasikanmenjadi beberapa jenis yaitu, sinyal waktu, sinyal nilai, sinyalrandom, dan sinyal non-random.

Pada umumnya variabel independen untuk sinyal satudimensi adalah waktu. Jika variabel independennya kontinu, makasinyal tersebut disebut sebagai sinyal waktu kontinu (continuous-

time signal). Jika variable independennya diskrit, maka sinyaltersebut disebut sebagai sinyal waktu diskrit (discrete-time signal).


4/19

Gambar 2. 1 (a) Sinyal Waktu Kontinu dan (b) Sinyal Waktu Diskrit

Sinyal waktu kontinu dengan amplitudo kontinubiasanya disebut sebagai sinyal analog. Contoh sinyalanalog adalah sinyal suara. Sinyal waktu diskrit denganamplitudo bernilai diskrit yang direpresentasikan oleh

digit angka yang terbatas (finite), biasanya disebutsebagai sinyal digital.

Berdasarkan jenis frekuensinya, sinyal terbagimenjadi sinyal stationary dan sinyal non-stationary.Frekuensi dalam sinyal stationary tidak berubah danselalu berulang dalam waktu, sedangkan frekuensi


5/19

Sinyal percakapanSinyal percakapan adalah sinyal yang dihasilkan

dari suara manusia sewaktu melakukan percakapan.Sinyal percakapan merupakan kombinasi kompleks dari

variasi tekanan udara yang melewati pita suara danvocal tract, yaitu mulut, lidah, gigi, bibir, dan langit-langitmulut. Speech (wicara) dihasilkan dari sebuah kerjasamaantara lungs (paru-paru), glottis (dengan vocal cords)dan articulation tract (mouth atau mulut dan nosecavity/rongga hidung). Sinyal suara terdiri dariserangkaian suara yang masingmasing menyimpansepotong informasi.

Berdasarkan cara menghasilkannya, suara dapat

dibagi menjadi voiced dan unvoiced. Voiced sounds atau


6/19

Mekanisme getaran suara sebenarnya sangat kompleks.Ketika celah suara menegang dan tekanan udara meningkat

dari paru-paru, periode membuka dan menutupnya menjadi

pendek dan frekuensi (pitch) sumber suara menjadi tinggi.

Periode membuka dan menutup ini disebut getaran celahsuara. Sebaliknya, kondisi tekanan udara yang rendah

menghasilkan suara frekuensi yang rendah. Sumber suara

terdiri atas komponen fundamental dan harmonik yang

dimodifikasi oleh jalur vocal untuk menghasilkan suara,

seperti dalam menghasilkan bunyi vokal /a/ dan /o/.

Ucapan manusia dihasilkan oleh suatu sistem produksi

ucapan yang dibentuk oleh alat-alat ucap manusia. Proses

tersebut dimulai dengan formulasi pesan dalam otak

pembicara. Pesan tersebut akan diubah menjadi perintah-


7/19

Gambar : Foto Sinar X Penampang Alat-Alat Ucap Manusia

Gambar diatas memperlihatkan foto sinar X penampang alat-alat

ucap manusia. Vocal tract pada gambar tersebut ditandai oleh garis

putus-putus, dimulai dari vocal cords atau glottis, dan berakhir pada

mulut. Vocal tract terdiri daripharynx (koneksi antara esophagus dengan

mulut) dan mulut. Panjang vocal tract pria pada umumnya sekitar 17cm.


8/19

Daerah pertemuan vocal tract ditentukan oleh lidah, bibir,rahang, dan bagian belakang langit-langit; luasnya berkisarantara 20 cm2 sampai dengan mendekati nol. Nasal tractmulai dari bagian belakang langit-langit dan berakhir padanostrils. Pada keadaan tertentu, suara nasal akan dikeluarkan

melalui rongga ini.

Sedangkan gambar 2.2 memperlihatkan model sistemproduksi ucapan manusia yang disederhanakan.Pembentukan ucapan dimulai dengan adanya hembusan

udara yang dihasilkan oleh paru-paru. Cara kerjanya miripseperti piston atau pompa yang ditekan untuk menghasilkantekanan udara. Pada saat vocal cord berada dalam keadaantegang, aliran udara akan menyebabkan terjadinya vibrasipada vocal cord dan menghasilkan bunyi ucapan yang

disebut voiced speech sound. Pada saat vocal cord beradadalam keadaan lemas, aliran udara akan melalui daerah yang


9/19

Gambar : Model Sistem Produksi Ucapan Manusia

Ucapan dihasilkan sebagai rangkaian atau urutankomponen komponen bunyibunyi pembentuknya. Setiapkomponen bunyi yang berbeda dibentuk oleh perbedaanposisi, bentuk, serta ukuran dari alat-alat ucap manusiayang berubah-ubah selama terjadinya proses produksi

ucapan.


10/19

Sistem tangap suara merupakan suatu sistem yangdigunakan untuk melakukan flashback atau sistem yang

ditugaskan untuk melakukan tanggapan terhadap suatu

inputan suara. Sistem ini sendiri terbentuk dari beberapa

metode yang mendukung.

HMM (Hiden Markov Model)

sebuah model statistik dari sebuah sistem yang diasumsikan sebuah

Proses Markov dengan parameter yang tak diketahui, dan tantangannya

adalah menentukan parameter-parameter tersembunyi (state) dariparameter-parameter yang dapat diamati (observer). Parameter-

parameter yang ditentukan kemudian dapat digunakan untuk analisis yang

lebih komplek pada pengolahan suara

NN (Neural Network)

sistem ada tif an da at men ubah strukturn a untuk memecahkan


11/19

Konsep Permodelan Hmm


12/19

KONSEP PERMODELAN NN


13/19

Sistem pengenalan suara disini digambarkan padablok diagram gambar dibawah:

Gambar Diagram blok sistem pengenalan suara.

Secara garis besar, cara kerja sistem pengenalan

suara ini ialah mula-mula sinyal suara manusia yang

diterima dengan menggunakan microphone (sinyal

analog) dicuplik sehingga menjadi sinyal digital dengan


14/19

Sinyal digital hasil cuplikan ini terlebih dulu dinormalisasi(disamakan panjang sinyal yang satu dengan yang lain)

kemudian diproses awal menggunakan metode Linier

Predictive Coding (LPC) sehingga didapat beberapa

koefisien LPC yang merupakan feature (ciri) dari suarapembicaraan. Kemudian koefisien LPC tersebut diproses

dengan Fast Fourier Transform (FFT) untuk

mendapatkan sinyal pada domain frekuensi. Hal ini

bertujuan agar perbedaan antar pola kata yang satudengan yang lain terlihat lebih jelas sehingga ekstraksi

parameter sinyal memberikan hasil yang lebih baik. Hasil

keluaran FFT ini merupakan masukan bagi jaringan saraf

tiruan Back Propagation dimana jaringan saraf tiruan ini


15/19


16/19

Pengertian KompressingDalam ilmu komputer dan teori informasi , kompresi data

atau sumber pengkodean adalah proses encoding informasidengan menggunakan lebih sedikit bit (atau unit informasi-bantalan lainnya) dari sebuah unencoded representasi akan

menggunakan, melalui penggunaan khusus pengkodeanskema.

Dalam komputasi, deduplication data adalah teknikkompresi data khusus untuk menghilangkan data-grainedberlebihan kasar, biasanya untuk meningkatkan utilisasi

storage.Seperti komunikasi apapun, dikompresi komunikasi datahanya bekerja jika kedua pengirim dan penerima informasimemahami skema pengkodean. Misalnya, teks ini masuk akalhanya jika penerima mengerti bahwa itu adalah dimaksudkanuntuk ditafsirkan sebagai karakter yang mewakili bahasaInggrisDemikian pula, data terkompresi hanya dapat dipahami


17/19

Kompresi berguna karena membantu mengurangi

konsumsi sumber daya mahal, seperti hard disk space atau

transmisi bandwidth . Pada sisi negatifnya, data dikompresi

harus didekompresi untuk digunakan, dan ini pengolahan

tambahan mungkin merugikan beberapa aplikasi. Sebagaicontoh, skema kompresi untuk video mungkin memerlukan

perangkat keras mahal untuk video yang akan didekompresi

cukup cepat untuk dilihat karena sedang decompressed

(pilihan untuk dekompresi video secara penuh sebelum

menonton mungkin nyaman, dan membutuhkan ruang

penyimpanan untuk decompressed video). Rancangan skema

kompresi data sehingga melibatkan trade-off antara berbagai

faktor, termasuk tingkat kompresi, jumlah distorsi

memperkenalkan (jika menggunakan skema kompresi lossy ),


18/19

Ada 2 kompresi data

A. LossyLossy kompresi adalah suatu metode untuk mengkompresi data dan

men-dekompresinya, data yang diperoleh mungkin berbeda dari yang aslinya

tetapi cukup dekat perbedaaanya. Lossy kompresi ini paling sering digunakan

untuk kompres data multimedia (Audio, gambar diam). Sebaliknya, kompresi

lossless diperlukan untuk data teks dan file, seperti catatan bank, artikel teksdll.

Format kompresi lossy mengalami generation loss yaitu jika melakukan

berulang kali kompresi dan dekompresi file akan menyebabkan kehilangan

kualitas secara progresif. hal ini berbeda dengan kompresi data lossless.

ketika pengguna yang menerima file terkompresi secara lossy (misalnyauntuk mengurangi waktu download) file yang diambil dapat sedikit berbeda

dari yang asli dilevel bit ketika tidak dapat dibedakan oleh mata dan telinga

manusia untuk tujuan paling praktis.

Metode ini menghasilkan ratio kompresi yang lebih besar daripada

metode lossless. Misal terdapat image asli berukuran 12,249 bytes, kemudiandilakukan kompresi dengan JPEG kualitas 30 dan berukuran 1,869 bytes


19/19

B. Lossless

Lossless data kompresi adalah kelas dari algoritma data kompresi yang

memungkinkan data yang asli dapat disusun kembali dari data kompresi.

Lossless data kompresi digunakan dalam berbagai aplikasi seperti format ZIP

dan GZIP. Lossless juga sering digunakan sebagai komponen dalam

teknologi kompresi data lossy. Kompresi Lossless digunakan ketika sesuatuyang penting pada kondisi asli. Beberapa format gambar sperti PNG atau GIF

hanya menggunakan kompresi lossless, sedangkan yang lainnya sperti TIFF

dan MNG dapat menggunakan metode lossy atau lossless.

Metode lossless menghasilkan data yang identik dengan data aslinya,

hal ini dibutuhkan untuk banyak tipe data, contohnya: executable code, wordprocessing files, tabulated numbers,dan sebagainya. Misalnya pada citra atau

gambar dimana metode ini akan menghasilkan hasil yang tepat sama dengan

citra semula, pixel per pixel sehingga tidak ada informasi yang hilang akibat

kompresi. Namun ratio kompresi (Rasio kompresi yaitu, ukuran file yang

dikompresi dibanding yang tak terkompresi dari file) dengan metode ini

sangat rendah. Metode ini cocok untuk kompresi citra yang mengandung

aplikasi pengolahan suara

Documents