aplikasi pengolahan suara

Upload: ahmad-fuad-hariri

Post on 10-Oct-2015

39 views

Category:

Documents


4 download

TRANSCRIPT

  • 5/20/2018 Aplikasi Pengolahan Suara

    1/19

    Kelompok 7

    Moh. Arif Samsul Rizal (07650152)

    Fakri

    Ali Saluki

    Fuad

    Yusron

    APLIKASI PENGOLAHAN SUARA

  • 5/20/2018 Aplikasi Pengolahan Suara

    2/19

    Pengenalan pola (pattern recognition) dapatdiartikan sebagai proses klasifikasi dari objek atau pola

    menjadi beberapa kategori atau kelas. Dan bertujuan

    untuk pengambilan keputusan (Theodoridis and

    Koutroumbas 2006, 1).

    Pola adalah bentuk atau model (atau, lebih abstrak,

    suatu set peraturan) yang dapat dipakai untuk membuat

    atau untuk menghasilkan suatu atau bagian dari

    sesuatu, khususnya jika sesuatu yang ditimbulkan

    mempunyai sejenis pola dasar yang dapat ditunjukkan

    atau terlihat, yang mana dapat dikatakan

    mempertunjukan pola.

  • 5/20/2018 Aplikasi Pengolahan Suara

    3/19

    SINYALSebuah sinyal adalah variasi dari variabel seperti gelombang

    tekanan udara dari suara, warna dari gambar, kedalaman sebuahpermukaan, temperature dari tubuh, tegangan atau arus darisebuah konduktor atau sistem biologis, cahaya, sinyalelektromagnetik radio, harga-harga barang, atau volume dan beratdari suatu objek. Sebuah sinyal membawa informasi mengenaisatu atau lebih atribut mengenai status, komposisi, arahpergerakan dan tujuan dari sumber. Dapat dikatakan, sebuahsinyal adalah sebuah media untuk membawa informasi mengenaikeadaan masa lalu, masa sekarang, dan masa yang akan datangdari suatu variabel (Vaseghi 2007, 3). Sinyal dapat diklarifikasikanmenjadi beberapa jenis yaitu, sinyal waktu, sinyal nilai, sinyalrandom, dan sinyal non-random.

    Pada umumnya variabel independen untuk sinyal satudimensi adalah waktu. Jika variabel independennya kontinu, makasinyal tersebut disebut sebagai sinyal waktu kontinu (continuous-

    time signal). Jika variable independennya diskrit, maka sinyaltersebut disebut sebagai sinyal waktu diskrit (discrete-time signal).

  • 5/20/2018 Aplikasi Pengolahan Suara

    4/19

    Gambar 2. 1 (a) Sinyal Waktu Kontinu dan (b) Sinyal Waktu Diskrit

    Sinyal waktu kontinu dengan amplitudo kontinubiasanya disebut sebagai sinyal analog. Contoh sinyalanalog adalah sinyal suara. Sinyal waktu diskrit denganamplitudo bernilai diskrit yang direpresentasikan oleh

    digit angka yang terbatas (finite), biasanya disebutsebagai sinyal digital.

    Berdasarkan jenis frekuensinya, sinyal terbagimenjadi sinyal stationary dan sinyal non-stationary.Frekuensi dalam sinyal stationary tidak berubah danselalu berulang dalam waktu, sedangkan frekuensi

  • 5/20/2018 Aplikasi Pengolahan Suara

    5/19

    Sinyal percakapanSinyal percakapan adalah sinyal yang dihasilkan

    dari suara manusia sewaktu melakukan percakapan.Sinyal percakapan merupakan kombinasi kompleks dari

    variasi tekanan udara yang melewati pita suara danvocal tract, yaitu mulut, lidah, gigi, bibir, dan langit-langitmulut. Speech (wicara) dihasilkan dari sebuah kerjasamaantara lungs (paru-paru), glottis (dengan vocal cords)dan articulation tract (mouth atau mulut dan nosecavity/rongga hidung). Sinyal suara terdiri dariserangkaian suara yang masingmasing menyimpansepotong informasi.

    Berdasarkan cara menghasilkannya, suara dapat

    dibagi menjadi voiced dan unvoiced. Voiced sounds atau

  • 5/20/2018 Aplikasi Pengolahan Suara

    6/19

    Mekanisme getaran suara sebenarnya sangat kompleks.Ketika celah suara menegang dan tekanan udara meningkat

    dari paru-paru, periode membuka dan menutupnya menjadi

    pendek dan frekuensi (pitch) sumber suara menjadi tinggi.

    Periode membuka dan menutup ini disebut getaran celahsuara. Sebaliknya, kondisi tekanan udara yang rendah

    menghasilkan suara frekuensi yang rendah. Sumber suara

    terdiri atas komponen fundamental dan harmonik yang

    dimodifikasi oleh jalur vocal untuk menghasilkan suara,

    seperti dalam menghasilkan bunyi vokal /a/ dan /o/.

    Ucapan manusia dihasilkan oleh suatu sistem produksi

    ucapan yang dibentuk oleh alat-alat ucap manusia. Proses

    tersebut dimulai dengan formulasi pesan dalam otak

    pembicara. Pesan tersebut akan diubah menjadi perintah-

  • 5/20/2018 Aplikasi Pengolahan Suara

    7/19

    Gambar : Foto Sinar X Penampang Alat-Alat Ucap Manusia

    Gambar diatas memperlihatkan foto sinar X penampang alat-alat

    ucap manusia. Vocal tract pada gambar tersebut ditandai oleh garis

    putus-putus, dimulai dari vocal cords atau glottis, dan berakhir pada

    mulut. Vocal tract terdiri daripharynx (koneksi antara esophagus dengan

    mulut) dan mulut. Panjang vocal tract pria pada umumnya sekitar 17cm.

  • 5/20/2018 Aplikasi Pengolahan Suara

    8/19

    Daerah pertemuan vocal tract ditentukan oleh lidah, bibir,rahang, dan bagian belakang langit-langit; luasnya berkisarantara 20 cm2 sampai dengan mendekati nol. Nasal tractmulai dari bagian belakang langit-langit dan berakhir padanostrils. Pada keadaan tertentu, suara nasal akan dikeluarkan

    melalui rongga ini.

    Sedangkan gambar 2.2 memperlihatkan model sistemproduksi ucapan manusia yang disederhanakan.Pembentukan ucapan dimulai dengan adanya hembusan

    udara yang dihasilkan oleh paru-paru. Cara kerjanya miripseperti piston atau pompa yang ditekan untuk menghasilkantekanan udara. Pada saat vocal cord berada dalam keadaantegang, aliran udara akan menyebabkan terjadinya vibrasipada vocal cord dan menghasilkan bunyi ucapan yang

    disebut voiced speech sound. Pada saat vocal cord beradadalam keadaan lemas, aliran udara akan melalui daerah yang

  • 5/20/2018 Aplikasi Pengolahan Suara

    9/19

    Gambar : Model Sistem Produksi Ucapan Manusia

    Ucapan dihasilkan sebagai rangkaian atau urutankomponen komponen bunyibunyi pembentuknya. Setiapkomponen bunyi yang berbeda dibentuk oleh perbedaanposisi, bentuk, serta ukuran dari alat-alat ucap manusiayang berubah-ubah selama terjadinya proses produksi

    ucapan.

  • 5/20/2018 Aplikasi Pengolahan Suara

    10/19

    Sistem tangap suara merupakan suatu sistem yangdigunakan untuk melakukan flashback atau sistem yang

    ditugaskan untuk melakukan tanggapan terhadap suatu

    inputan suara. Sistem ini sendiri terbentuk dari beberapa

    metode yang mendukung.

    HMM (Hiden Markov Model)

    sebuah model statistik dari sebuah sistem yang diasumsikan sebuah

    Proses Markov dengan parameter yang tak diketahui, dan tantangannya

    adalah menentukan parameter-parameter tersembunyi (state) dariparameter-parameter yang dapat diamati (observer). Parameter-

    parameter yang ditentukan kemudian dapat digunakan untuk analisis yang

    lebih komplek pada pengolahan suara

    NN (Neural Network)

    sistem ada tif an da at men ubah strukturn a untuk memecahkan

  • 5/20/2018 Aplikasi Pengolahan Suara

    11/19

    Konsep Permodelan Hmm

  • 5/20/2018 Aplikasi Pengolahan Suara

    12/19

    KONSEP PERMODELAN NN

  • 5/20/2018 Aplikasi Pengolahan Suara

    13/19

    Sistem pengenalan suara disini digambarkan padablok diagram gambar dibawah:

    Gambar Diagram blok sistem pengenalan suara.

    Secara garis besar, cara kerja sistem pengenalan

    suara ini ialah mula-mula sinyal suara manusia yang

    diterima dengan menggunakan microphone (sinyal

    analog) dicuplik sehingga menjadi sinyal digital dengan

  • 5/20/2018 Aplikasi Pengolahan Suara

    14/19

    Sinyal digital hasil cuplikan ini terlebih dulu dinormalisasi(disamakan panjang sinyal yang satu dengan yang lain)

    kemudian diproses awal menggunakan metode Linier

    Predictive Coding (LPC) sehingga didapat beberapa

    koefisien LPC yang merupakan feature (ciri) dari suarapembicaraan. Kemudian koefisien LPC tersebut diproses

    dengan Fast Fourier Transform (FFT) untuk

    mendapatkan sinyal pada domain frekuensi. Hal ini

    bertujuan agar perbedaan antar pola kata yang satudengan yang lain terlihat lebih jelas sehingga ekstraksi

    parameter sinyal memberikan hasil yang lebih baik. Hasil

    keluaran FFT ini merupakan masukan bagi jaringan saraf

    tiruan Back Propagation dimana jaringan saraf tiruan ini

  • 5/20/2018 Aplikasi Pengolahan Suara

    15/19

  • 5/20/2018 Aplikasi Pengolahan Suara

    16/19

    Pengertian KompressingDalam ilmu komputer dan teori informasi , kompresi data

    atau sumber pengkodean adalah proses encoding informasidengan menggunakan lebih sedikit bit (atau unit informasi-bantalan lainnya) dari sebuah unencoded representasi akan

    menggunakan, melalui penggunaan khusus pengkodeanskema.

    Dalam komputasi, deduplication data adalah teknikkompresi data khusus untuk menghilangkan data-grainedberlebihan kasar, biasanya untuk meningkatkan utilisasi

    storage.Seperti komunikasi apapun, dikompresi komunikasi datahanya bekerja jika kedua pengirim dan penerima informasimemahami skema pengkodean. Misalnya, teks ini masuk akalhanya jika penerima mengerti bahwa itu adalah dimaksudkanuntuk ditafsirkan sebagai karakter yang mewakili bahasaInggrisDemikian pula, data terkompresi hanya dapat dipahami

  • 5/20/2018 Aplikasi Pengolahan Suara

    17/19

    Kompresi berguna karena membantu mengurangi

    konsumsi sumber daya mahal, seperti hard disk space atau

    transmisi bandwidth . Pada sisi negatifnya, data dikompresi

    harus didekompresi untuk digunakan, dan ini pengolahan

    tambahan mungkin merugikan beberapa aplikasi. Sebagaicontoh, skema kompresi untuk video mungkin memerlukan

    perangkat keras mahal untuk video yang akan didekompresi

    cukup cepat untuk dilihat karena sedang decompressed

    (pilihan untuk dekompresi video secara penuh sebelum

    menonton mungkin nyaman, dan membutuhkan ruang

    penyimpanan untuk decompressed video). Rancangan skema

    kompresi data sehingga melibatkan trade-off antara berbagai

    faktor, termasuk tingkat kompresi, jumlah distorsi

    memperkenalkan (jika menggunakan skema kompresi lossy ),

  • 5/20/2018 Aplikasi Pengolahan Suara

    18/19

    Ada 2 kompresi data

    A. LossyLossy kompresi adalah suatu metode untuk mengkompresi data dan

    men-dekompresinya, data yang diperoleh mungkin berbeda dari yang aslinya

    tetapi cukup dekat perbedaaanya. Lossy kompresi ini paling sering digunakan

    untuk kompres data multimedia (Audio, gambar diam). Sebaliknya, kompresi

    lossless diperlukan untuk data teks dan file, seperti catatan bank, artikel teksdll.

    Format kompresi lossy mengalami generation loss yaitu jika melakukan

    berulang kali kompresi dan dekompresi file akan menyebabkan kehilangan

    kualitas secara progresif. hal ini berbeda dengan kompresi data lossless.

    ketika pengguna yang menerima file terkompresi secara lossy (misalnyauntuk mengurangi waktu download) file yang diambil dapat sedikit berbeda

    dari yang asli dilevel bit ketika tidak dapat dibedakan oleh mata dan telinga

    manusia untuk tujuan paling praktis.

    Metode ini menghasilkan ratio kompresi yang lebih besar daripada

    metode lossless. Misal terdapat image asli berukuran 12,249 bytes, kemudiandilakukan kompresi dengan JPEG kualitas 30 dan berukuran 1,869 bytes

  • 5/20/2018 Aplikasi Pengolahan Suara

    19/19

    B. Lossless

    Lossless data kompresi adalah kelas dari algoritma data kompresi yang

    memungkinkan data yang asli dapat disusun kembali dari data kompresi.

    Lossless data kompresi digunakan dalam berbagai aplikasi seperti format ZIP

    dan GZIP. Lossless juga sering digunakan sebagai komponen dalam

    teknologi kompresi data lossy. Kompresi Lossless digunakan ketika sesuatuyang penting pada kondisi asli. Beberapa format gambar sperti PNG atau GIF

    hanya menggunakan kompresi lossless, sedangkan yang lainnya sperti TIFF

    dan MNG dapat menggunakan metode lossy atau lossless.

    Metode lossless menghasilkan data yang identik dengan data aslinya,

    hal ini dibutuhkan untuk banyak tipe data, contohnya: executable code, wordprocessing files, tabulated numbers,dan sebagainya. Misalnya pada citra atau

    gambar dimana metode ini akan menghasilkan hasil yang tepat sama dengan

    citra semula, pixel per pixel sehingga tidak ada informasi yang hilang akibat

    kompresi. Namun ratio kompresi (Rasio kompresi yaitu, ukuran file yang

    dikompresi dibanding yang tak terkompresi dari file) dengan metode ini

    sangat rendah. Metode ini cocok untuk kompresi citra yang mengandung