representasi dan kompresi audio

Representasi Suara dan Kompresi Audio

Konsep Dasar (1)

Suara (Sound) adalah

fenomena fisik yang dihasilkan oleh getaran benda getaran suatu benda yang berupa sinyal analog dengan amplitudo yang berubah secara kontinyu terhadap waktu.

Suara/bunyi biasanya merambat melalui udara. Suara/bunyi tidak bisa merambat melalui ruang hampa.

Konsep Dasar (2)

Suara dihasilkan oleh getaran suatu benda. Selama bergetar, perbedaan tekanan terjadi di udara sekitarnya. Pola osilasi yang terjadi dinamakan sebagai GELOMBANG. Gelombang mempunyai pola sama yang berulang pada interval tertentu, yang disebut sebagai PERIODE.

Contoh suara periodik : instrument musik, nyanyian burung, dll Contoh suara nonperiodik : batuk, percikan ombak, dll

Konsep Dasar (3)

Suara berkaitan erat dengan:

Frekuensi

Banyaknya periode dalam 1 detik Satuan : Hertz (Hz) atau cycles per second (cps) Berdasarkan frekuensi, suara dibagi menjadi:

Infrasound Pendengaran manusia Ultrasound Hypersound

0Hz 20 Hz 20Hz 20 KHz 20KHz 1 GHz 1GHz 10 THz

Suara yang berada pada range pendengaran manusia sebagai AUDIO, dan gelombangnya sebagai ACCOUSTIC SIGNALS. Suara di luar range pendengaran manusia dapat dikatakan sebagai NOISE (getaran yang tidak teratur dan tidak berurutan dalam berbagai frekuensi, tidak dapat didengar manusia).

Konsep Dasar (4)

Amplitudo

Keras lemahnya bunyi atau tinggi rendahnya gelombang. Satuan amplitudo adalah meter (m) Bunyi mulai dapat merusak telinga jika tingkat volumenya lebih besar dari 85 dB dan pada ukuran 130 dB akan mampu membuat hancur gendang telingaKecepatan perambatan gelombang bunyi sampai ke telinga pendengar. Satuan yang digunakan : m/s Pada udara kering dengan suhu 20 C (68 F)m kecepatan rambat suara sekitar 343 m/s

Velocity

Representasi Suara (1)

Gelombang suara analog tidak dapat langsung direpresentasikan pada komputer. Komputer mengukur amplitudo pada satuan waktu tertentu untuk menghasilkan sejumlah angka. Tiap satuan pengukuran ini dinamakan SAMPLE.


ANALOG TO DIGITAL CONVERSION (ADC)

Adalah proses mengubah amplitudo gelombang bunyi ke dalam waktu interval tertentu (disebut juga sampling), sehingga menghasilkan representasi digital dari suara. Proses konversi sinyal analog ke digital secara sederhana dapat dilihat pada gambar berikut :


1. Membuang frekuensi tinggi dari source signal 2. Mengambil sample pada interval waktu tertentu (sampling) Teori Nyquist 3. Menyimpan amplitudo sample dan mengubahnya ke dalam bentuk diskrit (kuantisasi) 4. Merubah bentuk menjadi nilai biner.


Teori Nyquist Sampling Rate : Sebuah sinyal yang disampel dapat dikembalikan ke bentuk semula bilamana sampling rate besarnya minimum dua kali frekuensi tertinggi yang ada pada sinyal tersebut


DIGITAL TO ANALOG CONVERSION (DAC)

Adalah proses mengubah digital audio menjadi sinyal analog. DAC biasanya hanya menerima sinyal digital Pulse Code Modulation (PCM). PCM adalah representasi digital dari sinyal analog, dimana gelombang disample secara beraturan berdasarkan interval waktu tertentu, yang kemudian akan diubah ke biner. Proses pengubahan ke biner disebut Quantisasi. PCM ditemukan oleh insinyur dari Inggris, bernama Alec Revees pada tahun 1937. Contoh DAC adalah: soundcard, CDPlayer, IPod, mp3player

Perkembangan Format Audio

Berbagai Format Audio (1)

AAC (Advanced Audio Coding) [ .m4a ]

AAC bersifat lossy compression (data hasil kompresi tidak bisa dikembalikan lagi ke data sebelum dikompres secara sempurna, karena setelah dikompres terdapat data-data yang hilang). AAC merupakan audio codec yang menyempurnakan MP3 dalam hal medium dan high bit rates


WAVEFORM AUDIO [ .WAV ]

WAV adalah format audio standar Microsoft dan IBM untuk PC. WAV biasanya menggunakan coding PCM (Pulse Code Modulation) WAV adalah data tidak terkompres sehingga seluruh sampel audio disimpan semuanya di harddisk. Software yang dapat menciptakan WAV dari Analog Sound misalnya adalah Windows Sound Recorder. WAV jarang sekali digunakan di internet karena ukurannya yang relatif besar. Maksimal ukuran file WAV adalah 2GB.


Audio Interchange File Format [.AIFF]

Merupakan format standar Macintosh. Software pendukung: Apple QuickTimeFormat untuk mendengarkan CD Audio CD Audio stereo berkualitas sama dengan PCM/WAV yang memiliki sampling rate 44100 Hz, 2 Channel (stereo) pada 16 bit. Durasi = 75 menit dan dynamic range = 95 dB.

Audio CD [.cda]


Mpeg Audio Layer 3 [.mp3]

Merupakan file dengan lossy compression. Sering digunakan di internet karena ukurannya yang cukup kecil dibandingkan ukuran audio file yang tidak terkompresi. Distandarisasi pada tahun 1991. Kompresi dilakukan dengan menghilangkan bagian-bagian bunyi yang kurang berguna bagi pendengaran manusia. Kompresi mp3 dengan kualitas 128 bits 44000 Hz biasanya akan menghasilkan file berukuran 3-4 MB, tetapi unsur panjang pendeknya lagu juga akan berpengaruh.


MIDI (Music Instrument Digital Interface)

Sebuah protokol standar untuk pertukaran informasi musik antara alat musik, synthesizer dan komputer. MIDI dikembangkan untuk memungkinkan keyboard (synthesizer) untuk bermain not - not yang dihasilkan oleh synthesizer yang lain. MIDI tidak merekam gelombang suara analog seperti tape recorder. MIDI mengencode fungsi fungsi keyboard, yang meliputi awalan not/nada, pitch, panjang, volume dan atribut musik, seperti vibrato.

Kompresi Audio (1)

Kompresi audio/video adalah salah satu bentuk kompresi data yang bertujuan untuk mengecilkan ukuran file audio/video dengan metode :

Lossy Cthnya : MP3, Vorbis, Musepack, AAC, ATRAC and Windows Media Audio Lossy (WMA lossy)). Loseless Cthnya : FLAC, Monkey's Audio (filename extension APE), WavPack (filename extension WV), TTA, ATRAC Advanced Lossless, Apple Lossless (filename extension m4a), MPEG-4 SLS, MPEG-4 ALS, MPEG-4 DST,Windows Media Audio Lossless (WMA Lossless), and Shorten (SHN)

Kompresi Audio (2)

Kompresi dilakukan pada saat pembuatan file audio/video dan pada saat distribusi file audio/video tersebut. Kendala kompresi audio:

Perkembangan sound recording yang cepat dan beranekaragam Nilai dari audio sample berubah dengan cepat

Kompresi Audio (3)

Lossless audio codec tidak mempunyai masalah dalam kualitas suara, penggunaannya dapat difokuskan pada:

Kecepatan kompresi dan dekompresi Derajat kompresi Dukungan hardware dan software

Lossy audio codec penggunaannya difokuskan pada:

Kualitas audio Faktor kompresi Kecepatan kompresi dan dekompresi Inherent latency of algorithm (penting bagi real-time streaming) Dukungan hardware dan software

Kompresi Audio (4)

Metode Kompresi Audio

Metode Transformasi

Menggunakan algoritma seperti MDCT (Modified Discreate Cosine Transform) untuk mengkonversikan gelombang bunyi ke dalam sinyal digital agar tetap dapat didengar oleh manusia (20 Hz s/d 20kHz) , yaitu menjadi frekuensi 2 s/d 4kHz dan 96 dB. Menggunakan LPC (Linier Predictive Coding) yaitu digunakan untuk speech (pidato), di mana LPC akan menyesuaikan sinyal data pada suara manusia, kemudian mengirimkannya ke pendengar. Jadi seperti layaknya komputer yang berbicara dengan bahasa manusia dengan kecepatan 2,4 kbps

Metode Waktu

Kompresi Audio (5)

Teknik kompresi MP3 Beberapa karakteristik dari MP3 memanfaatkan kelemahan pendengaran manusia.

Model psikoakustik

Model psikoakustik adalah model yang menggambarkan karakteristik pendengaran manusia. Salah satu karakteristik pendengaran manusia adalah memiliki batas frekuensi 20 Hz s/d 20 kHz, dimana suara yang memiliki frekuensi yang berada di bawah ambang batas ini tidak dapat didengar oleh manusia, sehingga suara seperti itu tidak perlu dikodekan.

Kompresi Audio (5)

Auditory masking

Manusia tidak mampu mendengarkan suara pada frekuensi tertentu dengan amplitudo tertentu jika pada frekuensi di dekatnya terdapat suara dengan amplitudo yang jauh lebih tinggi.

Kompresi Audio (6)

Critical band

Critical band merupakan daerah frekuensi tertentu dimana pendengaran manusia lebih peka pada frekuensi-frekuensi rendah, sehingga alokasi bit dan alokasi sub-band pada filter critical band lebih banyak dibandingkan frekuensi lebih tinggi.

Kompresi Audio (7)

Joint stereo

Terkadang dual channel stereo mengirimkan informasi yang sama. Dengan menggunakan joint stereo, informasi yang sama ini cukup ditempatkan dalam salah satu channel saja dan ditambah dengan informasi tertentu. Dengan teknik ini bitrate dapat diperkecil.

Kompresi Audio (8)

Beberapa persyaratan dari suatu encoder/decoder MP3:

Ukuran file terkompresi harus sekecil mungkin. Kualitas suara file yang telah terkompresi haruslah sedekat mungkin dengan file asli yang belum dikompresi. Tingkat kesulitan rendah, sehingga dapat direalisasikan dengan aplikasi yang mudah dibuat dan perangkat keras yang sederhana dengan konsumsi daya yang rendah

representasi dan kompresi audio

Documents