representasi dan kompresi audio
TRANSCRIPT
Representasi Suara dan Kompresi Audio
Konsep Dasar (1)
Suara (Sound) adalah
fenomena fisik yang dihasilkan oleh getaran benda getaran suatu benda yang berupa sinyal analog dengan amplitudo yang berubah secara kontinyu terhadap waktu.
Suara/bunyi biasanya merambat melalui udara. Suara/bunyi tidak bisa merambat melalui ruang hampa.
Konsep Dasar (2)
Suara dihasilkan oleh getaran suatu benda. Selama bergetar, perbedaan tekanan terjadi di udara sekitarnya. Pola osilasi yang terjadi dinamakan sebagai GELOMBANG. Gelombang mempunyai pola sama yang berulang pada interval tertentu, yang disebut sebagai PERIODE.
Contoh suara periodik : instrument musik, nyanyian burung, dll Contoh suara nonperiodik : batuk, percikan ombak, dll
Konsep Dasar (3)
Suara berkaitan erat dengan:
Frekuensi
Banyaknya periode dalam 1 detik Satuan : Hertz (Hz) atau cycles per second (cps) Berdasarkan frekuensi, suara dibagi menjadi:
Infrasound Pendengaran manusia Ultrasound Hypersound
0Hz 20 Hz 20Hz 20 KHz 20KHz 1 GHz 1GHz 10 THz
Suara yang berada pada range pendengaran manusia sebagai AUDIO, dan gelombangnya sebagai ACCOUSTIC SIGNALS. Suara di luar range pendengaran manusia dapat dikatakan sebagai NOISE (getaran yang tidak teratur dan tidak berurutan dalam berbagai frekuensi, tidak dapat didengar manusia).
Konsep Dasar (4)
Amplitudo
Keras lemahnya bunyi atau tinggi rendahnya gelombang. Satuan amplitudo adalah meter (m) Bunyi mulai dapat merusak telinga jika tingkat volumenya lebih besar dari 85 dB dan pada ukuran 130 dB akan mampu membuat hancur gendang telingaKecepatan perambatan gelombang bunyi sampai ke telinga pendengar. Satuan yang digunakan : m/s Pada udara kering dengan suhu 20 C (68 F)m kecepatan rambat suara sekitar 343 m/s
Velocity
Representasi Suara (1)
Gelombang suara analog tidak dapat langsung direpresentasikan pada komputer. Komputer mengukur amplitudo pada satuan waktu tertentu untuk menghasilkan sejumlah angka. Tiap satuan pengukuran ini dinamakan SAMPLE.
Representasi Suara (2)
ANALOG TO DIGITAL CONVERSION (ADC)
Adalah proses mengubah amplitudo gelombang bunyi ke dalam waktu interval tertentu (disebut juga sampling), sehingga menghasilkan representasi digital dari suara. Proses konversi sinyal analog ke digital secara sederhana dapat dilihat pada gambar berikut :
Representasi Suara (3)
1. Membuang frekuensi tinggi dari source signal 2. Mengambil sample pada interval waktu tertentu (sampling) Teori Nyquist 3. Menyimpan amplitudo sample dan mengubahnya ke dalam bentuk diskrit (kuantisasi) 4. Merubah bentuk menjadi nilai biner.
Representasi Suara (4)
Teori Nyquist Sampling Rate : Sebuah sinyal yang disampel dapat dikembalikan ke bentuk semula bilamana sampling rate besarnya minimum dua kali frekuensi tertinggi yang ada pada sinyal tersebut
Representasi Suara (5)
DIGITAL TO ANALOG CONVERSION (DAC)
Adalah proses mengubah digital audio menjadi sinyal analog. DAC biasanya hanya menerima sinyal digital Pulse Code Modulation (PCM). PCM adalah representasi digital dari sinyal analog, dimana gelombang disample secara beraturan berdasarkan interval waktu tertentu, yang kemudian akan diubah ke biner. Proses pengubahan ke biner disebut Quantisasi. PCM ditemukan oleh insinyur dari Inggris, bernama Alec Revees pada tahun 1937. Contoh DAC adalah: soundcard, CDPlayer, IPod, mp3player
Perkembangan Format Audio
Berbagai Format Audio (1)
AAC (Advanced Audio Coding) [ .m4a ]
AAC bersifat lossy compression (data hasil kompresi tidak bisa dikembalikan lagi ke data sebelum dikompres secara sempurna, karena setelah dikompres terdapat data-data yang hilang). AAC merupakan audio codec yang menyempurnakan MP3 dalam hal medium dan high bit rates
Berbagai Format Audio (2)
WAVEFORM AUDIO [ .WAV ]
WAV adalah format audio standar Microsoft dan IBM untuk PC. WAV biasanya menggunakan coding PCM (Pulse Code Modulation) WAV adalah data tidak terkompres sehingga seluruh sampel audio disimpan semuanya di harddisk. Software yang dapat menciptakan WAV dari Analog Sound misalnya adalah Windows Sound Recorder. WAV jarang sekali digunakan di internet karena ukurannya yang relatif besar. Maksimal ukuran file WAV adalah 2GB.
Berbagai Format Audio (3)
Audio Interchange File Format [.AIFF]
Merupakan format standar Macintosh. Software pendukung: Apple QuickTimeFormat untuk mendengarkan CD Audio CD Audio stereo berkualitas sama dengan PCM/WAV yang memiliki sampling rate 44100 Hz, 2 Channel (stereo) pada 16 bit. Durasi = 75 menit dan dynamic range = 95 dB.
Audio CD [.cda]
Berbagai Format Audio (4)
Mpeg Audio Layer 3 [.mp3]
Merupakan file dengan lossy compression. Sering digunakan di internet karena ukurannya yang cukup kecil dibandingkan ukuran audio file yang tidak terkompresi. Distandarisasi pada tahun 1991. Kompresi dilakukan dengan menghilangkan bagian-bagian bunyi yang kurang berguna bagi pendengaran manusia. Kompresi mp3 dengan kualitas 128 bits 44000 Hz biasanya akan menghasilkan file berukuran 3-4 MB, tetapi unsur panjang pendeknya lagu juga akan berpengaruh.
Berbagai Format Audio (5)
MIDI (Music Instrument Digital Interface)
Sebuah protokol standar untuk pertukaran informasi musik antara alat musik, synthesizer dan komputer. MIDI dikembangkan untuk memungkinkan keyboard (synthesizer) untuk bermain not - not yang dihasilkan oleh synthesizer yang lain. MIDI tidak merekam gelombang suara analog seperti tape recorder. MIDI mengencode fungsi fungsi keyboard, yang meliputi awalan not/nada, pitch, panjang, volume dan atribut musik, seperti vibrato.
Kompresi Audio (1)
Kompresi audio/video adalah salah satu bentuk kompresi data yang bertujuan untuk mengecilkan ukuran file audio/video dengan metode :
Lossy Cthnya : MP3, Vorbis, Musepack, AAC, ATRAC and Windows Media Audio Lossy (WMA lossy)). Loseless Cthnya : FLAC, Monkey's Audio (filename extension APE), WavPack (filename extension WV), TTA, ATRAC Advanced Lossless, Apple Lossless (filename extension m4a), MPEG-4 SLS, MPEG-4 ALS, MPEG-4 DST,Windows Media Audio Lossless (WMA Lossless), and Shorten (SHN)
Kompresi Audio (2)
Kompresi dilakukan pada saat pembuatan file audio/video dan pada saat distribusi file audio/video tersebut. Kendala kompresi audio:
Perkembangan sound recording yang cepat dan beranekaragam Nilai dari audio sample berubah dengan cepat
Kompresi Audio (3)
Lossless audio codec tidak mempunyai masalah dalam kualitas suara, penggunaannya dapat difokuskan pada:
Kecepatan kompresi dan dekompresi Derajat kompresi Dukungan hardware dan software
Lossy audio codec penggunaannya difokuskan pada:
Kualitas audio Faktor kompresi Kecepatan kompresi dan dekompresi Inherent latency of algorithm (penting bagi real-time streaming) Dukungan hardware dan software
Kompresi Audio (4)
Metode Kompresi Audio
Metode Transformasi
Menggunakan algoritma seperti MDCT (Modified Discreate Cosine Transform) untuk mengkonversikan gelombang bunyi ke dalam sinyal digital agar tetap dapat didengar oleh manusia (20 Hz s/d 20kHz) , yaitu menjadi frekuensi 2 s/d 4kHz dan 96 dB. Menggunakan LPC (Linier Predictive Coding) yaitu digunakan untuk speech (pidato), di mana LPC akan menyesuaikan sinyal data pada suara manusia, kemudian mengirimkannya ke pendengar. Jadi seperti layaknya komputer yang berbicara dengan bahasa manusia dengan kecepatan 2,4 kbps
Metode Waktu
Kompresi Audio (5)
Teknik kompresi MP3 Beberapa karakteristik dari MP3 memanfaatkan kelemahan pendengaran manusia.
Model psikoakustik
Model psikoakustik adalah model yang menggambarkan karakteristik pendengaran manusia. Salah satu karakteristik pendengaran manusia adalah memiliki batas frekuensi 20 Hz s/d 20 kHz, dimana suara yang memiliki frekuensi yang berada di bawah ambang batas ini tidak dapat didengar oleh manusia, sehingga suara seperti itu tidak perlu dikodekan.
Kompresi Audio (5)
Auditory masking
Manusia tidak mampu mendengarkan suara pada frekuensi tertentu dengan amplitudo tertentu jika pada frekuensi di dekatnya terdapat suara dengan amplitudo yang jauh lebih tinggi.
Kompresi Audio (6)
Critical band
Critical band merupakan daerah frekuensi tertentu dimana pendengaran manusia lebih peka pada frekuensi-frekuensi rendah, sehingga alokasi bit dan alokasi sub-band pada filter critical band lebih banyak dibandingkan frekuensi lebih tinggi.
Kompresi Audio (7)
Joint stereo
Terkadang dual channel stereo mengirimkan informasi yang sama. Dengan menggunakan joint stereo, informasi yang sama ini cukup ditempatkan dalam salah satu channel saja dan ditambah dengan informasi tertentu. Dengan teknik ini bitrate dapat diperkecil.
Kompresi Audio (8)
Beberapa persyaratan dari suatu encoder/decoder MP3:
Ukuran file terkompresi harus sekecil mungkin. Kualitas suara file yang telah terkompresi haruslah sedekat mungkin dengan file asli yang belum dikompresi. Tingkat kesulitan rendah, sehingga dapat direalisasikan dengan aplikasi yang mudah dibuat dan perangkat keras yang sederhana dengan konsumsi daya yang rendah