bab 2 landasan teori -...

22
BAB 2 LANDASAN TEORI 2.1. Computer Vision Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan dunia yang dilihat dalam satu atau lebih citra dan merekonstruksikan properti-properti yang ada seperti bentuk, iluminasi dan distribusi warna (Szeliski, 2011, p. 3). Baik manusia maupun hewan dapat dengan sangat mudah mendeskripsikan citra, seperti mendeskripsikan objek, cahaya, bayangan, nama orang, ekspresi wajah, dan sebagainya, sedangkan algoritma Computer Vision sangat rentan terhadap kesalahan. Secara umum, kesulitan untuk menangkap perseptual suatu citra dapat dianggap sama dengan kesulitan pada algoritma kognitif seperti pembuktian logika dan perencanaan pada bidang Artificial Intelligence (Szeliski, 2011, p. 3). 2.2. Citra Digital Citra dapat dinyatakan sebagai suatu fungsi dua dimensi ݕ ,ݔdengan ݔmaupun ݕadalah posisi koordinat sedangkan merupakan amplitudo pada posisi ݕ,ݔyang sering dikenal sebagai intensitas atau grayscale (Gonzalez & Woods, 2002, p. 1). Ketika nilai ݔ, ݕ, dan amplitudo terbatas dan bernilai diskrit, citra tersebut dikatakan sebagai citra digital. Pemrosesan citra digital menunjuk ke suatu proses pengolahan suatu citra sebagai input dan output dengan tujuan untuk melakukan ekstraksi atribut dari citra tersebut (Gonzalez & Woods, 2002, p. 3).

Upload: dangminh

Post on 13-Mar-2019

215 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00523-mtif 2.pdf · Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

  

BAB 2

LANDASAN TEORI

2.1. Computer Vision

Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

dunia yang dilihat dalam satu atau lebih citra dan merekonstruksikan properti-properti

yang ada seperti bentuk, iluminasi dan distribusi warna (Szeliski, 2011, p. 3).

Baik manusia maupun hewan dapat dengan sangat mudah mendeskripsikan citra,

seperti mendeskripsikan objek, cahaya, bayangan, nama orang, ekspresi wajah, dan

sebagainya, sedangkan algoritma Computer Vision sangat rentan terhadap kesalahan.

Secara umum, kesulitan untuk menangkap perseptual suatu citra dapat dianggap sama

dengan kesulitan pada algoritma kognitif seperti pembuktian logika dan perencanaan

pada bidang Artificial Intelligence (Szeliski, 2011, p. 3).

2.2. Citra Digital

Citra dapat dinyatakan sebagai suatu fungsi dua dimensi , dengan maupun

adalah posisi koordinat sedangkan merupakan amplitudo pada posisi , yang

sering dikenal sebagai intensitas atau grayscale (Gonzalez & Woods, 2002, p. 1). Ketika

nilai , , dan amplitudo terbatas dan bernilai diskrit, citra tersebut dikatakan sebagai

citra digital.

Pemrosesan citra digital menunjuk ke suatu proses pengolahan suatu citra sebagai

input dan output dengan tujuan untuk melakukan ekstraksi atribut dari citra tersebut

(Gonzalez & Woods, 2002, p. 3).

Page 2: BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00523-mtif 2.pdf · Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

10  

  

2.3. Properti Cahaya pada Citra Digital

Suatu citra digital merupakan komposisi dari sampel titik-titik (pixel) yang

merepresentasikan nilai intensitas atau warna. Nilai-nilai ini berasal dari pencahayaan,

refleksi, dan bayangan. Fenomena yang berhubungan dengan persepsi citra yang

ditangkap pada mata manusia meliputi kecerahan (brightness) dan kontras.

2.3.1 Illumination/Lighting

Iluminasi atau pencahayaan merupakan properti cahaya yang ada pada scene yang

disebabkan oleh adanya sumber cahaya. Sumber cahaya secara umum dapat dibedakan

menjadi sumber titik dan sumber cahaya area (Szeliski, 2011, p. 54).

Sumber cahaya titik berasal dari satu lokasi tertentu pada space, misalnya cahaya

lampu ataupun titik yang berasal dari jarak tak hingga seperti cahaya matahari. Sumber

cahaya memiliki intensitas dan spektrum warna. Sumber cahaya area merupakan

kumpulan dari sumber cahaya titik pada suatu area, misalnya lampu fluorescent. Sumber

cahaya area cenderung untuk menyebarkan intensitas cahaya yang sama ke semua objek

pada scene.

Iluminasi diukur sebagai jumlah cahaya (photon) yang mencapai permukaan

objek. Satuan iluminasi adalah lux/m2 atau lumens/m2. Iluminasi dapat diukur

menggunakan lux meter. Semakin dekat sumber cahaya terhadap area yang disinari,

semakin tinggi pula nilai iluminasinya.

Iluminasi yang jatuh pada suatu permukaan dapat disimbolkan dengan . Pada

suatu citra digital, distribusi iluminasi untuk setiap pixel dapat disimbolkan dengan

, (Rahman, 1995).

Page 3: BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00523-mtif 2.pdf · Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

11  

  

2.3.2 Reflectance

Reflektansi adalah properti pada cahaya yang menyebar/dipantulkan jika cahaya

tersebut jatuh pada permukaan objek. Nilai reflektansi dapat diukur dengan menghitung

rasio cahaya yang dipantulkan terhadap jumlah cahaya yang datang. Reflektansi dapat

disimbolkan dengan , sedangkan distribusi reflektansi pada suatu citra dapat

disimbolkan dengan , (Rahman, 1995).

Berikut adalah model reflektansi menurut Szeliski (2011, p. 55).

1. Bidirectional Reflectance Distribution Function (BRDF)

BRDF merupakan fungsi empat dimensi yang mendeskripsikan seberapa banyak

gelombang yang datang pada arah insiden yang dipantulkan pada arah .

Fungsi BRDF dapat ditulis sebagai , , , ; .

Gambar 2.1 Model Bidirectional Reflectance Distribution Function

Fungsi BDRF bersifat resiprokal, karena peran dan dapat dipertukarkan

tanpa mengubah hasil. Kebanyakan permukaan bersifat isotropik, karena arah

cahaya yang pada permukaan tidak menentu. Untuk permukaan isotropik, BRDF

dapat disederhanakan menjadi , , | |; atau , , ; .

2. Diffuse Reflection

Komponen diffuse sering disebut sebagai refleksi matte/Lambertian. Komponen

ini akan menyebarkan cahaya pada jumlah yang sama ke segala arah. Dengan

demikian, nilai BDRF adalah konstan, yaitu , , ; .

Page 4: BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00523-mtif 2.pdf · Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

12  

  

3. Specular Reflection

Refleksi spekular merupakan pemantulan sempurna seperti cermin. Cahaya yang

datang dan menyentuh permukaan objek akan direfleksikan ke satu arah sesuai

dengan hukum pemantulan cahaya (law of reflection) yang menyatakan bahwa

sudut datang adalah sama dengan sudut pantul ( ).

4. Phong Reflection

Refleksi Phong adalah model empiris untuk iluminasi lokal. Phong

mendeskripsikan refleksi cahaya suatu permukaan sebagai kombinasi dari refleksi

diffuse pada permukaan kasar, refleksi spekular pada permukaan yang berkilau,

dan faktor dari ambient illumination yang merupakan cahaya yang berasal dari

hasil pemantulan sekitarnya (misalnya dinding, langit).

2.3.3 Luminance

Luminansi dideskripsikan sebagai banyaknya cahaya yang melewati atau dipancarkan

dari suatu area. Luminansi diukur pada suatu permukaan yang merefleksikan cahaya,

sehingga merupakan hasil perkalian antara iluminasi dan reflektansi. Luminansi seringkali

digunakan untuk mengukur refleksi dari suatu permukaan (Land & McCann, 1971).

Nilai luminansi mengindikasikan jumlah cahaya yang akan terdeteksi oleh

manusia yang melihat pada permukaan pada sudut tertentu. Oleh karenanya, luminansi

merupakan indikasi seberapa besar kecerahan (brightness) pada permukaan akan

dipersepsikan.

Pada citra digital, luminansi dapat disimbolkan dengan yaitu intensitas tiap pixel

pada citra. Nilai ini merupakan perkalian antara nilai iluminasi dan reflektansi pada

pixel tersebut dengan persamaannya adalah , , , (Rahman, 1995).

Page 5: BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00523-mtif 2.pdf · Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

13  

  

2.3.4 Brightness

Meskipun citra digital ditampilkan sebagai kumpulan elemen intensitas yang

diskrit, manusia mampu membedakan antara level intensitas yang berbeda. Brightness

(kecerahan) merupakan intensitas yang dipersepsikan oleh manusia, sehingga bersifat

subjektif. Penelitian menunjukkan bahwa kecerahan subjektif merupakan fungsi

logaritma dari intensitas cahaya (luminansi) yang masuk ke mata (Gonzalez & Woods,

2002, p. 38).

Gonzales dan Woods (2002, p. 40) menambahkan bahwa kecerahan yang

dipersepsikan tidak hanya terbatas pada fungsi intensitas karena dua fenomena, yaitu

fenomena Mach Bands dan kontras simultan. Fenomena Mach Bands merupakan

fenomena yang menunjukkan bahwa manusia cenderung menambahkan atau mengurangi

persepsi kecerahan pada batas antara area yang memiliki intensitas berbeda. Fenomena

kontras simultan menunjukkan bahwa intensitas suatu area dapat lebih terang dan lebih

gelap tergantung dari area di sekitarnya.

2.3.5 Contrast

Kontras adalah perbedaan pada properti visual yang membuat suatu objek pada

citra dapat dibedakan dengan objek yang lainnya. Pada persepsi visual, kontras

ditentukan dari perbedaan dalam warna dan kecerahan dari objek dan objek lainnya jika

dilihat dari tempat dan waktu yang sama. Karena sistem visual manusia lebih sensitif

terhadap kontras daripada daripada luminansi absolute pada citra, manusia dapat

mendeskripsikan citra meskipun terdapat perbedaan iluminasi yang besar (Peli, 1990).

Page 6: BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00523-mtif 2.pdf · Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

14  

  

2.4. Color Model

Color model (atau color space atau color system) adalah suatu model matematika

yang mendeskripsikan cara agar warna-warna dapat direpresentasikan sebagai tuplet

angka. Tujuan model warna ini adalah suatu standar untuk spesifikasi warna. Esensinya,

model warna digambarkan pada sistem koordinat. Setiap warna direpresentasikan sebagai

titik koordinat (Gonzalez & Woods, 2002, p. 289).

2.4.1 RGB

Pada model RGB, setiap warna merupakan komponen spektral utama, yaitu

merah, hijau, dan biru. Model RGB ini berbasis sistem koordinat. Komponen merah,

hijau, dan biru merupakan komponen utama. Warna hitam merupakan origin, sedangkan

putih merupakan warna pada titik terjauh dari origin. Pada model ini, warna abu-abu (titik

yang memiliki nilai RGB sama) berada pada garis dari titik hitam hingga putih (Gonzalez

& Woods, 2002, p. 290).

Citra RGB direpresentasikan dalam tiga komponen citra R, G, dan B. Ketika citra

tersebut ditampilkan pada monitor, ketiga citra akan digabungkan pada layar untuk

menghasilkan citra komposit.

2.4.2 CMYK

Cyan, magenta, dan yellow (CMY) merupakan warna sekunder dari cahaya, atau

warna primer dari pigmen. Jika suatu permukaan dengan pigmen cyan disinari dengan

putih, maka tidak ada warna merah yang dipantulkan. Hal ini dikarenakan cyan

mengurangi warna merah dari cahaya putih (Gonzalez & Woods, 2002, p. 294).

Alat-alat yang digunakan untuk mencetak citra membutuhkan input data CMY

atau memerlukan konversi RGB ke CMY secara internal. Konversi ini dilakukan dengan

Page 7: BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00523-mtif 2.pdf · Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

15  

  

operasi sederhana: , , 1,1,1 , , dengan asumsi nilai RGB sudah

dinormalisasi.

Dalam prakteknya, warna hitam sulit diproduksi dengan mengkombinasikan

warna C, M, dan Y. Oleh karenanya, untuk memproduksi warna hitam, digunakan warna

keempat, yaitu hitam sehingga model CMYK dikenal dengan K sebagai black (hitam).

 

2.4.3 HSV

HSV (Hue, Saturation, Value) merupakan projeksi dari model RGB ke sudut

chroma non-linear, persentase saturasi radial, dan nilai luminansi. Secara lebih detail,

value didefinisikan sebagai nilai rata-rata atau maksimum dari nilai warna, saturation

didefinisikan sebagai jarak dari diagonal, dan hue didefinisikan sebagai arah dari warna

(Szeliski, 2011, p. 79).

Model HSV memisahkan komponen intensitas dari citra warna, sehingga model

ini merupakan model yang ideal untuk mengembangkan algoritma pemrosesan citra yang

intuitif dan natural (Gonzalez & Woods, 2002, p. 295).

2.5. Retinex

2.5.1 Konsep Retinex

Konsep Retinex berawal dari pemikiran Edwin H. Land dan John J. McCann

(1971, p. 1) mengenai cara manusia mempersepsikan warna suatu objek. Hipotesis awal

dari Land adalah warna dari suatu objek bergantung dari jumlah cahaya yang masuk ke

mata, namun hal tersebut tidak sepenuhnya benar. Penelitian Land menunjukkan bahwa

jumlah cahaya yang masuk ke mata tidak menentukan warna objek.

Page 8: BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00523-mtif 2.pdf · Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

16  

  

Cahaya yang masuk ke mata didefinisikan sebagai luminansi yang merupakan

perkalian antara iluminasi dan reflektansi. Land melakukan percobaan dengan

menggunakan variabel iluminasi sebagai variabel kontrol dan menunjukkan bahwa

persepsi warna suatu objek tidak bergantung pada iluminasi, tetapi bergantung pada

reflektansi absolut dari objek tersebut (Land & McCann, 1971).

Skema yang mendeskripsikan persepsi warna ini disebut sebagai Retinex karena

melibatkan bagian retina dan korteks. Sistem retina merupakan sistem yang memiliki

sedikitnya tiga reseptor yang mampu menerima cahaya gelombang pendek (biru), sedang

(hijau), dan panjang (merah). Berbeda dengan sistem pengambilan citra pada kamera,

citra yang dibentuk oleh masing-masing reseptor tidak langsung digabungkan, tetapi

dibandingkan oleh korteks yang digunakan untuk merespon luminansi. Persepsi

luminansi ini disebut sebagai kecerahan (lightness/brightness). Pemrosesan pada korteks

cenderung mengkorelasikan reflektansi pada objek dengan baik, sehingga manusia dapat

dengan baik mendeskripsikan warna suatu objek di bawah kondisi iluminasi bervariasi.

Untuk memformulasikan Retinex, terdapat dua gagasan yang dikemukakan.

1. Penelitian tentang dua persegi (gambar 2.2) menunjukkan bahwa garis tepi antara

dua area mempengaruhi kecerahan. Ketika garis tepi dihilangkan atau ditutup

dengan suatu benda, maka kedua area persegi akan memiliki kecerahan yang

sama. Berdasarkan pengamatan, atribut tepi dalam hal ini tidak harus bersifat

tajam, namun juga bisa bersifat kabur.

Page 9: BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00523-mtif 2.pdf · Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

17  

  

Gambar 2.2 Dua persegi dengan kecerahan berbeda

Dengan mengasumsikan bahwa dua titik yang berdekatan memiliki iluminasi

yang sama, maka rasio luminansi dari dua titik tersebut akan mendekati rasio

reflektansinya. Oleh karenanya, dengan suatu prosedur mengambil rasio dari dua

titik berdekatan dapat mendeteksi tepi sekaligus mengeliminasi efek dari

iluminasi yang bervariasi.

2. Jika diberikan prosedur untuk mendapatkan rasio reflektansi dari dua area yang

berdekatan (dijelaskan pada nomor 1), maka rasio reflektansi dari dua area yang

berjauhan dapat dihitung dengan cara mengalikan semua rasio dari area-area yang

membentuk jalur dari area yang satu ke area yang lain.

Gambar 2.3 Mondrian diberikan persentase luminansi

Page 10: BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00523-mtif 2.pdf · Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

18  

  

Sebagai contoh, pada gambar 2.3 diberikan figur Mondrian (lukisan dengan

bentuk kotak-kotak). Area paling atas memiliki luminansi sebesar 0,75. Area

terbawah memiliki luminansi 0,12. Rasio reflektansi didapat dengan mengalikan

semua rasio pada jalur yang ditemui. Diasumsikan bahwa luminansi tepi adalah

sama dengan luminansi daerah pusat, maka rasio reflektansi area paling atas

dengan area paling bawah adalah = 6,25. Selain

dapat menentukan rasio area paling atas dengan paling bawah, prosedur ini

menghasilkan nilai rasio reflektansi semua area yang ada pada jalur.

Melalui gagasan di atas, maka Retinex bekerja pada jalur dengan mengalikan rasio

luminansi untuk mendapatkan rasio reflektansi. Rasio luminansi pada gambar 2.3

merupakan luminansi area, sedangkan citra digital menggunakan elemen pixel. Land

mengemukakan asumsi: “jika elemen pixel yang digunakan, rasio yang mendekati 1

dianggap memiliki nilai 1 untuk melakukan toleransi variasi iluminasi”. Konsep ini

disebut juga dengan thresholding (Land & McCann, 1971, p. 6).

Setiap jalur yang dipilih dan dilalui membuat semua area memiliki nilai

reflektansi relatifnya dengan area lain. Nilai reflektansi pada area pertama pada jalur

dianggap memiliki reflektansi absolut terbesar, misalnya 100. Jalur-jalur yang berbeda

dapat memberikan hasil yang berbeda terhadap reflektansi absolut. Dengan merata-

ratakannya, maka akan diketahui reflektansi absolut yang nilainya mendekati nilai

sesungguhnya. Sebagai contoh, area A, B, C, D, E, F, G masing-masing memiliki nilai

luminansi {60, 20, 40, 100, 60, 80, 30}. Jika jalur bergerak dari A ke G, maka diperoleh

reflektansi absolut {100, 33, 67, 100, 60, 80, 30}. Jika jalur bergerak dari G ke A, maka

Page 11: BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00523-mtif 2.pdf · Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

19  

  

akan diperoleh reflektansi absolut {60, 20, 40, 100, 75, 100, 100}. Dengan merata-

ratakan kedua hasil reflektansi absolut dari kedua jalur, diperoleh reflektansi absolut rata-

rata sebesar {80, 27, 53, 100, 68, 90, 65} yang mendekati nilai reflektansi sesungguhnya.

Konsep Retinex dengan menggunakan jalur merupakan Retinex versi statis yang

kemudian direvisi oleh Land (1983, p. 1) dan Provenzi (Provenzi, Carli, & Rizzi, 2005).

Retinex versi dinamis dikembangkan oleh Land (1983, p. 1), Rahman (Rahman, 1995),

Jobson, Woodell (Jobson & Woodell, 1995), dan Provenzi (Provenzi, Carli, & Rizzi,

2005) untuk komputasi yang lebih sederhana.

2.5.2 Formulasi Retinex

Berikut adalah formulasi Retinex menurut Provenzi (Provenzi, Carli, & Rizzi,

2005, p. 2614).

Diberikan citra digital, asumsikan terdapat koleksi jalur dengan merupakan

nilai channel R, G, dan B. Jalur dikomposisikan sebagai rangkaian pixel dimulai dari

dan berakhir di . Didefinisikan merupakan jumlah pixel yang dilalui pada jalur

dan 1, … , . Untuk semua jalur , :{1, ..., }, 1 dan .

Untuk kesederhanaan, digunakan simbol untuk pixel ke pada jalur ,

misalnya dan 1 , untuk 1, … , 1. Jika setiap

pixel memiliki intensitas (nilai R, G, B) yaitu , maka rasio intensitas

/ .

Page 12: BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00523-mtif 2.pdf · Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

20  

  

Formula untuk menghitung nilai kecerahan (L) pada pixel generik ke- diberikan

sebagai berikut.

1

merupakan fungsi. : , 1, … , . 1 dan untuk setiap

1, … , 1,

jika 0 11 jika 1 1

jika 1 1

∏1

∏jika

1∏

Simbol menyatakan threshold yang digunakan agar algoritma dapat melakukan

toleransi terhadap perubahan intensitas, misalnya gradien sebagai reaksi iluminasi.

Pilihan pertama pada fungsi berlaku jika intensitas pixel lebih kecil

daripada intensitas pixel sebelumnya, , maka akan mengembalikan nilai .

Pilihan kedua berlaku jika terdapat perubahan kecil pada intensitas kedua pixel.

Pada kasus ini, didefinisikan menjadi 1, sehingga perkalian rasio sebelumnya tidak

mengalami perubahan.

Pilihan ketiga berlaku jika rasio lebih besar dari 1 , namun hasil perkalian

… belum mencapai nilai intensitas maksimum (1 ),

sehingga menghasilkan seperti pada piihan pertama.

Page 13: BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00523-mtif 2.pdf · Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

21  

  

Jika hasil perkalian … lebih besar dari intensitas

maksimum (1 , maka rangkaian nilai perkalian tersebut akan diset menjadi 1, yang

berarti nilai lokal maksimum sudah dicapai. Pilihan ini mengimplementasikan

mekanisme reset.

Formula Retinex di atas dapat dirumuskan ulang dalam bentuk fungsi logaritma.

Menurut Provenzi (2005, p. 2615), hal ini lebih diimplementasikan karena transformasi

logaritma mengubah perkalian menjadi penjumlahan dan perkalian menjadi pengurangan,

sehingga mengurangi biaya komputasi algoritma. Untuk konstruksi logaritma tersebut,

fungsi identitas dilakukan pada hasil perkalian yang selalu bernilai positif.

1exp log

1exp log

Jika log , log , 0, maka

fungsi menjadi 0, dan untuk setiap 1, … , 1,

jika ∞ ̃0 jika ̃ ̃

jika ̃ ̃

jika ̃

Page 14: BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00523-mtif 2.pdf · Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

22  

  

Simbol ̃ disederhakan menjadi log 1 . Dengan demikian, formula logaritma

untuk Retinex statis dapat dirumuskan ulang menjadi sebagai berikut.

1exp

2.5.3 Single-Scale Retinex

Single-Scale Retinex (SSR) atau Surround Retinex merupakan Retinex versi

dinamis yang dikemukakan oleh Land (1983, p. 5165) untuk meniru sistem kerja neuron

pada sistem persepsi warna manusia. Berbeda dengan Retinex statis, Retinex versi

dinamis tidak menggunakan jalur, tetapi menggunakan fungsi sekitar (surround function)

untuk meradiasikan intensitas ke pixel sekitarnya.

Berikut formulasi Single-Scale Retinex menurut Rahman (1995), Jobson, dan

Woodell (1995).

, log , log , ,

, merupakan output Retinex. , adalah distribusi citra pada pixel ke

, . Simbol “*” menyatakan operator konvolusi. , merupakan fungsi Gaussian yang

didefinisikan sebagai berikut. Simbol menyatakan channel warna, misalnya R, G, dan B.

, , /

Nilai adalah konstanta Gaussian yang mengatur seberapa jauh kurva Gaussian

menyebar. Nilai dapat memiliki hubungan dengan nilai standar deviasi , yaitu

2 . Nilai merupakan jarak/jari-jari titik lain dengan titik , . Nilai

Page 15: BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00523-mtif 2.pdf · Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

23  

  

ditentukan sedemikian rupa , 1. Hubungan nilai dengan standar

deviasi yaitu √

. Fungsi Gaussian dapat ditulis kembali sebagai berikut.

, ,1

√2

Operasi Retinex di atas dilakukan untuk setiap channel R, G, B untuk

menghasilkan citra dengan warna konstan (independen terhadap iluminasi). Ide

komputasi ini berawal dari definisi luminansi sebagai perkalian antara iluminasi dan

reflektansi.

, , ,

, merupakan distribusi iluminasi sekitar , dan , merupakan

distribusi reflektansi sekitar, maka rasio luminansi titik , dengan titik sekitar dapat

dicari sebagai berikut.

,,,

, ,, ,

Dengan asumsi bahwa nilai iluminasi sekitar , memiliki nilai sama atau

mendekati dengan nilai iluminasi titik , , maka rasio luminansi akan mendekati

rasio reflektansinya. Kemudian, dengan melakukan operasi logaritma yang menurut

Rahman (1995) sangat tepat untuk memproduksi hasil yang terbaik pada fungsi sekitar,

maka Single-Scale Retinex diformulasikan menjadi , log ,, log ,

log , seperti yang sudah dirumuskan sebelumnya.

Page 16: BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00523-mtif 2.pdf · Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

24  

  

2.6. Multi-Scale Retinex

Multi-Scale Retinex (MSR) dikembangkan (Jobson, Rahman, & Woodell, 1997)

karena keterbatasan yang dimiliki oleh Single-Scale Retinex (SSR), yaitu sebagai berikut.

1. SSR mampu melakukan kompresi jarak dinamis (Dynamic Range

Compression/DRC) pada citra jika digunakan pada skala rendah, sehingga

memungkinkan citra dengan jarak dinamis sangat lebar dikompresi dengan

melakukan penguatan bagian gelap dan melemahkan bagian yang terang. Pada

skala besar, SSR mampu menghasilkan citra dengan lebih alami dengan impresi

kecerahan yang besar pada area. Masalah yang dihadapi SSR adalah SSR tidak

mampu melakukan kedua hal tersebut sekaligus.

2. SSR cenderung untuk membuat area berwarna sama menjadi berwarna abu-abu,

terutama jika digunakan skala rendah (Barnard & Funt, 1998).

3. Kasus yang jarang terjadi adalah citra output SSR dapat mengalami

distorsi/pergeseran warna (Barnard & Funt, 1998).

Untuk mengatasi masalah SSR, skala yang berbeda digunakan dan diberi bobot

yang berbeda untuk menggabungkan kelebihan dan menghilangkan kelemahan yang

dimiliki dari skala rendah dan skala besar. Ide ini merupakan dasar dari Multi-Scale

Retinex. Berikut adalah formulasi original dari Jobson, Rahman, dan Woodell (1997).

merupakan output dari Multi-Scale Retinex (MSR) yang merupakan jumlah

dari output SSR yang masing-masing diberi bobot. adalah jumlah skala yang

Page 17: BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00523-mtif 2.pdf · Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

25  

  

digunakan. adalah bobot yang diasosiasikan dengan skala ke- . merupakan

output dari SSR yang diasosiasikan dengan skala ke- . Simbol menyatakan channel

warna, misalnya R, G, dan B.

Fungsi Gaussian yang digunakan oleh ditulis kembali sebagai berikut.

, , / 1√2

Simbol menyatakan parameter yang diberikan untuk fungsi Gaussian yang

memiliki hubungan dengan standar deviasi , yaitu 2 . Berdasarkan formula

MSR tersebut, konstruksi MSR ditentukan oleh parameter-parameter berikut.

1. Jumlah skala ( )

Menurut Jobson (1997), jumlah skala yang digunakan adalah 3 sebagai jumlah

skala minimum yang menyediakan output yang baik berdasarkan persepsi visual

dan waktu komputasi yang cepat.

2. Skala yang digunakan (

Berdasarkan eksperimen oleh Jobson (1997), Skala yang digunakan harus terdiri

dari skala rendah ( 20 , sedang ( 80 , dan tinggi ( 200). Skala

rendah digunakan untuk mengkompresi jarak dinamis dan memberikan detil pada

citra yang gelap dan terang. Skala sedang digunakan untuk mengurangi efek “halo”

yang berada di sekeliling tepi, sekaligus untuk memberikan impresi natural. Skala

tinggi digunakan untuk memberikan kecerahan seperti citra natural.

3. Bobot untuk skala tiap output SSR

Berdasarkan eksperimen oleh Jobson (1997), bobot yang merata sudah cukup

untuk aplikasi. Jika 3, maka 1 3⁄ , 1, 2, 3.

Page 18: BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00523-mtif 2.pdf · Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

26  

  

2.7. Ekualisasi Histogram

Subbab ini akan membahas teori mengenai ekualisasi histogram yang diperlukan

agar dapat digunakan sebagai perbandingan dengan metode Multi-Scale Retinex.

Histogram dari suatu citra digital dengan level intensitas 0, 1 adalah fungsi

distribusi disktret dengan adalah level intensitas ke- dan adalah jumlah

pixel pada citra yang memiliki nilai intensitas (Gonzalez & Woods, 2002, p. 88).

Histogram merupakan basis dari teknik pemrosesan citra berbasis spasial

(manipulasi langsung pixel suatu citra). Manipulasi histogram dapat digunakan untuk

memperbaiki kualitas citra. Selain itu, histogram berperan dalam menyediakan statistik

citra yang berguna, serta mudah dan cepat dikalkulasikan, sehingga sering digunakan

dalam pemrosesan citra secara real-time (Gonzalez & Woods, 2002, p. 88).

Ekualisasi Histogram (atau linearisasi histogram) adalah suatu teknik pemrosesan

citra yang memetakan input pixel dengan intensitas ke nilai output pixel dengan

intensitas berdasarkan distribusi kumulatif histogram (Gonzalez & Woods, 2002).

Jika distribusi peluang histogram dinyatakan sebagai ,

0, 1, 2, … , 1 dengan adalah jumlah pixel yang memiliki intensitas dan adalah

jumlah pixel pada citra, maka distribusi kumulatif peluang histogram dapat dinyatakan

sebagai ∑ . Fungsi ekualisasi histogram, , dapat ditulis sebagai berikut.

0, 1, 2, … , 1

Page 19: BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00523-mtif 2.pdf · Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

27  

  

2.8. Koreksi Gamma

Subbab ini akan membahas teori mengenai koreksi gamma yang diperlukan agar

dapat digunakan sebagai perbandingan dengan metode Multi-Scale Retinex.

Koreksi gamma memetakan input pixel dengan intensitas ke output pixel dengan

intensitas secara non-linear dengan menggunakan fungsi pangkat (Gonzalez & Woods,

2002, p. 80).

Nilai gamma, , adalah nilai konstan. Nilai input pixel dan merupakan nilai

intensitas yang sudah dinormalisasi, sehingga memiliki nilai di antara 0 dan 1.

Nilai , jika diberi nilai 1, maka akan menjadikan fungsi tersebut menjadi fungsi

identitas. Jika 1, maka citra output akan cenderung lebih terang, sedangkan jika

1, output citra akan cenderung lebih gelap dari citra awal.

Suatu konsep yang salah menyatakan bahwa koreksi gamma digunakan untuk

mengompensasikan hasil output yang merupakan fungsi pangkat dari CRT/cathode ray

tube. Koreksi gamma suatu citra digunakan untuk mendekati properti dari penglihatan

manusia yang mendekati fungsi pangkat (Poynton, 1998).

2.9. Sistem Pengenalan Wajah

Sistem pengenalan wajah merupakan aplikasi komputer yang digunakan untuk

mengidentifikasi atau memverifikasi seseorang dari suatu citra wajah. Menurut Jain et al.

(2007, p. 2), sistem pengenalan wajah secara umum terdiri dari empat modul, yaitu:

Page 20: BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00523-mtif 2.pdf · Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

28  

  

1. Deteksi wajah

Proses deteksi wajah berusaha untuk menentukan segment-segment bagian wajah

agar terpisah dengan bagian latar (background). Sebuah pendeteksi wajah yang

ideal mampu mengidentifikasi dan menemukan lokasi semua wajah yang ada di

dalam sebuah citra tanpa memperhatikan posisi, skala, orientasi, umur, dan

ekspresi. Dalam kasus video, deteksi wajah biasanya dilakukan dengan cara

tracking, yaitu mendeteksi berdasarkan citra sebelumnya tanpa deteksi ulang,

sehingga dapat dilakukan secara real time.

2. Alignment

Proses alignment berusaha untuk mendapatkan lokalisasi yang lebih akurat dan

menormalisasikan wajah. Suatu citra wajah dinormalisasikan sesuai dengan

properti geometriknya seperti ukuran wajah dan orientasi wajah dengan

menggunakan transformasi atau perubahan bentuk. Citra wajah biasanya kemudian

dinormalisasi lagi berdasarkan properti fotometrik, seperti iluminasi.

3. Ekstraksi fitur wajah

Ekstraksi fitur merupakan proses untuk mengekstrak atau mengambil informasi yang

terdapat pada citra wajah yang sudah dinormalisasi. Hasil proses ini adalah vektor

fitur (feature vector) yang merupakan bentuk lain dari representasi citra wajah.

4. Pencocokan fitur

Proses pencocokan fitur (feature matching) merupakan proses membandingkan

vektor fitur yang merupakan hasil ekstraksi citra input dengan vektor fitur yang ada

pada database. Dalam hal ini, database adalah kumpulan beberapa orang yang

sudah diidentifikasi beserta vektor fiturnya dan dibuat berdasarkan proses

Page 21: BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00523-mtif 2.pdf · Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

29  

  

pendaftaran (enrollment). Tingkat kesamaan tertentu antara vektor fitur dengan

database mengindikasikan suatu wajah yang dikenali atau sebaliknya.

Gambar 2.4 Alur pemrosesan pengenalan wajah

Hasil dari sistem pengenalan wajah sangat bergantung pada hasil ekstraksi yang

merepresentasikan wajah dan metode klasifikasi yang digunakan untuk membedakan

wajah yang satu dengan wajah yang lain, sementara normalisasi dan lokalisasi merupakan

basis untuk mengekstraksi fitur yang efektif (Jain, Flynn, & Ross, 2007, p. 3).

2.10. AForge.NET

Aforge.NET merupakan library yang dikhususkan pada bidang Computer Vision

dan Artificial Intelligence yang secara original dikembangkan oleh Andrew Kirillov

untuk framework .NET dalam bahasa pemrograman C# dan C++.

Aforge.NET merupakan projek yang open source. Kode sumber dan binary dari

Aforge.NET tersedia pada website www.aforge.com dan berada di bawah lisensi LGPL.

Versi pertama dari Aforge.NET dirilis ada tanggal 21 Desember 2006. Kode

Aforge.NET berfokus pada pemrosesan citra. Kemudian, kode tersebut menjadi awal dari

projek open source. Versi yang pertama kali memiliki paket instalasi adalah versi 1.2.0

yang dirilis 15 Maret 2007. Versi Aforge.NET yang paling baru adalah versi 2.2.3 yang

Page 22: BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-00523-mtif 2.pdf · Computer Vision adalah suatu bidang ilmu yang bertujuan untuk mendeskripsikan

30  

  

dirilis 12 Desember 2011 dengan ukuran paket instalasi sebesar 31,5 Mb, ukuran

dokumentasi adalah 13,3 Mb, dan jumlah file sumber sebanyak 455 dengan total ukuran

3,71Mb.

Fitur-fitur AForge.NET yang digunakan pada skripsi ini adalah fitur pada

framework AForge.Imaging yang memiliki fungsi-fungsi pemrosesan citra yang umum,

meliputi konvolusi, ekualisasi histogram, koreksi gamma, dan manipulasi pixel secara

langsung menggunakan class seperti UnmanagedImage dan BaseFilter.

 

2.11. EmguCV

EmguCV merupakan pembungkus (wrapper) .NET untuk library OpenCV yang

digunakan untuk pemrosesan citra. Library OpenCV (Open Source Computer Vision)

sendiri merupakan library yang digunakan untuk pemrosesan pada Computer Vision

secara real time, dikembangkan oleh Intel dan didukung oleh Willow Garage. Dengan

menggunakan EmguCV, fungsi OpenCV dapat dipanggil melalui bahasa yang

kompatibel dengan .NET, seperti C#, VB, VC++, IronPython, dan sebagainya.

Versi terbaru EmguCV adalah versi 2.3.0. Versi ini mengikuti versi OpenCV versi

yang sama, yaitu 2.3.0.

Fitur-fitur pada EmguCV yang digunakan dalam skripsi meliputi fungsi untuk

deteksi objek wajah dan fungsi untuk pengenalan wajah menggunakan class dengan nama

EigenObjectRecognizer. Pengenalan wajah ini menggunakan metode Principal

Component Analysis untuk mengekstraksi fitur pada citra wajah.