stki image

15
SISTEM TEMU KEMBALI INFORMASI IMAGE RETRIEVALOleh : I Gusti Ayu Triwayuni (1304505011) KELAS A TEKNOLOGI INFORMASI FAKULTAS TEKNIK UNIVERSITAS UDAYANA 2016

Upload: yogiswara-dharma-putra

Post on 11-Jul-2016

10 views

Category:

Documents


2 download

DESCRIPTION

Mantap

TRANSCRIPT

Page 1: Stki Image

SISTEM TEMU KEMBALI INFORMASI

“IMAGE RETRIEVAL”

Oleh :

I Gusti Ayu Triwayuni (1304505011)

KELAS A

TEKNOLOGI INFORMASI

FAKULTAS TEKNIK

UNIVERSITAS UDAYANA

2016

Page 2: Stki Image

Image Retrieval

Image retrieval merupakan teknik yang digunakan untuk mencari citra dari

suatu database yang memiliki kemiripan karakteristik dari citra query. Setiap citra

memiliki informasi fitur low-level yang unik. Contoh dari fitur low-level adalah

warna, tekstur, bentuk, dan sebagainya. Fitur-fitur inilah yang nantinya

dibandingkan antar citra dalam sistem image retrieval. Terdapat dua pendekatan

dalam image retrieval , yaitu :

Text-based : berdasarkan informasi metadata citra

Content-based : berdasarkan informasi isi citra

Text-based

Text-based menggunakan teknik query database tradisional untuk memperoleh

kembali citra berdasarkan kata kunci (keyword). Sistem membutuhkan penjelasan

atau metadata untuk setiap citra sebelum disimpan ke dalam database. Pendekatan

ini memiliki beberapa kekurangan, diantaranya :

Bersifat subyektif karena terdapat campur tangan manusia di dalam

memberikan penjelasan suatu citra. Setiap orang memiliki representasi yang

berbeda dalam menguraikan suatu karakteristik citra yang sama atau dikenal

dengan istilah semantic gap.

Dapat terjadi pendeskripsian yang tidak konsisten dan meluas saat

mendeskripsikan data dalam jumlah banyak karena sangat tergantung pada

pemahaman dan penafsiran manusia terhadap citra yang dilihat.

Content-Based

Content Based Image Retrieval (CBIR) adalah salah satu metodologi untuk

pemanggilan kembali data citra berdasarkan content sebuah citra. Pada sistem ini

menggunakan suatu algoritma image processing dalam mengekstraksi fitur yang

direpresentasikan oleh citra seperti warna, tekstur, dan bentuk.

Keuntungan utama dari CBIR ini adalah proses retrieval dilakukan secara

otomatis oleh sistem komputer. Tetapi kekurangan dari CBIR adalah terdapat

keterbasan alat capture data sehingga data tidak dapat menggambarkan seluruh

keadaan yang sebenarnya atau dikenal dengan istilah sensory gap. Adapun

arsitektur sistem CBIR dijelaskan pada gambar 2.1, yaitu:

Page 3: Stki Image

Gambar 2.1 Arsitektur Sistem CBIR

Berdasarkan arsitektur pada Gambar 2.1, dalam proses CBIR terdapat dua

fungsionalitas utama, yaitu :

1. Data Insertion

Pada subsistem data insertion dilakukan ekstraksi fitur terhadap citra dan

hasilnya disimpan ke dalam database. Sebuah citra dapat direpresentasikan

dengan vektor multidimensi (N-dimensi) dari hasil ekstraksi fiturnya.

Sebagai contohnya, sebuah citra diekstraksi berdasarkan fitur warna dan

bentuk. Dimana komponen pertama (n1) adalah warna dan komponen

kedua (n2) adalah bentuk sehingga, terdapat N=n1+n2 komponen. Hasil

vektor ekstraksi tadi disimpan dalam database dan menjadi ciri untuk

suatu citra.

Page 4: Stki Image

2. Query Processing

Pada tahap ini dilakukan ekstraksi fitur terhadap citra query dan hasilnya

dibandingkan dengan vektor ekstraksi yang terdapat di dalam database.

Setelah itu dilakukan proses perhitungan jarak vektor antara citra query

dengan citra database untuk mendapatkan tingkat kemiripan. Setelah itu,

dilakukan proses perankingan sehingga dikembalikan sejumlah citra yang

mirip dengan citra query.

Ekstraksi fitur merupakan proses penting pada sistem CBIR karena hasil

dari proses ini terdapat perbedaan pada setiap image yang dapat diketahui

berdasarkan cirinya seperti ciri bentuk, warna, tekstur dan lain-lain.

Gambar 2.1. Teknik pencarian image untuk memperoleh image

Proses matching merupakan proses pencocokan image untuk memperoleh

image yang mempunyai kemiripan dengan image query dapat dilihat pada

Gambar 2.1. Proses matching dilakukan dengan menghitung jarak antara dua

image yaitu image query dan image target pada sekumpulan image. Parameter

yang digunakan dalam perhitungan jarak berdasarkan pada hasil ekstraksi fitur.

( Ida Hastuti:2009).

Moment Invariant

Moment Invariants adalah salah satu metode yang digunakan sebagai

ekstraktor fitur bentuk. Sebuah ekstraktor bentuk harus dapat mengenali citra

walaupun telah mengalami perubahan geometrik seperti translasi, rotasi dan

penskalaan. Momen adalah teknik matematika yang diterapkan untuk

mengekstraksi informasi dari objek citra. Citra target sering diperoleh dari hasil

thresholding, yang merupakan salah satu bentuk optimal yang dapat menampilkan

single object dari sebuah citra. Aplikasi yang lebih kompleks menangani

Page 5: Stki Image

permasalahan penutupan (occlusion) dan pengisian bagian yang hilang. Tahapan

ini dilakukan pada pra-proses sebelum citra tersebut diekstraksi menggunakan

Moment Invariants. Moment Invariants akan menghasilkan tujuh nilai invarian

momen yang konstan terhadap translasi, rotasi, dan skala pada sebuah citra

(Muharrem Mercimek:2008). Menurut Rao, et. Al (2010), Moment Invariants

digunakan dalam 2D image dengan rumus sebagai berikut:

1. Sebuah citra M x M memiliki fungsi keabuan :

2. Momen dua-dimensi berkaitan dengan sebuah orde yang dimulai dari low

(dimana terendah adalah 0) sampai orde tertinggi. Momen dari orde p+q

dijabarkan sebagai berikut :

3. Centroid ini merupakan first-order moment yang digunakan untuk

menentukan lokasi pusat dari sebuah objek. Pada citra biner, nilai ini

sesuai dengan koordinat pusat dari bentuk.

4. Central Moments (Translation Invariant) Nilai dari Central moment tidak

berubah walaupun citra telah mengalami translasi, sehingga terdapat

teorema : central moment adalah konstan terhadap translasi. Adapun

persamaan untuk mendapatkan central moment :

5. Normalized Central Moments (Scale Invariant) Central Moments hanya

konstan terhadap translasi tetapi tidak konstan terhadap transformasi

bentuk lainnya. Agar momen tersebut tidak berubah terhadap skala dan

rotasi maka Central Moment dinormalisasikan sebagai berikut :

Page 6: Stki Image

Gray Level Co-occurrence Matrix

Ada beberapa metode yang digunakan untuk penghitungan kesamaan

texture menurut penelitian yang dilakukan oleh Howarth dan Ruger, antara lain

(Howarth & Ruger, 2004) : Co-occurrence merupakan metode awal yang

digunakan untuk penghitungan kecocokan texture. Di mana dalam penggunaannya

digunakan menggunakan Grey Level Co-occurrence Matrices (GLCM). Di mana

gambar akan dibagi per 2 pixel dan pemisahan akan ditandai dengan vector

tertentu. Distribusi dalam matrix akan tergantung pada sudut dan jarak hubungan

antar pixel. GLCM memungkinkan menangkap karakteristik tekstur yang berbeda.

Namun hasilnya bervariasi karena terpengaruh oleh kualitas gambar dan keutuhan

bentuk gambar. Sehingga tidak dapat digunakan untuk gambar yang berukuran

kecil dan gambar yang tidak utuh. GLCM didefenisikan sebagai tabulasi dari data

piksel citra dimana digambarkan seberapa sering kombinasi yang berbeda pada

nilai keabuan yang muncul pada citra (Yaltha Rullist : 2009). Fitur-fitur metode

ini sebagai berikut.

1. Quantization, merupakan konversi nilai grayscale (256 nilai keabuan) citra

kedalam rentang nilai tertentu.

2. Co-occurrence, yaitu jumlah kejadian satu level nilai intensitas piksel

bertetangga dengan satu level intensitas piksel lain dalam jarak (distance)

dan orientasi sudut (θ) tertentu. Jarak dinyatakan dalam piksel dan

orientasi dinyatakan dalam derajat. Orientasi dibentuk dalam empat arah

sudut dengan interval sudut 45o, yaitu 0o, 45o, 90o, dan 135o. sedangkan

jarak antar piksel ditetapkan sebesar satu piksel.

Page 7: Stki Image

Gambar 2.2 Hubungan ketetanggaan antar piksel

3. Symetric Symmetric, yaitu diartikan sebagai kemunculan posisi piksel yang

sama. Misalkan terdapat piksel. Maka secara orientasi horizontal piksel

sama dengan piksel. Oleh karena itu, dijumlahkan matrik kookurensi

dengan matrik transpose-nya sendiri.

4. Normalization yaitu, suatu langkah yang dilakukan sebelum ciri tekstur

dihitung. Langkah ini menghitung probabilitas matrik, misalkan terdapat

hubungan ketetanggan piksel dan sangat mirip dengan hubungan

ketetanggaan piksel lainnya. Kemunculan piksel adalah 6 kali misalnya

dari 24 kombinasi horizontal, maka normalisasi berperan sebagai

membedakan antara piksel dan yang mirip dengan cara membagi jumlah

kemunculan piksel tersebut dengan jumlah kemungkinan yang muncul.

Piksel memiliki angka kemungkinan muncul sebesar 0.25 sedangkan

piksel sebesar 0.042. Normalisasi adalah membagi jumlah kemunculan

ketetanggaan piksel tertentu dengan jumlah seluruh piksel ketetanggaan

yang mungkin muncul.

5. Feature Exstraction, berdasarkan penelitian oleh Haralick diusulkan 14

jenis ciri tekstural. Namun tidak semua ciri dapat diterapkan, karena

diantara ciri teksutral tersebut terdapat beberapa ciri yang bisa menjadi ciri

pengacau terhadap obyek yang diteliti. Berikut beberapa persamaan ciri

tekstural tersebut diantaranya.

Page 8: Stki Image

a) Angular Second Moment (Uniformity / Energy). 𝐴𝑆𝑀 = ∑ {𝑝(𝑖,𝑗)}2 𝑁−1 𝑖,𝑗=0

b) Contrast. 𝐶𝑂𝑁 = ∑ 𝑝𝑖,𝑗(𝑖 − 𝑗)2 𝑁−1 𝑖,𝑗=0

c) Inverse Difference Moment (Homogenity). 𝐻𝑂𝑀 = ∑ 𝑝(𝑖,𝑗) 1+ (𝑖−𝑗)2 𝑁−1 𝑖,𝑗=0

d) Entropy. 𝐸𝑁𝑇 = −∑ 𝑝(𝑖,𝑗) 𝑁−1 𝑖,𝑗=0 𝑙𝑜𝑔{𝑝(𝑖,𝑗)}

e) Dissimilarity. 𝐷𝐼𝑆 = ∑ 𝑝(𝑖,𝑗)|𝑖 − 𝑗| 𝑁−1 𝑖,𝑗=0

Color Moments

Color Moments adalah suatu metode yang digunakan untuk membedakan citra

berdasarkan fitur warnanya. Dasar dari metode ini adalah asumsi bahwa distribusi

warna pada sebuah citra dapat dinyatakan sebagai distribusi probabilitas. Oleh

sebab itu, akurasi yang dihasilkan adalah konstan walaupun ukuran citra berubah.

Color Moments disebut compact karena dapat memampatkan informasi warna

citra menjadi beberapa nilai. Ekstraktor warna ini tidak memerlukan kuantisasi

pada tahapan pra proses karena Color Moments hanya menyimpan fitur dominan

pada distribusi warna di dalam database.

Metode ini menggunakan tiga momen utama dari distribusi warna citra, yaitu

mean, standard deviation, dan skewness, sehingga metode ini menghasilkan tiga

nilai untuk masing-masing komponen warna.

Karena pada Tugas Akhir ini menggunakan ruang warna HSV yang terdiri

dari tiga komponen warna, maka metode ini menghasilkan sembilan nilai untuk

identitas sebuah citra. Sembilan nilai inilah yang digunakan sebagai ciri warna

citra untuk proses image retrieval. Berdasarkan hasil ekstraksi yang diperoleh

yaitu sembilan, maka proses perolehan data kembalipun dapat berlangsung

dengan cepat.

Kita mendefinisikan i-th komponen warna pada j-th piksel citra sebagai Pij.

Ketiga momen tersebut dapat didefinisikan sbb:

Page 9: Stki Image

Moment 1 – Mean :

Mean dapat dikatakan sebagai rata-rata nilai warna pada citra.

Moment 2 – Standard Deviation :

Standard deviation adalah akar dua dari variance pada distribusi atau jangkauan tersebarnya data dari mean.

Moment 3 – Skewness :

Skewness merupakan sebuah ukuran asimetri data disekitar mean. Jika nilai skewness adalah negatif, berarti data lebih banyak tersebar di sebelah kanan rata-rata (mean) dibandingkan di sebelah kanan rata-rata mean dan begitu pula sebaliknya. Skewness dari distribusi normal adalah nol.

Adapun keterangan dari persamaan adalah sebagai berikut :

E : Mean

: Standard deviation

: Skewness

N : Jumlah piksel

i : indeks komponen warna sekarang (contoh : 1=H, 2=S, 3=V)

j : Urutan piksel

: mendefinisikan nilai i-th komponen warna pada j-th piksel citra

Page 10: Stki Image

Jarak dari distribusi warna citra query dengan citra database dapat dihitung dengan persamaan (2.5) di bawah ini :

Dimana :

: 2 distribusi citra yang sedang dibandingkan

i : indeks komponen warna sekarang (contoh : 1=H, 2=S, 3=V)

r : jumlah komponen warna (contoh : 3)

: momen pertama (mean) dari dua distribusi citra

: momen kedua (standard deviation) dari dua distribusi citra

: momen ketiga (skewness) dari dua distribusi citra

wi : bobot (weight) dari setiap momen yang dispesifikasikan oleh user.

Page 11: Stki Image

DAFTAR PUSTAKA

Dimai, A. (1999). Rotation Invariant Texture Description using General Moment Invariants and Gabor Filters. Proc. Of the 11th Scandinavian Conf. on Image Analysis.

Ida Hastuti.2009. Content Based Image Retrieval Berdasarkan Fitur Bentuk Menggunakan Metode Gradient Vector Flow Snake. Yogyakarta: Jurnal Teknik Elektro.

Muharrem Mercimek, Kayhan Gulez and Tarik Veli Mumcu.2008. Jurnal: Real object recognition using moment invariants. Yildiz Technical University, Electrical-Electronics Faculty, Electrical Engineering Department.Turkey.

Rao, C., Kumar, S., Mohan, B. (2010). Content Based Image Retrieval using Exact Legendre Moments and Support Vector Machine. India: The International Journal of Multimedia & Its Applications