bab ii landasan teori - bina nusantara | library...
Post on 17-Mar-2019
219 Views
Preview:
TRANSCRIPT
BAB II
LANDASAN TEORI
Computer vision adalah suatu ilmu di bidang komputer yang dapat membuat
mesin atau robot untuk ‘melihat’ (http://en.wikipedia.org/wiki/Computer_vision).
Terdapat beberapa klasifikasi dari vision itu sendiri, yaitu Low Level Vision, Medium
Level Vision, dan High Level Vision. (Tucker, 2004)
Low Level Vision meliputi Sensing, yaitu pengambilan input berupa gambar, dan
Preprocessing, yaitu memperoleh suatu gambar sebelum diproses. Medium Level Vision
meliputi proses Segmentation, Description, Recognition. Segmentation adalah proses
pemisahan gambar digital kedalam beberapa region. Description merupakan proses
mendeskripsikan suatu gambar, sedangkan Recognition merupakan pengenalan terhadap
suatu gambar. Pada level yang lebih tinggi (High Level Vision) terdapat proses
Interpretation, dimana Interpretation merupakan suatu kemampuan untuk
memperkirakan bentuk asli dari gambar yang didapat, hal ini dapat dilakukan dengan
cara mendapatkan berbagai informasi yang diperlukan pada gambar tersebut. Maka
proses Interpretation memerlukan deteksi, indentifikasi, dan pengukuran dari fitur-fitur
pada suatu gambar. Sistem Stereo Eyes (Stereo Vision) dalam skripsi ini hanya sampai
dalam tahap Medium Level Vision, karena belum bisa melakukan interpretasi.
Sistem Stereo Eyes mempunyai konsep yang sama seperti 2 buah mata manusia
yang terletak bersebelahan dengan jarak tertentu antara satu mata dengan yang lainnya.
Ketika kedua mata tersebut melihat pada sebuah objek yang sama, masing-masing mata
menangkap gambar dengan sudut pandang yang berbeda dan kemudian gambar tersebut
dikirim ke otak untuk diproses. Ketika kedua gambar yang ditangkap oleh kedua mata
tiba secara bersamaan di belakang otak, mereka bersatu menjadi satu gambar.
Penglihatan tersebut dinamakan dengan penglihatan stereo (stereo vision). Pikiran
manusialah yang menggabungkan kedua gambar dengan mencocokkan bagian yang
sama dan menambahkan sedikit perbedaan (www.vision3d.com/stereo.html), sehingga
dapat memberikan informasi dari suatu gambar, salah satu informasi yang dapat
diberikan adalah posisi objek dalam gambar tersebut. Salah satu metode yang
digunakan untuk mendapatkan informasi posisi ini adalah perhitungan disparity
(perbandingan 2 gambar) dari gambar stereo (stereo image) yang didapatkan dari
penglihatan stereo (stereo vision). Meskipun begitu, metode perhitungan disparity
hanya akan memberitahukan posisi objek tersebut terhadap objek lainnya tanpa
informasi jarak. Informasi jarak merupakan perkembangan selanjutnya dari computer
vision menggunakan stereo vision (Mohabi, 2008).
2.1 Gambar (Image) (Gonzalez, 1987)
Suatu gambar didefinisikan sebagai fungsi kontinu dari intensitas cahaya dalam
bidang 2 dimensi, dan dinyatakan dengan f(x,y), dimana nilai atau amplitudo dari f
menyatakan intensitas cahaya dari gambar pada koordinat (x,y). Dan karena cahaya
adalah salah satu bentuk dari energi, maka nilai f(x,y) harus berada diantara nol sampai
tak terhingga.
0 < f(x,y) < ∞
Gambar 2.1 Representasi gambar digital
Gambar yang ditangkap oleh mata adalah berasal dari cahaya yang dipantulkan oleh
objek yang dilihat. Intensitas cahaya, f(x,y), sebenarnya merupakan hasil perkalian
antara jumlah cahaya (illumination) yang berasal dari sumbernya (sumber cahaya,
contoh : matahari, bulan) dengan jumlah pantulan cahaya (reflectance) dari benda yang
dilihat pada area tersebut, dinyatakan dalam bentuk persamaan sebagai berikut :
f(x,y) = i(x,y) . r(x,y)
dimana :
i(x,y) : illumination, besarnya 0 < i(x,y) < ∞
r(x,y) : reflectance, besarnya 0 < r(x,y) < 1
Nilai i(x,y) ditentukan oleh sumber cahaya, sebagai contoh : pada hari yang cerah,
matahari menghasilkan i(x,y) ≈ 9000 foot candles. Pada hari yang mendung, matahari
menghasilkan i(x,y) ≈ 1000 foot candles. Pada malam bulan purnama, sinar bulan
menghasilkan i(x,y) ≈ 0.01 foot candles.
Sedangkan, nilai r(x,y) ditentukan oleh karakteristik objek yang diamati, sebagai contoh
: benda hitam mempunyai r(x,y) = 0.01, dinding putih mempunyai r(x,y) = 0.8, baja
(stainless steel) mempunyai r(x,y) = 0.65, salju mempunyai r(x,y) = 0.93.
Intensitas dari suatu gambar hitam putih, f pada titik (x,y) disebut derajat keabuan (gray
level) dinotasikan dengan l yang memiliki rentang nilai dari Lmin sampai Lmax,
dinyatakan sebagai berikut :
Lmin < l < Lmax
Interval (Lmin, Lmax) disebut skala keabuan (gray scale), untuk alasan praktis interval
tersebut sering digeser menjadi (0,L) dimana intensitas 0 menyatakan hitam dan L
menyatakan putih. Contoh : gambar hitam putih dengan 256 level artinya skala keabuan
dari 0 sampai 255 atau (0,255). Dalam hal ini 0 menyatakan hitam dan 255 menyatakan
putih dan skalan bergerak dari 0 sampai dengan 255.
2.1.1 Digitalisasi Gambar
Supaya sebuah gambar dapat diproses oleh komputer, maka perlu
adanya digitalisasi. Digitalisasi adalah proses representasi gambar dari
fungsi kontinu menjadi nilai-nilai diskrit. Gambar yang dihasilkan dari
digitalisasi disebut gambar digital (digital image). Umumnya gambar
digital berbentuk empat persegi panjang dan dimensi ukurannya
dinyatakan dengan panjang x lebar. Gambar digital yang berukuran M
(panjang) x N (lebar) biasanya dinyatakan dalam bentuk matriks yang
berukuran M baris dan N kolom, sebagai berikut :
Setiap elemen pada gambar digital (elemen matriks) disebut image
elemet, picture element, pixel atau pel.
2.1.2 Proses Digitalisasi Gambar
Proses digitalisasi gambar melalui dua tahap, yaitu :
1. Digitalisasi spasial (x,y), disebut image sampling
2. Digitalisasi intensitas f(x,y), disebut gray-level quantization
2.1.2.1 Image Sampling
Gambar kontinu dibagi-bagi menjadi grid-grid berbentuk bujur
sangkar dan pada setiap grid mengandung jumlah pixel tertentu.
Gambar 2.2 Image Sampling
Dalam implementasi biasanya jumlah sampling diasumsikan
perpangkatan dari dua, sehingga dapat dituliskan :
N = 2n
dimana :
N = jumlah sampling pada suatu baris / kolom
n = bilangan bulat positif
Contoh :
Gambar 2.3 Contoh perbedaan image sampling
2.1.2.2 Gray-level quantization
Proses kuantisasi adalah membagi skala keabuan / gray scale
(0,L) menjadi sejumlah level, dinotasikan dengan G dan nilainya
berupa bilangan bulat (integer), biasanya G merupakan hasil
perpangkatan dari dua :
G = 2m
dimana :
G = derajat keabuan / gray scale
m = bilangan bulat positif
Contoh :
Gambar 2.4 Contoh perbedaan Gray-level quantization
Jumlah bit yang dibutuhkan untuk menyimpan gambar digital
yang disampling menjadi N x N pixels dan dikuantisasi menjadi G
gray level adalah :
b = N x N x m dalam satuan bit
2.1.3 Elemen-elemen Gambar Digital
Elemen-elemen yang terdapat dalam gambar digital adalah sebagai
berikut :
1. Kecerahan (Brightness)
Kecerahan adalah kata lain untuk intensitas cahaya. Kecerahan pada
sebuah titik (pixel) di dalam gambar bukanlah intensitas riil, tetapi
sebenarnya adalah intensitas rata-rata dari suatu area yang
melingkupinya.
2. Kontras (Contrast)
Kontras menyatakan sebaran terang (lightness) dan gelap (darkness)
di dalam sebuah gambar.
3. Kontur (Contour)
Kontur adalah keadaan yang ditimbulkan oleh perubahan intensitas
pada pixel-pixel bertetangga.
4. Warna (Colour)
Warna adalah persepsi yang dirasakan oleh sistem visual manusia
terhadap panjang gelombang cahaya yang dipantulkan oleh objek.
Setiap warna mempunyai panjang gelombang (λ) yang berbeda.
- Merah : panjang gelombang paling tinggi
- Ungu : panjang gelombang paling rendah
5. Bentuk (Shape)
Shape adalah properti intrinsik dari objek tiga dimensi, dengan
pengertian bahwa shape merupakan properti intrinsik utama sistem
visual manusia.
6. Tekstur (Texture)
Tekstur dicirikan sebagai distribusi spasial dari derajat keabuan di
dalam sekumpulan pixel-pixel yang bertetangga. Jadi tekstur tidak
dapat didefinisikan hanya untuk sebuah pixel.
2.2 Pengolahan Gambar (Image Processing)
Pengolahan gambar merupakan proses pengolahan dan analisis gambar yang
banyak melibatkan persepsi visual dan bertujuan untuk memperbaiki kualitas gambar
agar mudah diinterpretasi oleh manusia atau mesin (dalam hal ini komputer). Jadi,
masukannya adalah gambar dan keluarannya adalah juga gambar, namun gambar
keluaran mempunyai kualitas lebih baik daripada gambar masukan. Pada umumnya,
gambar yang diolah adalah dalam bentuk digital dan disebut sebagai pengolahan
gambar digital. Operasi-operasi yang dilakukan di dalam pengolahan gambar digital
banyak ragamnya. Namun, secara umum, operasi tersebut dapat diklasifikasikan dalam
beberapa jenis, sebagai berikut :
2.2.1 Perbaikan kualitas gambar (image enhancement)
Jenis operasi ini bertujuan untuk memperbaiki kualitas gambar dengan
cara memanipulasi parameter-parameter gambar. Dengan operasi ini,
ciri-ciri khusus yang terdapat di dalam gambar lebih ditonjolkan.
Contoh-contoh operasi perbaikan gambar :
a. Perbaikan kontras gelap / terang
b. Perbaikan tepian objek (edge enhancement)
c. Penajaman (sharpening)
d. Pemberian warna semu (pseudocoloring)
e. Penapisan derau (noise filtering), contoh median filtering
Gambar dibawah adalah contoh operasi penajaman. Operasi ini
menerima masukan gambar yang gambarnya hendak dibuat tampak lebih
tajam. Bagian gambar yang ditajamkan adalah tepi-tepi objek.
Gambar 2.5 (a) Gambar Lena original, (b) Gambar Lena setelah
ditajamkan
Referensi gambar di ambil dari http://ndevilla.free.fr/lena/
2.2.1.1 Median Filtering
Median Filtering termasuk salah satu langkah untuk
meningkatkan kualitas gambar, karena median filtering cocok digunakan
untuk menghilangkan noise dari suatu gambar. Median Filtering bekerja
dengan mengevaluasi tingkat brightness dari suatu pixel dan menentukan
pixel mana yang tingkat brightness-nya adalah nilai median (nilai
tengah) dari semua pixel. Nilai median ditentukan dari menempatkan
brightness pixel pada urutan yang bertingkat dan memilih nilai tengah,
sehingga angka yang didapat dari brightness pixel yang ada menjadi
kurang dari dan lebih dari nilai tengah yang didapat.
Median Filtering merupakan salah satu jenis low-pass filter,
dibandingkan dengan neighborhood averaging, filter ini lebih tidak
sensitif terhadap perbedaan intensitas yang ekstrim. Median Filtering
menentukan median dari suatu kernel (missal 3x3), filtering dengan
metode ini merupakan filter statistical order yang paling terkenal
dikarenakan kinerja yang cukup memuaskan dalam mengatasi noise
terutama noise salt dan pepper dan juga efek blurring yang terjadi jauh
lebih kecil jika dibandingkan dengan aritmatik filter.
2.2.2 Pemugaran gambar (image restoration)
Operasi ini bertujuan menghilangkan / meminimumkan cacat pada
gambar. Tujuan pemugaran gambar hampir sama dengan operasi
perbaikan gambar. Bedanya, pada pemugaran gambar penyebab
degradasi gambar diketahui. Contoh-contoh operasi pemugaran gambar :
a. Penghilangan kesamaran (deblurring)
b. Penghilangan derau (noise)
Gambar dibawah adalah contoh operasi penghilangan kesamaran.
Gambar masukan adalah gambar yang tampak kabur (blur). Kekaburan
gambar mungkin disebabkan pengaturan fokus lensa yang tidak tepat
atau kamera bergoyang pada pengambilan gambar. Melalui operasi
deblurring, kualitas gambar masukan dapat diperbaiki sehingga tampak
lebih baik.
Gambar 2.6 Gambar Lena yang kabur (blur), (b) Gambar Lena setelah
deblurring
2.2.3 Pemampatan gambar (image compression)
Jenis operasi ini dilakukan agar gambar dapat direpresentasikan dalam
bentuk yang lebih kompak sehingga memerlukan memori yang lebih
sedikit. Hal penting yang harus diperhatikan dalam pemampatan adalah
gambar yang telah dimampatkan harus tetap mempunyai kualitas gambar
yang bagus. Contoh metode pemampatan gambar adalah metode JPEG.
Perhatikan gambar dibawah, gambar sebelah kiri adalah gambar kapal
yang berukuran 258 KB. Hasil pemampatan gambar dengan metode
JPEG dapat mereduksi ukuran gambar semula sehingga menjadi 49 KB
saja.
Gambar 2.7 (a) Gambar kapal (258 KB) sebelum dimampatkan, (b)
Gambar kapal (49 KB) setelah dimampatkan
2.2.4 Segmentasi gambar (image segmentation)
Operasi segmentasi merupakan pememecahan suatu gambar digital ke
dalam beberapa segmen dengan suatu kriteria tertentu. Jenis operasi ini
berkaitan erat dengan pengenalan pola. Tujuan dari operasi segmentasi
adalah untuk menyederhanakan dan atau mengganti gambaran dari
sebuah gambar untuk mendapatkan sesuatu yang lebih berarti untuk
dianalisa.
Algoritma segmentasi didasarkan pada 2 buah karakteristik nilai derajat
kecerahan gambar, yaitu: discontinuity dan similarity.
2.2.4.1 Discontinuity
Pada karakteristik ini, gambar dipisahkan/dibagi
atas dasar perubahan yang mencolok dari derajat
kecerahannya. Aplikasi yang umum adalah untuk deteksi
titik, garis, area, dan sisi gambar. Namun yang digunakan
saat ini hanya deteksi sisi. Ada beberapa algoritma yang
digunakan untuk melakukan deteksi sisi, diantaranya
adalah :
• Metode Robert
Metode Robert adalah salah satu metode
deteksi tepi yang menggunakan teknik
differensial, yaitu differensial pada arah horisontal
dan differensial pada arah vertikal, dengan
ditambahkan proses konversi biner setelah
dilakukan differensial. Teknik konversi biner yang
disarankan adalah konversi biner dengan
meratakan distribusi warna hitam dan putih.
Kernel filter yang digunakan dalam metode Robert
ini adalah:
• Metode Prewitt
Metode Prewitt merupakan salah satu
metode deteksi sisi pada image processing. Cara
kerja dari Metode Prewitt dengan cara menghitung
repson maksimum dari suatu kernel konvolusi
untuk menemukan orientasi deteksi sisi
disekitarnya pada tiap pixel. Metode ini juga
disebut sebagai edge template matching. Karena
gambar mengalami proses matching dengan
sebuah template yang berupa sisi.
Metode Prewitt merupakan pengembangan
metode Robert dengan menggunakan filter HPF
yang diberi satu angka nol penyangga. Metode ini
mengambil prinsip dari fungsi Laplacian yang
dikenal sebagai fungsi untuk membangkitkan
HPF.
Kernel filter yang digunakan dalam metode
Prewitt ini adalah:
• Metode Sobel
Metode Sobel merupakan pengembangan
metode Robert dengan menggunakan filter HPF
yang diberi satu angka nol penyangga. Metode ini
mengambil prinsip dari fungsi Laplacian dan
Gaussian yang dikenal sebagai fungsi untuk
membangkitkan HPF. Kelebihan dari metode
Sobel ini adalah kemampuan untuk mengurangi
noise sebelum melakukan perhitungan deteksi
tepi.
Kernel filter yang digunakan dalam metode Sobel
ini adalah:
2.2.4.2 Similarity
Pada karakteristik ini gambar dibagi atas
thresholding, region growing, dan region spiltting and
merging.
2.3 Cross Correlation
Cross correlation merupakan pengukuran kesamaan dari 2 buah gelombang
sebagai fungsi terhadap waktu.
Untuk fungsi kontinu, cross correlation dari f dan g dapat dinyatakan dalam persamaan
:
Sedangkan bentuk fungsi diskritnya adalah sebagai berikut :
Cross corelation memiliki kemiripan dengan konvolusi. Bila konvolusi sinyal
mengalami pembalikan, pergeseran, dan perkalian, pada cross correlation hanya
mengalami pergeseran dan perkalian. (http://en.wikipedia.org/wiki/Cross-correlation).
Salah satu pendekatan untuk melihat kemiripan dari dua buah gambar adalah dengan
menggunakan cross correlation, ketika salah satu gambar yang dijadikan sebuah
template di geser terhadap gambar lainnya dan menghasilkan nilai korelasi yang tinggi
maka kedua gambar merupakan gambar yang sama.
Gambar 2.8 Image Cross Correlation
Rumus untuk cross correlation pada titik (i,j) dari gambar adalah :
dimana adalah nilai rata-rata dari pixel-pixel pada gambar yang dijadikan
template, dan adalah nilai rata-rata dari pixel-pixel pada gambar yang terletak
dibawah template ketika melakukan scanning.
(http://local.wasp.uwa.edu.au/~pbourke/miscellaneous/correlate/)
2.4 Curve Fitting (Metode Numerik, p 58)
Dalam berbagai aktifitas dalam dunia sains, seringkali diperlukan suatu fungsi
yang menghubungkan antar variable-variable dari data yang diamati. Untuk itu
diperlukan suatu metode untuk menentukan bentuk kurva yang merupakan representasi
dari data tersebut sehingga bisa dipergunakan untuk memprediksi pola atau
kecenderungan dari data yang diamati. Selain itu kurva tersebut dapat dipergunakan
untuk mencari nilai suatu titik di antara nilai-nilai yang diketahui (diamati). Ada 2 jenis
metode yang dapat digunakan, yaitu :
2.4.1 Regresi
Metode ini digunakan bila sumber data yang digunakan mempunyai
tingkat kesalahan yang cukup tinggi. Dalam hal ini, kurva yang dibangun tidak
perlu melalui titik-titik data tersebut, tetapi cukup mengikuti kecenderungannya
saja. Sehingga metode ini tidak dapat digunakan dalam pengukuran jarak,
karena untuk pengukuran jarak diperlukan ketelitian yang tidak mampu
didapatkan dengan metode regresi.
Gambar 2.9 Gambar kurva dengan metode regresi
2.4.2 Interpolasi
Interpolasi adalah proses perpanjangan pada poin-poin data dalam suatu
cakupan yang berbentuk diskrit (data points). Data poin didapat dari beberapa
pengukuran / percobaan yang telah dilakukan sebelum dilakukan pengukuran
atau analisa.
Metode ini digunakan bila sumber data yang digunakan mempunyai ketelitian
yang sangat tinggi atau tingkat kesalahan yang rendah. Dalam hal ini, kurva
yang dibangun harus melalui semua titik-titik data yang digunakan.
Pada interpolasi terdapat beberapa jenis metode, diantaranya adalah :
(en.wikipedia.org/wiki/Interpolation)
- Piecewise Constant Interpolation
Metode ini merupakan metode interpolasi yang paling sederhana. Cara
kerja dari metode ini adalah dengan menempatkan nilai data yang paling
dekat, dan memberikan nilai yang sama. Metode ini jarang digunakan
pada satu dimensi data, metode ini seringkali digunakan pada data yang
lebih tinggi. Contoh dari Piecewise Constant Interpolation :
Gambar 2.10 Piecewise Constant Interpolation
- Linear Interpolation
Interpolasi linier merupakan satu dari metode yang sederhana lainnya.
Metode ini cenderung lebih cepat dan mudah untuk digunakan, namun
memiliki tingkat kepresisiannya kurang, karena hanya dapat bekerja
dengan baik pada fungsi berderajat 1 (satu). Contoh dari interpolasi linier
:
Gambar 2.11 Linear Interpolation
- Polynomial Interpolation
Interpolasi polinomial merupakan generalisasi dari interpolasi linier,
karena dapat digunakan untuk fungsi yang berderajat lebih tinggi.
Meskipun lebih unggul dibanding interpolasi linier. Contoh interpolasi
polinomial :
Gambar 2.12 Polynomial Interpolation
- Spline Interpolation
Interpolasi Spline menggunakan polinomial berderajat rendah pada tiap
intervalnya sehingga didapatkan grafik yang halus.
- Power Law
Power-law merupakan distribusi hukum pangkat. Distribusi ini
dinyatakan dalam persamaan sederhana P(x) = x-a (x pangkat minus a)
dengan a merupakan suatu bilangan konstan.
- Exponential Function
Fungsi ini biasa ditulis dalam notasi dengan notasi exp(x) atau ex, dimana
e adalah basis logaritma natural yang kira-kira sama dengan 2.71828183.
Sebagai fungsi variabel bilangan real x, grafik ex selalu positif (berada
diatas sumbu x) dan nilainya bertambah (dilihat dari kiri ke kanan).
Grafiknya tidak menyentuh sumbu x, namun mendekati sumbu tersebut
secara asimptotik. Invers dari fungsi ini, logaritma natural, atau ln(x),
didefinisikan untuk nilai x yang positif.
Gambar 2.13 Exponential Function
top related