bab 2 landasan teori - thesis.binus.ac.idthesis.binus.ac.id/doc/bab2/2010-2-00252-if bab 2.pdf · 8...

7

BAB 2

LANDASAN TEORI

Pada bab ini, penulis akan membahas mengenai teori yang digunakan dalam

penyusunan skripsi seperti Content Based Image Retrieval (CBIR), Latent Semantic

Indexing (LSI). Sebelum penulis membahas CBIR dan LSI, terlebih dahulu penulis

menjelaskan beberapa definisi dasar mengenai citra dan pengolahan citra.

2.1 Citra

2.1.1 Definisi

Adapun beberapa definisi citra sebagai berikut:

• Menurut Pearson (1991), citra adalah representasi dua dimensi dari

dunia visual, menyangkut berbagai macam disiplin ilmu yang mencakup

seni, human vision, astronomi, teknik, dan sebagainya. Merupakan suatu

kumpulan piksel-piksel atau titik-titik yang berwarna yang berbentuk

dua dimensi.

• Menurut Michael C. Fairhust (1994), suatu fungsi 2 dimensi, dimana

harga-harga fungsi tersebut f(x,y) pada koordinat spasial (x,y) di bidang

x dan y mendefinisikan suatu ukuran intensitas cahaya atau

kecermerlangan titik tersebut.

8

• Menurut Foley, James D (1996), citra adalah array dari nilai-nilai

dimana sebuah nilai tersebut adalah sekumpulan angka yang

mendeskripsikan atribut dari piksel di dalamnya.

• Menurut Wolfram Research, Inc (2002), citra adalah sinyal diskrit 2

dimensi. Secara matematis, sinyal ini dapat direpresentasikan sebagai

fungsi dari variable-variable 2 dimensi. Setiap elemen dari array

tersebut disebut piksel.

Citra sebagai keluaran dari suatu sistem perekaman data dapat bersifat

sebagai berikut :

1. Optik berupa foto,

2. Analog berupa sinyal video contohnya gambar pada monitor televisi,

3. Digital yang dapat langsung disimpan pada suatu pita magnetik.

Terdapat dua macam citra, yaitu:

• Citra diam

Merupakan citra tunggal yang tidak bergerak tetap, biasa disebut citra.

• Citra bergerak (moving images)

Merupakan rangkaian citra diam yang ditampilkan secara beruntun

(sekuensial) sehingga memberikan kesan pada mata kita sebagai gambar

yang bergerak. Setiap citra di dalam rangkaian tersebut disebut frame.

9

2.1.2 Citra Digital

Citra digital secara umum didefinisikan sebagai pemrosesan citra dua

dimensi dengan komputer. Dalam definisi yang lebih luas, pengolahan citra digital

juga mencakup semua data dua dimensi. Citra digital adalah barisan bilangan

nyata maupun kompleks yang diwakili oleh bit – bit tertentu. Unit terkecil dari

data digital adalah bit, yaitu angka biner, 0 atau 1. Kumpulan dari data sejumlah 8

bit data adalah sebuah unit data yang disebut byte, dengan nilai dari 0 – 255.

Dalam hal citra digital, nilai level energi dituliskan dalam satuan byte. Kumpulan

byte ini dengan struktur tertentu bisa dibaca oleh software dan disebut citra digital

8 bit.

Citra digital dapat didefinisikan sebagai fungsi dua variabel f(x,y), dimana x

dan y adalah koordinat spasial dan nilai f(x,y) adalah intensitas citra pada koordinat

tersebut, hal tersebut diilustrasikan pada gambar 2.1. Teknologi dasar untuk

menciptakan dan menampilkan warna pada citra digital berdasarkan penelitian

bahwa sebuah warna merupakan kombinasi dari tiga warna dasar, yaitu merah,

hijau, dan biru (Red, Green, Blue - RGB).

10

Gambar 2.1 Letak koordinat x1,y1, pada sebuah citra

Tiga tipe citra:

1. Citra grayscale (tingkat keabuan)

2. Citra berwarna (color)

3. Citra rumit/komplek (complex)

2.1.3 Citra Grayscale

Suatu citra dikatakan sebagai citra grayscale apabila sebuah citra tidak

memiliki warna RGB atau dapat dikatakan sebuah citra yang memiliki nilai dari

putih yang memiliki intensitas paling besar sampai hitam yang memiliki intensitas

paling rendah seperti yang dapat dilihat pada gambar 2.2. Citra grayscale terdiri

dari x dan y dalam spasial koordinat dan memiliki nilai intensitasnya masing-

masing. Pada citra grayscale setiap gambar memiliki intensitas antara 0 (hitam)

hingga 255 (putih) dalam citra 8 bitnya.

11

Gambar 2.2 Intensitas grayscale

254 255 255252 252 114255 205 101

254 . . . .7 . . . .

199 . . . .

. . 33 41 44

. . 180 100 128

. . 65 61 57205 181 122198 200 21597 213 115

234 . . . .245 . . . .217 . . . .

. . 123 143 98

. . 245 253 252

. . 221 224 24387 100 18423 35 65

211 211 67

142 . . . .43 . . . .

43. .. .

. .

. .

. . 233 211 215

. . 33 121 211. .

. . 254 121 213

Gambar 2.3 Citra grayscale yang diubah menjadi nilai matriks

12

Dengan algoritma perhitungan tingkat keabuan, piksel dari suatu citra yang

mengandung warna-warna RGB (Red, Green, Blue) diubah menjadi warna dalam

berbagai tingkat keabuan (I) dengan menjumlahkan nilau warna merah, hijau, dan

biru kemudian dibagi tiga sehingga didapatkan nilai rata-rata dari ketiga warna.

3

Gambar 2.4 Rumus grayscale berdasarkan RGB

2.1.4 Citra Berwarna

Citra berwarna merupakan citra yang ditampilkan dengan menggunakan Red

Green Blue (RGB) atau Hue Saturation Intensity (HSI) model. Intensitas

(intensity) merupakan tingkat kecerahan (lightness) dan ketajaman (brightness)

dari warna yang dipilih. Hitam asli (pure black) diangka 0 dan putih walaupun

hue ataupun saturation telah diatur. Saturation merupakan tingkat dari kemurnian

dari sebuah hue atau berkurangnya warna putih. Intensitas atau value merupakan

sebuah pengukuran dari sejumlah cahaya yang direfleksikan dari hue. Hue

merupakan dominan dari wavelength.

13

Gambar 2.5 RGB dan perpaduan warnanya

Gambar 2.6 Roda HSI

14

Gambar 2.7 RGB Gambar 2.8 Perbedaan HSV

Gambar 2.9 Perbedaan saturation dan value

15

2.1.5 Citra Kompleks (complex)

Citra kompleks disimpan dalam 64 bit floating point yang terdiri dari 32 bit

real (asli) dan 32 bit imaginary parts (bagian khayalan). Citra kompleks

mengandung informasi frekuensi yang menampilkan sebuah citra grayscale dan

sangat bermanfaat untuk diterapkan pada proses domain frekuensi ke citra data.

2.1.6 Histogram

Salah satu cara untuk memperbaiki suatu citra digital adalah dengan

mengatur level dari brightness dan contrast-nya. Variasi sebuah brightness akan

digambarkan pada suatu citra dengan menggunakan histogram tersebut dan

dimanipulasi dengan merubah histogram citra tersebut.

Histogram akan menempatkan beberapa piksel dengan brightness level

mereka yang sesuai. Untuk piksel dengan ukuran level brightness sebesar 8 bit,

maka brightness akan memiliki grey level yang berkisar antara 0 (hitam) sampai

255 (putih). Sehingga histogram yang memiliki nilai brightness yang lebih kecil

akan terlihat lebih gelap dibandingkan dengan yang memiliki nilai lebih besar.

Histogram yang memiliki grey level dibawah 120 memiliki tingkat

kegelapan yang lebih gelap, dimana warna gelap tersebut seperti ditunjukan

gambar 2.10 yang dimiliki oleh ban mobil dan bagian bawah mobil, serta

bayangan mobil yang memiliki warna cenderung hitam. Disini juga terlihat bahwa

apabila suatu gambar memiliki warna yang cenderung gelap maka secara

keseluruhan histogram akan berkonsentrasi ke arah kiri (hitam).

16

Gambar 2.10 Ban mobil dan histogramnya dengan grey level < 120

Gambar 2.11 Ban mobil dan histogramnya setelah dinaikkan nilai

brightness nya

Dengan penaikkan nilai brightness seperti yang ditunjukan gambar 2.11,

histogram cenderung merata dan agak sedikit terkonsentrasi ke arah kanan (putih).

2.2 Karakteristik Citra

2.2.1 Piksel (Pixel)

Piksel (pixel) atau picture element, dan kadang-kadang disebut juga dengan

“pel” merupakan satuan terkecil dari sebuah citra digital. Pada citra digital, jika

17

dilihat dengan teliti, maka terdapat banyak titik kecil berbentuk segi empat yang

membentuk citra, titik kecil tersebut disebut piksel.

Beberapa definisi piksel menurut para ahli:

• Oliver (1996)

Piksel merupakan titik yang merupakan penyusun dari citra yang

ditampilkan komputer.

• Michael C. Fairhust (1995)

Piksel merupakan titik terkecil yang telah didigitkan secara spasial dan

terdiri dari N x N sample yang terdistribusi secara sama.

• J.R Parker (1994)

Piksel merupakan bagian array 2 dimensi dari suatu raster image.

Setiap piksel mempresentasikan warna atau tingkat keabuan dan

terletak pada posisi vertikal dan horizontal, atau yang lebih dikenal

dengan baris dan kolom.

• Murni (1992)

Piksel merupakan bagian terkecil dari gambar yang mengandung

informasi.

• Adrian Low (1991)

Piksel dianggap sebagai bagian terkecil dari citra. Dapat berupa logika

maupun fisik. Dengan kata lain, dapat berupa lokasi elemen dari suatu

citra atau menampilkan salah satu dari tingkat keabuan.

18

Jumlah piksel per-satuan panjang menentukan resolusi citra tersebut. Makin

banyak piksel yang mewakili sebuah citra, maka makin tinggi resolusinya dan

makin halus citra digital tersebut.

piksel

Gambar 2.12 Piksel

Gambar 2.13 Citra 180x240 Gambar 2.14 Citra 100x133

Perbandingan citra 180 x 240 piksel dengan citra 100 x 133 piksel, tampak

kelihatan lebih jelas jika dengan citra 180 x 240 piksel dibandingkan dengan citra

100 x 133.

19

2.2.2 Kontras (Contrast)

Kontras adalah perbedaan brightness relative antara sebuah benda dengan

sekelilingnya pada citra. Sebuah bentuk tertentu mudah terdeteksi apabila pada

sebuah citra kontras antara bentuk tersebut dengan background tinggi. Teknik

pengolahan citra bisa dipakai untuk mempertajam kontras. Citra dapat

dimanipulasi menggunakan algoritma (persamaan matematik).

2.2.3 Resolusi

Resolusi dari sebuah citra adalah karakteristik yang menunjukkan level

kedetailan yang dimiliki oleh sebuah citra. Resolusi diwakili oleh sebuah piksel

sebagai elemen terkecil dari sebuah citra. Resolusi merupakan hal penting yang

perlu dipertimbangkan dalam rangka pemilihan citra yang akan digunakan

terutama dalam hal aplikasi, waktu, biaya, ketersediaan citra, dan fasilitas

komputasi.

Semakin tinggi tingkat resolusi suatu citra, berarti semakin banyak jumlah

piksel yang digunakan dalam citra tersebut, sehingga citra yang dihasilkan menjadi

lebih bersih dan halus.

2.3 Matriks (Matrix)

Matriks adalah suatu kumpulan angka-angka atau elemen-elemen yang disusun

menurut baris dan kolom, dimana jumlah baris dan kolom bisa sama maupun berbeda,

dimana panjang dan lebarnya ditunjukkan oleh banyaknya kolom-kolom dan baris-baris.

20

Matriks dalam suatu citra, menunjuk kepada ukuran pikselnya. Contohnya, jika

suatu citra grayscale memiliki ukuran 1024 x 768 piksel, maka jika diubah ke dalam

data matriks, maka akan berukuran matriks 1024 x 768.

Gambar 2.15 Matriks

2.4 Pengolahan Citra Digital (Digital Image Processing)

Image Processing merupakan bentuk dari signal processing, yang dimana

inputnya berupa citra (image), seperti foto atau video, dan output dari image processing

tersebut berupa karakteristik atau parameter yang berhubungan dengan citra tersebut.

Pengertian pengolahan citra yang lain adalah pemrosesan citra, khususnya dengan

menggunakan komputer menjadi citra yang kualitasnya lebih baik. Hasil output dari

pengolahan citra tidaklah harus berupa citra, tetapi dapat berupa bagian dari citra

tersebut.

Umumnya, operasi-operasi pada pengolahan citra diterapkan pada citra bila :

1. Perbaikan atau memodifikasi citra perlu dilakukan untuk meningkatkan

kualitas penampakan atau untuk menonjolkan beberapa aspek informasi

yang terkandung di dalam citra,

2. Elemen di dalam citra perlu dikelompokkan, dicocokkan, atau diukur,

21

3. Sebagian citra perlu digabung dengan bagian citra yang lain

Secara umum, operasi pengolahan citra dapat diklasifikasikan dalam beberapa

jenis sebagai berikut:

1. Perbaikan kualitas citra (image enhancement).

Jenis operasi ini bertujuan untuk memperbaiki kualitas citra dengan cara

memanipulasi parameter-parameter citra. Dengan operasi ini, ciri-ciri khusus

yang terdapat di dalam citra lebih ditonjolkan. Contoh-contoh operasi

perbaikan citra:

• Perbaikan kontras gelap/terang

• Perbaikan tepian objek (edge enhancement)

• Penajaman (sharpening)

• Pemberian warna semu (pseudocoloring)

• Penapisan derau (noise filtering)

2. Pemugaran citra (image restoration).

Operasi ini bertujuan menghilangkan atau meminimalkan cacat pada citra.

Tujuan pemugaran citra hampir sama dengan operasi perbaikan citra.

Bedanya, pada pemugaran citra penyebab degradasi gambar diketahui.

Contoh-contoh operasi pemugaran citra:

• Penghilangan kesamaran (deblurring).

• Penghilangan derau (noise)

3. Pemampatan citra (image compression).

Jenis operasi ini dilakukan agar citra dapat direpresentasikan dalam bentuk

yang lebih kompak sehingga memerlukan memori yang lebih sedikit. Hal

22

penting yang harus diperhatikan dalam pemampatan adalah citra yang telah

dimampatkan harus tetap mempunyai kualitas gambar yang bagus. Contoh

metode pemampatan citra adalah metode JPEG.

4. Segmentasi citra (image segmentation).

Jenis operasi ini bertujuan untuk memecah suatu citra ke dalam beberapa

segmen dengan suatu kriteria tertentu. Jenis operasi ini berkaitan erat dengan

pengenalan pola.

5. Penganalisa citra (image analysis)

Jenis operasi ini bertujuan menghitung besaran kuantitif dari citra untuk

menghasilkan deskripsinya. Teknik ini mengekstraksi ciri-ciri tertentu yang

membantu dalam identifikasi objek. Proses segmentasi kadangkala

diperlukan untuk melokalisasi objek yang diinginkan dari sekelilingnya.

Contoh-contoh operasi analisa citra:

• Pendeteksian tepi objek (edge detection)

• Ekstraksi batas (boundary)

• Representasi daerah (region)

6. Rekonstruksi citra (image reconstruction)

Jenis operasi ini bertujuan untuk membentuk ulang objek dari beberapa citra

hasil proyeksi. Operasi rekonstruksi citra banyak digunakan dalam bidang

medis. Misalnya beberapa foto rontgen dengan sinar X digunakan untuk

membentuk ulang gambar organ tubuh.

23

Beberapa macam proses dalam image processsing:

• Eucladean Geometry Transformation, meliputi pembesaran citra,

pengurangan citra, dan rotasi citra.

• Color Corrections, meliputi pengaturan kontras, dan kecerahan citra

(contras dan brightness), Quantization (Color translation ke pallet

warna yang lain).

• Digital Compositing, meliputi penggabungan antara 2 gambar atau

lebih. Proses ini biasa digunakan dalam proses pembuatan film untuk

membuat “Mattes”.

• Interpolation dengan menggunakan Bayer Filter Pattern,

Bayer Filter Pattern digunakan untuk menyusun ulang presentasi

komposisi pewarnaan RGB (Red Green Blue). Metode Bayer Filter

Pattern ditemukan oleh Dr.Bryce E.Bayer, sekarang ini metode Bayer

Filter banyak digunakan di teknologi single chip digital image censors

pada kamera digital, camcorder, dan scanner.

• Image Registrasition, meliputi kesesuaian antara dua gambar atau

lebih.

• Image Differencing, meliputi morphing yaitu efek khusus dalam film

dan animasi yang berubah (morphs) satu gambar ke lainnya melalui

transisi yang halus.

• Image Recognition, misalnya mengambil teks dari gambar dengan

menggunakan optical character recognition.

24

• Image Segmentation, mengacu pada proses partisi gambar digital

menjadi beberapa segmen (bagian dari pixels) (Juga dikenal sebagai

superpixels).

• High Dynamic Range Imaging, dengan menggunakan teknik

penggabungan dua atau beberapa gambar.

• Geometric Hashing, digunakan untuk pengenalan objek atau gambar

dua dimensi (dimensi x dan y) yang mewakili affine invariance.

Image processing biasanya mengarah kepada digital image processing. Digital

image processing adalah penggunaan dari algoritma komputer (computer algorithm)

untuk melakukan image processing yang lebih rumit (complex) pada citra digital (digital

image), dengan demikian dapat menyajikan kinerja yang lebih canggih dengan tugas

yang sederhana (simple task). Digital image processing, khususnya, merupakan satu-

satunya praktek teknologi untuk classification, feature extraction, pattern recognition,

projection, multi scale signal analysis.

2.4.1 Classification (Statistical Classification)

Merupakan suatu prosedur pembelajaran mesin yang di mana setiap item

akan ditempatkan dalam kelompok – kelompok berdasarkan informasi kuantitatif

pada satu atau lebih karakteristik yang melekat pada item seperti ciri-ciri, variabel,

karakter, dan didasarkan pada serangkaian pelatihan sebelumnya.

2.4.2 Feature Extraction

Melibatkan sejumlah sumber daya yang diperlukan untuk menjelaskan

sebuah set data besar secara akurat. Ketika melakukan analisis terhadap data yang

kompleks, salah satu masalah utama yang berasal dari jumlah variabel yang terlibat

25

analisis dengan sejumlah besar variabel biasanya membutuhkan sejumlah memori

yang besar dan daya komputasi atau algoritma klasifikasi yang overfits. Feature

extraction merupakan istilah umum untuk membangun metode kombinasi dari

variabel-variabel sekelilingnya. Masalah saat ini masih menggambarkan data

dengan akurasi yang memadai

2.4.3 Pattern Recognition

Merupakan “tindakan mengambil data mentah dan mengambil tindakan

berdasarkan kategori pola”. Tujuannya adalah untuk mengelompokan data pola

yang didasarkan pada apriori baik pengetahuan atau informasi statistik diambil

dari pola-pola. Pola harus diklasifikasikan kelompok pengukuran atau

pengamatan, menentukan titik dalam ruang multidimensi yang tepat.

2.4.4 Multiscale Signal Analysis (Signal Processing)

Merupakan suatu spesialisasi dalam teknik elektro yang mempelajari dan

mengembangkan metode algoritma, manipulasi, analisa dan interpretasi sinyal.

Sinyal dapat berarti suara, citra, waktu berbagai nilai dan sensor data, misalnya

data biologis seperti elektrokardiogram, sistem kontrol sinyal.

2.5 Kecerdasan Buatan (Artificial Intelligence)

2.5.1 Definisi Kecerdasan Buatan

Kecerdasan buatan (Artificial Intelligence), atau disebut juga dengan

intelegensia semu, merupakan kecerdasan atau pengetahuan dari suatu mesin dan

merupakan cabang dari ilmu komputer (computer science), yang bertujuan untuk

menciptakan kecerdasan mesin. Kecerdasan buatan merupakan ilmu yang

26

membahas mengenai perancangan mesin supaya mesin dapat menemukan solusi

untuk menyelesaikan masalah yang kompleks (rumit) dalam kehidupan manusia

sehari – hari.

Beberapa definisi kecerdasan buatan, diantaranya:

• Charniak dan mcdermot (1984)

Kecerdasan buatan adalah kemampuan berpikir melalui model-

model dan perhitungan atau komputasi.

• H.A. Simon (1987)

Kecerdasan buatan merupakan kawasan penelitian, aplikasi dan

instruksi yang terkait dengan pemrograman komputer untuk

melakukan sesuatu hal yang dalam pandangan manusia adalah

cerdas.

• Levine et al (1990)

Kecerdasan buatan adalah suatu cara membuat komputer dapat

berpikir secara pintar.

• Rich and Knight [1991]:

Kecerdasan buatan merupakan studi tentang bagaimana

membuat komputer melakukan hal-hal yang pada saat ini dapat

dilakukan lebih baik oleh manusia.

• Turban (1992)

27

Kecerdasan buatan adalah bagian dari ilmu komputer yang

ditujukan untuk membuat software dan hardware menghasilkan

sesuatu seperti yang dihasilkan seperti yang dihasilkan manusia.

• Encyclopedia Britannica

Kecerdasaan buatan merupakan cabang dari ilmu komputer yang

dalam merepresentasi pengetahuan lebih banyak menggunakan

bentuk simbol-simbol daripada bilangan, dan memproses

informasi berdasarkan metode heuristic atau dengan berdasarkan

sejumlah aturan.

Tujuan dari kecerdasan buatan menurut Winston dan Prendergast, yaitu:

1. Membuat mesin menjadi lebih pintar, (tujuan utama)

2. Memahami apa itu kecerdasaan, (tujuan ilmiah)

3. Membuat mesin lebih bermanfaat.(tujuan entrepreneurial)

Menurut Stuart Russell dan Peter Norvig, definisi artificial intelligence

dapat dibagi menjadi :

• Sistem berpikir seperti manusia

• Sistem bertingkah seperti manusia

• Sistem bertingkah secara rasional

28

Gambar 2.16 Domain penelitian dalam kecerdasan buatan

2.5.2 Sejarah Artificial Intelligence

Kecerdasan buatan (artificial intelligence), termasuk dalam bidang ilmu yang

relative muda. Tahun 1950, para ilmuwan mulai meneliti bagaimana agar mesin

dapat melakukan perkerjaan dan berpikir seperti manusia. Alan Turing, seoran g

matematika dari Inggris, yang pertama kali mengusulkan adanya test untuk

mengetahui apakah suatu mesin dapat dikatakan cerdas.

Artificial intelligence (AI) atau disebut juga dengan kecerdasan buatan,

dimunculkan oleh seorang profesor dari Massachusettes institute of technology,

yang bernama John McCarthy pada tahun 1956 pada Darthmouth Conferrence

yang dihadiri oleh para peneliti AI.

Adapun beberapa program AI. yang mulai dibuat pada tahun 1956 – 1966

antara lain:

29

1. Logic Theorist, diperkenalkan pada Darthmouth Conferrence

Program ini dapat membuktikan teorema-teorema matematika.

2. Sad Sam, diprogram oleh Robert K. Lindsay 1960

Program ini dapat mengetahui kalimat – kalimat sederhana yang

ditulis dalam bahasa inggris, dan mampu memberikan jawaban

atas fakta – fakta yang didengar dalam sebuah percakapan.

3. ELIZA, diprogramkan oleh Joseph Weizenbaun 1967

Program ini mampu melakukan terapi terhadap pasien dengan

memberikan beberapa pertanyaan.

2.5.3 Ruang Lingkup Artificial Intelligence

Adapun ruang lingkup utama dalam Artificial Intelligence (kecerdasan

buatan) adalah sebagai berikut :

1. Sistem Pakar, atau disebut juga dengan Expert System

Komputer digunakan sebagai sarana untuk menyimpan

pengetahuan para pakar, dengan demikian mesin akan memiliki

keahlian untuk menyelesaikan permasalahan dengan keahlian

yang dimiliki oleh pakar.

2. Pengolahan Bahasa Alami (Natural Language Processing)

Dengan pengolahan bahasa alami ini, diharapkan user dapat

berkomunikasi dengan mesin dengan menggunakan bahasa

sehari-hari.

3. Pengenalan Ucapan (Speech Recognition)

30

Melalui pengenalan ucapan, diharapkan manusia dapat

berkomunikasi dengan mesin dengan menggunakan suara.

4. Robotika system sensor (Robotic and sensory system)

Sistem sensor, seperti system vision, system tactile, dan system

pemrosesan sinyal jika dikombinasikan dengan AI, dapat

dikategorikan kedalam suatu system yang luas yang disebut

system robotic.

5. Computer Vision

Mencoba untuk dapat menginterprestasikan gambar atau objek –

objek tampak melalui computer.

6. Intelligent Computer-Aided Instruction,

Komputer dapat digunakan sebagai tutor yang dapat melatih dan

mengajar.

7. Permainan (Game)

Menurut Sri Kusuma Dewi, games adalah fasilitas yang sangat

menarik dalam komputer. Ide games pertama kali dikenalkan

oleh Claude Shannon (1950) yang menuliskan paper tentang

permainan catur.

Keuntungan kecerdasan buatan dibanding kecerdasan alamiah:

• Lebih permanen,

• Memberikan kemudahan dalam duplikasi dan penyebaran,

• Relatif lebih murah dari kecerdasan alamiah,

• Konsisten dan teliti,

31

• Dapat didokumentasi,

• Dapat mengerjakan beberapa task dengan lebih cepat dan lebih

baik dibandingkan dengan manusia.

Keuntungan kecerdasan alamiah dibanding kecerdasan buatan :

• Bersifat kreatif,

• Dapat melakukan proses pembelajaran secara langsung,

sementara kecerdasan buatan harus mendapatkan masukan

berupa symbol dan reperesentasi-representasi.

• Fokus yang luas sebagai referensi untuk pengambilan keputusan

sebaliknya kecerdasan buatan menggunakan fokus yang sempit.

Sistem yang menggunakan kecerdasan buatan akan memberikan output

berupa solusi dari suatu masalah berdasarkan kumpulan pengetahuan yang ada.

Secara umum, untuk membangun suatu system yang mampu menyelesaikan

masalah, perlu dipertimbangkan 4 hal yaitu :

1. Mendefinisikan masalah dengan tepat.

Pendefinisian ini mencakup spesifikasi yang tepat mengenai

keadaan awal dan solusi yang diharapkan.

2. Menganalisis masalah tersebut serta mencari beberapa

teknik penyelesaian masalah yang sesuai.

3. Merepresentasikan pengetahuan yang perlu untuk

menyelesaikan masalah tersebut.

4. Memilih teknik penyelesaian masalah yang terbaik.

32

Sehingga untuk mendeskripsikan masalah dengan baik harus:

1. Mendefinisikan suatu keadaan ruang keadaan (state space).

2. Menetapkan satu atau lebih keadaan awal (initial state).

3. Menetapkan satu atau lebih tujuan (goal state).

4. Menetapkan kumpulan aturan.

2.6 Computer Vision

Pada hakikatnya, computer vision mencoba meniru cara kerja system visual

manusia (human vision). Computer Vision merupakan proses otomatis yang

mengintegrasikan sejumlah besar proses untuk persepsi visual, seperti akuisisi citra,

pengolahan citra, klasifikasi, pengenalan (recognition), dan membuat keputusan.

Computer Vision berkaitan dengan teori dibalik sistem buatan (artificial systems), yang

mengekstrak informasi dari suatu citra.

Proses-proses di dalam computer vision dapat dibagi menjadi tiga aktivitas:

1. Memperoleh atau mengakuisisi citra digital.

2. Melakukan teknik komputasi untuk memperoses atau memodifikasi

data citra (operasi-operasi pengolahan citra).

3. Menganalisis dan menginterpretasi citra dan menggunakan hasil

pemrosesan untuk tujuan tertentu, misalnya memandu robot,

mengontrol peralatan, memantau proses manufaktur, dan lain -lain.

Beberapa ahli mendefinisikan Computer Vision sebagai berikut:

• Menurut Michael C. Fairhurst (1995)

33

Computer vision sesuai dengan sifatnya, merupakan suatu objek yang

merangkul berbagai disiplin tradisional secara luas guna mendasari prinsip-

prinsip formalnya, dan dalam mengembangkan suatu metodologi yang

berlainan dari apa yang dimilikinya, pertama-tama harus menggabungkan

dan secara berurutan membangun materi yang mendasarkan ini.

• Adrian Low (1991)

Computer vision berhubungan dengan perolehan gambar, pemrosesan,

klasifikasi, pengenalan, dan menjadi penggabungan, pengurutan pembuatan

keputusan menuju pengenalan.

• J.R. Parker (1994)

Computer vision menyangkut pengekstrakan informasi dari citra, dan dalam

identifikasi dan klasifikasi objek-objek dalam citra.

Daerah atau bagian yang paling erat dengan Computer Vision itu sendiri yaitu,

image processing, machine vision, dan image analysis.

Image processing dan image analysis, berfokus pada pemrosesan citra 2 dimensi,

bagaimana merubah suatu citra menjadi citra yang lain, seperti contrast enhancement

(penambahan terang), edge extraction (penambahan garis tepi), noise removal, atau

geometrical transformation seperti rotasi citra.

Machine vision cenderung berfokus terhadap aplikasi terutama dalam bidan g

manufaktur seperti robot otonom berbasis vision dan sistem untuk vision berdasarkan

pengukuran. Ini mengimplementasi teknologi sensor citra dan teori control seringkali

terintegrasi dengan pengolahan data citra untuk mengendalikan robot dan yang real time

processing ditekankan dengan cara yang efisien implementasi di hardware dan software.

34

Hal ini juga menyiratkan bahwa kondisi-kondisi eksternal seperti pencahayaan dapat dan

sering lebih terkontrol dalam machine vision daripada di computer vision pada

umumnya.

2.7 Content Based Image Retrieval (CBIR)

2.7.1 Sejarah

Istilah CBIR berasal dari tahun 1992, ketika digunakan oleh T. Kato untuk

mendeskripsikan eksperimen automatic retrieval image dari sebuah database

berdasarkan warna dan bentuk. Istilah tersebut untuk menggambarkan proses

pengambilan citra yang diinginkan dari sebuah koleksi database besar berdasarkan

fitur sintaksis gambar. Teknik-teknik, alat dan algoritma yang digunakan berasal

dari bidang-bidang seperti statistik, pengenalan pola, pemrosesan sinyal.

2.7.2 Konsep Dasar

CBIR (Content Based Image Retrieval), atau disebut juga Query by Image

Content (QBIC) merupakan suatu aplikasi dari Computer Vision untuk masalah

image retrieval (pengambilan citra), yaitu sebuah teknik yang menggunakan

content visual dari citra tetap dalam mencari kesamaan citra dalam citra database

yang sangat besar menurut input atau sesuai dengan keinginan pengguna (user).

Content based berarti pencarian akan menganalisa isi sebenarnya dari citra.

Menganalisa dalam konteks dapat berarti berupa warna, bentuk, tekstur, atau

informasi lain yang terdapat dalam citra tersebut. Tanpa kemampuan dalam

35

memeriksa konten citra, pencarian harus tergantung pada metadata seperti judul

dan kata kunci yang susah payah atau mahal untuk diproduksi.

2.7.3 Sistem Software dan Teknik

Banyaknya sistem CBIR dibangun, namun masalah mengambil citra

berdasarkan konten piksel sebagian besar sampai saaat ini belum terpecahkan.

Teknik Query, Implementasi berbeda dari CBIR memanfaatkan berbagai

jenis query user sebagai berikut :

1. Query by example

Teknik query yang melibatkan sistem CBIR dengan contoh gambar yang

kemudian mendasarkan pada pencarian.

2. Semantic Retrieval

Sistem ideal CBIR dari perspektif pengguna akan melibatkan apa yang

disebut sebagai semantic retrieval dimana pengguna melakukan

permintaan seperti contoh “find pictures of dogs”.

3. Metode query lain seperti :

• browsing for example images,

• navigating customized / hierarchical categories,

• querying by image region,

• querying by multiple example images,

• querying by visual sketch,

• querying by direct specification of image features,

• multimodal queries.

36

Konten teknik perbandingan, metode yang digunakan untuk mengekstrak

konten dari citra sehingga memudahkan untuk dibandingkan.

1. Colour, pengambilan citra berdasarkan kesamaan warna yang ada

dengan menghitung sebuah color histogram untuk setiap citra yang ada

untuk mengidentifikasikan piksel dalam nilai-nilai sebuah citra.

2. Teksture, ukuran tekstur dilihat untuk pola visual dalam citra dan

bagaimana mereka terdefinisikan secara spasial.

3. Shape, bentuk tidak harus kepada bentuk citra tetapi bentuk berdasarkan

citra daerah tertentu yang sedang dicari.

CBIR merupakan kombinasi dari beberapa pengetahuan yang berbeda, seperti:

• pattern recognition,

• wavelet filtering,

• machine learning,

• object matching,

CBIR ditujukan untuk pengertian karakteristik visual dari suatu citra tanpa

penjelasan tulisan. Penelitian dan isu pembangunan di CBIR mencakup berbagai

topik, banyak berbagi dengan arus utama pengolahan gambar dan pengambilan

informasi. Beberapa yang paling penting adalah :

• Pemahaman citra kebutuhan pengguna dan informasi perilaku mencari.

• Identifikasi cara-cara yang sesuai untuk menggambarkan isi citra.

37

• Mengekstraksikan fitur tersebut dari citra mentah.

• Menyediakan penyimpanan untuk citra database yang besar.

• Mencocokkan query dan citra yang disimpan dengan sebuah cara yang

mencerminkan kesamaan.

• Mengakses citra yang disimpan secara efisien berdasarkan isi.

• Menyediakan antarmuka yang dapat digunakan manusia untuk sistem

CBIR.

Contoh penerapan aplikasi CBIR:

• Pencegah kejahatan (crime prevention)

Contohnya: Automatic Face Recognition.

• Pengecekan keamanan (security check)

Contohnya: Fingerprint, retina scanning

• Diagnosis medis (medical diagnosis)

Contohnya: CT-scan, MRI, Ultrasound Intellectual Property: untuk

Trademark (menjaga property kepemilikan)

• Image Search Engine (WWW-World Wide Web)

2.8 Image Retrieval

Image Retrieval (Pengambilan citra) adalah suatu sistem komputer untuk

menelusuri (browsing), mencari (searching), dan pengambilan citra (image retrieval)

dari suatu database yang besar pada citra-citra digital (digital images). Sebagian besar

cara lama dan umum metode pada image retrieval memanfaatkan metode penambahan

38

metadata seperti captioning, keywords, atau deskripsi dari pada citra tersebut sendiri

sehingga dapat disajikan dengan penjelasan kata – kata.

2.9 Latent Semantic Indexing (LSI)

2.9.1 Definisi

Latent Semantic Indexing merupakan metode pengambilan (retrieval) dan

indexing menggunakan teknik matematika yang disebut dengan Singular Value

Decomposition (SVD). Pengambilan citra menggunakan Latent Semantic Indexing

telah digunakan, yaitu dengan pengindeksan berdasarkan teks (context based) atau

dengan pengindeksan berdasarkan citra (content based).

2.9.2 Penerapan LSI

LSI dapat diterapkan dalam Context Based Information Retrieval dan

Content Based Image Retrieval. LSI dalam Context Based Information Retrieval

dapat berdasarkan penjelasan–penjelasan yang dimana ditambahkan untuk

menyingkapkan citra (kata kunci (keyword), keterangan ), atau pada teks tambahan

yang “sengaja” tersedia dengan sebuah citra (judul halaman, judul tambahan, dekat

teks). Dari teks tersebut, pengindeksan dapat diciptakan menggunakan teknik

standard pengambilan teks. Kesamaan antara citra dimana yang pada gilirannya

sering didasarkan pada kesamaan penggunaan kata. Masalah yang penting dengan

pendekatan Context Based Information Retrieval ini adalah perbedaan pada

penggunaan kata diantara dokumen-dokumen, diantaranya:

39

• Dokumen dapat membahas topik yang sama dengan menggunakan

kata-kata berbeda (sinonim)

• Menggunakan kata-kata yang sama yang menggambarkan konsep-

konsep yang berbeda (ambiguitas)

LSI dalam Content Based Image Retrieval (CBIR) menggunakan query by

example (QBE) telah menjadi terkenal beberapa tahun belakangan ini. Sistem

CBIR mencoba untuk mengenal citra yang secara visual paling mirip untuk contoh

citra. kesamaan didasarkan pada seperangkat citra dengan fitur-fitur tingkat

rendah. Fitur yang dapat digunakan untuk pengindeksan citra yaitu warna, tekstur,

bentuk dan tata ruang.

Beberapa penelitian tentang fitur yang paling cocok dengan persepsi

manusia telah dilakukan, misalnya penelitian yang dilakukan oleh Gargi dan

Kasturi (1996) serta Liu dan Picard (1996), tetapi fitur apa yang paling cocok

dengan persepsi manusia sebagian karena adanya keterlibatan subjektivitas karena

mustahil bahwa fitur ada secara keseluruhan.

Masalah penting dalam pengindeksan berbasis konten adalah kenyataan

kesamaan visual yang tidak sesuai dengan kesamaan semantik. Oleh karena itu,

bahkan jika fitur ada yang sesuai dengan visi manusia, tetap pengambilan citra

tidak selalu berkaitan dengan contoh citra pada tingkat semantik. Masalah ini

dikenal sebagai kesenjangan semantik (semantic gap) dan menyebabkan sistem

pengambilan citra untuk mengambil citra yang agak mirip dengan fitur.

40

2.9.3 Keuntungan dan Kerugian LSI

Keuntungan LSI adalah sebagai berikut :

1. True(latent)dimensions

Asumsi di LSI (dan juga untuk bentuk-bentuk lain dari dimensi

pengurangan seperti analisis komponen utama) adalah bahwa dimensi

baru adalah lebih baik representasi dokumen dan query. Metafora yang

mendasari istilah "laten" adalah bahwa dimensi-dimensi baru adalah

representasi benar. Ini benar representasi kemudian tertutup oleh proses

generasi yang menyatakan dimensi tertentu dengan satu set kata-kata

dalam beberapa dokumen dan berbagai set kata-kata dalam dokumen

lain. analisis LSI pulih asli semantik struktur ruang dan dimensi aslinya.

2. Synonymy

Sinonim mengacu pada fakta bahwa konsep dasar yang sama dapat

dijelaskan menggunakan istilah yang berbeda. strategi pengambilan

tradisional mengalami kesulitan menemukan dokumen pada topik yang

sama yang menggunakan kosa kata yang berbeda. Dalam LSI, konsep

dalam pertanyaan serta semua dokumen yang terkait dengan itu semua

mungkin diwakili oleh kombinasi variable indeks.

3. Polysemy

Polisemi menggambarkan kata-kata yang memiliki lebih dari satu arti,

yang umum. Besar jumlah kata polysemous dalam query dapat

mengurangi ketepatan pencarian secara signifikan. Dengan

menggunakan sistem di LSI, satu kesempatan untuk menghapus

beberapa noisy dari data, yang dapat digambarkan sebagai penggunaan

41

langka dan kurang penting istilah tertentu. . Karena istilah vektor LSI

hanya menimbang rata-rata yang berbeda makna dari istilah, ketika

makna sesungguhnya berbeda dari arti rata-rata, LSI benar-benar dapat

mengurangi kualitas pencarian.

4. Term Dependence

Model ruang vektor tradisional menganggap merdeka dan istilah istilah

melayani sebagai dasar vektor ortogonal dari ruang vektor. Karena ada

yang kuat asosiasi antara istilah dalam bahasa, asumsi ini tidak pernah

puas. Sementara istilah kemerdekaan merupakan pendekatan orde

pertama yang paling masuk akal, mungkin untuk mendapatkan

peningkatan kinerja dengan menggunakan istilah dalam asosiasi proses

pengambilan. Menambahkan frasa umum sebagai item pencarian yang

sederhana penerapan pendekatan ini.

Kerugian LSI adalah sebagai berikut :

1. Storage

Satu juga dapat berargumentasi bahwa representasi SVD lebih kompak.

Banyak dokumen yang memiliki lebih dari 150 istilah yang unik. Jadi

representasi vektor jarang akan memakan ruang penyimpanan lebih dari

representasi SVD kompak jika kita mengurangi sampai 150 dimensi.

2. Efficiency

Salah satu kecepatan yang paling penting dalam pencarian vektor ruang

berasal dari menggunakan indeks terbalik. Akibatnya, hanya dokumen

yang memiliki beberapa istilah umum dengan query harus diperiksa

selama pencarian. Dengan LSI, bagaimanapun pertanyaan harus

42

dibandingkan dengan setiap dokumen dalam koleksi. Namun, beberapa

faktor yang dapat mengurangi atau menghilangkan kekurangan ini. Jika

query memiliki jangka lebih dari perwakilannya dalam ruang vektor

LSI, maka hasil kali dalam nilai kemiripan akan mengambil lebih

banyak waktu untuk menghitung dalam ruang panjang.

3. LSI and normally-distributed data

Keberatan lain untuk SVD adalah bahwa dengan semua metode lain,

benar-benar dirancang untuk data terdistribusi normal, namun distribusi

tersebut tidak cocok untuk menghitung data, dan data perhitungan yang

panjang terdiri dari oleh-dokumen matriks.

2.9.4 Aplikasi LSI

Beberapa aplikasi LSI yaitu

• Information retrieval

• Relevance Feedback

• Information Filtering

• TREC

• Noisy Input

2.10 Precision dan Recall

Precision dapat dilihat sebagai ukuran ketepatan, sedangkan Recall merupakan

ukuran dari kelengkapan.

Dalam information retrieval, Precision didefinisikan sebagai jumlah dokumen

yang relean diambil oleh pencarian dibagi dengan total jumlah dokumen yang diambil

43

oleh pencarian. Recall didefinisikan sebagai jumlah dokumen yang relevan diambil oleh

pencarian dibagi dengan jumlah dokumen yang relevan yang ada.

Precision dengan nilai sempurna 1.0 berarti bahwa setiap hasil diambil oleh

pencarian relevan, sedangkan Recall dengan nilai sempurna 1.0 berarti semua dokumen

yang relevan diambil oleh pencarian

2.11 Mikroorganisme

2.11.1 Definisi

Mikroorganisme atau mikroba adalah suatu organisme yang mikroskopik

(berukuran terlalu kecil untuk dilihat dengan mata telanjang manusia). Studi

mikroorganisme disebut mikrobiologi.

Mikroorganisme hidup di semua bagian biosfer dimana terdapat cairan air,

termasuk tanah, air panas, di laut lantai, tinggi di atmosfer dan jauh di dalam batu-

batuan di dalam bumi kerak. Mikroorganisme sangat penting untuk daur ulan g

nutrisi dalam ekosistem ketika mereka bertindak sebagai dekomposer.

2.11.2 Klasifikasi dan Struktur

Mikroorganisme hampir dapat ditemukan di mana saja di taksonomi

organisasi hehidupan di planet ini. Bakteri dan archaea hampir selalu mikroskopik,

jumlah eukariota juga mikroskopik, termasuk protista, beberapa jamur, beberapa

hewan dan tumbuhan. Virus umumnya dianggap tidak hidup dan demikian tidak

mikroba, meskipun bidang mikrobiologi juga mencakup studi tentang virus.

44

2.11.3 Bakteri

Bakteri berasal dari kata Latin bacterium (jamak, bacteria), adalah kelompok

raksasa dari organisme hidup. Bakteri sangatlah kecil dan kebanyakan uniselular

(bersel tunggal), dengan struktur sel yang relatif sederhana tanpa nukleus/inti sel,

cytoskeleton, dan organel lain seperti mitokondria dan kloroplas. Kebanyakan dari

mereka kecil, biasanya hanya berukuran 0,5-5 μm, meski ada jenis dapat

menjangkau 0,3 mm dalam diameter. Oleh karenanya, bakteri disebut mikroskopik

karena hanya dapat dilihat melalui mikroskop. Bakteri di dunia diperkirakan

sekitar 5 × 1030.

Bakteri pertama ditemukan oleh Anthony van Leeuwenhoek pada 1674.

Istilah bacterium diperkenalkan di kemudian hari oleh Ehrenberg pada tahun

1828, diambil dari kata Yunani βακτηριον yang memiliki arti "small stick".

Berdasarkan bentuknya, bakteri dibagi menjadi tiga golongan besar, yaitu:

• Kokus (Coccus) dalah bakteri yang berbentuk bulat seperti bola, dan

mempunyai beberapa variasi sebagai berikut:

o Mikrococcus, jika kecil dan tunggal

o Diplococcus, jka bergandanya dua-dua

o Tetracoccus, jika bergandengan empat dan membentuk

bujursangkar

o Sarcina, jika bergerombol membentuk kubus

o Staphylococcus, jika bergerombol

o Streptococcus, jika bergandengan membentuk rantai

45

• Basil (Bacillus) adalah kelompok bakteri yang berbentuk batang atau

silinder, dan mempunyai variasi sebagai berikut:

o Diplobacillus, jika bergandengan dua-dua

o Streptobacillus, jika bergandengan membentuk rantai

• Spiril (Spirilum) adalah bakteri yang berbentuk lengkung dan

mempunyai variasi sebagai berikut:

o Vibrio, (bentuk koma), jika lengkung kurang dari setengah

lingkaran

o Spiral, jika lengkung lebih dari setengah lingkaran

Gambar 2.17 Morfologi bakteri

bab 2 landasan teori - thesis.binus.ac.idthesis.binus.ac.id/doc/bab2/2010-2-00252-if bab 2.pdf · 8...

Documents