paper ekstraksi ciri warna, bentuk, dan tekstur untuk pen gen alan citra ikan

Upload: siti-fatimah

Post on 09-Jul-2015

1.075 views

Category:

Documents


12 download

TRANSCRIPT

Ekstraksi Ciri Warna, Bentuk, dan Tekstur untuk Pengenalan Citra IkanS. Fatimah dan S.H. Wijaya Departemen Ilmu Komputer, Institut Pertanian Bogor Kampus Darmaga, Jl. Meranti Wing 20 Level V, Bogor, Jawa Barat, Indonesia Email: [email protected]

ABSTRACT Fishes are the most numerous and diverse of the major vertebrate groups causing difficulties in fish image recognition. Therefore, feature extraction in content-based image retrieval is needed to obtain pattern or fish features. This research uses freshwater fish images categorized based on the family. This research started with collected fish images from Axelrods Mini-Atlas of Freshwater Aquarium Fishes Mini-Edition. The first step in this research is segmented fish images with expectation maximization algorithm for grouping color contained into images. Next step is image extraction method by using three image visual features (color, shape, texture). Color feature extraction with Fuzzy Color Histogram (FCH) method is used through computing the membership function using Cauchy function. Shape feature is extracted using Hough Transform Circle and Cooccurrence Matrix method is computed for texture feature extraction. Similarity value between image query and images in database is then computed based on its features (color, shape, and texture) using cosine similarity. Those features were combined with Bayesian Network Model. Average precision value on all families fish images database for color, shape, texture and bayesian network are 0.2586, 0.2589, 0.2479, 0.2639 respectively. However, they dont significantly different.

Keywords: fishes, feature extraction, content-based image retrieval (CBIR), fuzzy color histogram, hough transform circle, bayesian network model LATAR BELAKANG Ikan adalah kelompok hewan tidak bertulang belakang yang jumlahnya paling banyak dan bermacam-macam jenisnya (Moyle & Cech 2006). Hal tersebut menyebabkan sulitnya pengenalan citra ikan. Oleh karena itu, diperlukan ekstraksi ciri untuk sistem temu kembali sebagai pengenalan citra ikan dengan pendekatan Content Based Image Retrieval (CBIR). CBIR yaitu temu kembali citra yang didasarkan pada informasi yang secara langsung diekstrak dari piksel (Chen Y et al. 2004). Informasi tersebut seperti warna, bentuk, dan tekstur yang terkandung dalam citra. Tahap utama CBIR antara lain praproses, ekstraksi ciri, pengindeksan, dan penemuan kembali citra. Ekstraksi ciri merupakan salah satu tahapan penting dari pengenalan citra. Terdapat empat penelitian sebelumnya yang terkait dengan ekstraksi ciri. Pertama, Balqis (2006) mengimplementasikan Fuzzy Color Histogram untuk ekstraksi ciri warna pada citra bunga. Kedua, Wahyuningsih (2006) mengimplementasikan metode Hough Transform untuk ekstraksi ciri bentuk pada citra bunga. Penelitian ketiga, Hastuti (2007) menerapkan algoritme Expectation Maximization (EM) untuk segmentasi citra pada sistem CBIR. Penelitian tersebut menunjukkan bahwa penerapan algoritme EM untuk segmentasi citra memberikan hasil temu kembali yang lebih baik daripada hasil temu kembali dengan segmentasi manual. Penelitian keempat, Pebuardi (2008) mengimplementasikan Bayesian Network pada pengukuran kemiripan citra berdasarkan warna menggunakan Conventional Color Histogram (CCH), bentuk menggunakan Edge Direction, dan tekstur menggunakan Co-occurence Matrix dengan data citra yang beragam. Secara umum, model Bayesian Network tersebut dapat digunakan untuk meningkatkan nilai precision hasil temu kembali. Penelitian ini mengimplementasikan metode ekstraksi warna menggunakan Fuzzy Color Histogram, ekstraksi bentuk dengan Hough Transform dan ekstraksi tekstur menggunakan Co-occurence Matrix dengan terlebih dahulu menerapkan segmentasi menggunakan algoritme EM. Penelitian ini juga menggunakan Bayesian Network dalam pengukuran kemipiran dengan menggabungkan informasi warna, bentuk, dan tekstur pada citra ikan.

METODE PENELITIAN Data Data yang digunakan adalah hasil pengambilan citra menggunakan kamera digital pada buku Mini-Atlas of Freshwater Aquarium Fishes Mini-Edition (Axelrod 1995). Objek citra ikan hias air tawar ini dikelompokkan menjadi delapan berdasarkan famili. Setiap kelompok ikan diambil sebanyak 40 citra yang memiliki kualitas foto terbaik sehingga total data yang digunakan sebanyak 320 citra. Segmentasi Pada tahap segmentasi dengan algoritme EM, setiap citra akan disegmentasi untuk mengelompokkan warna yang dikandung oleh setiap piksel dari citra ke beberapa segmen yang sudah ditentukan jumlahnya. Segmen ini merupakan representasi dari warna-warna dominan citra. Setiap piksel dari citra dibangkitkan dari salah satu G segmen, masingmasing segmen diasumsikan mempunyai distribusi normal Gauss. Algoritme EM mempunyai dua tahapan utama yaitu tahapan Expectation (E-step) dan Maximization (M-step). Pada tahapan Expectation, data X diasumsikan sebagai data yang tidak lengkap dengan missing value berupa label yang menyatakan keanggotaan tiap piksel dari X ke dalam salah satu G segmen. Tahapan ini menghitung peluang tiap piksel dari tiap segmen dan membentuk matriks Z yang akan melengkapi data X sehingga data yang lengkap dapat dinyatakan sebagai Y = (X,Z). Label tiap piksel didapatkan dari segmen yang mempunyai peluang tertinggi dalam Z. Pada tahapan Maximization, parameter untuk iterasi berikutnya ditentukan sesuai dugaan variabel dari Z. Nilai parameter yang baru dari M-step ini akan digunakan kembali untuk E-step pada iterasi berikutnya. Proses Estep dan M-step akan terus berulang sampai didapatkan nilai likelihood yang kecil sehingga hasil perhitungan sudah tidak terlalu banyak mengalami perubahan. Ketika nilai likelihood hanya sedikit berubah, maka hasil dianggap konvergen. Ekstraksi Ciri a Ekstraksi ciri warna Pada penelitian ini, nilai warna kuantisasi awal tersebut didasarkan pada sebaran warna citra dalam basis data yang memiliki delapan kelompok famili citra ikan dengan jenis dan warna yang bervariasi. Setiap famili citra ikan diambil 10, 15, 20,

25, dan 30 warna piksel yang muncul terbanyak. Warna piksel yang diambil adalah 15 warna terbanyak yang muncul pada setiap famili karena meningkatkan nilai precision temu kembali sehingga dihasilkan 120 warna semesta tanpa ada warna yang sama. Dari histogram awal dihasilkan jumlah ciri yang terlalu banyak sehingga diperlukan waktu komputasi yang besar untuk ekstraksi ciri sebuah citra. Oleh karena itu perlu dilakukan pengelompokan warna (clustering) dari 120 warna semesta tersebut ke dalam beberapa pusat cluster. Beberapa jumlah bin untuk kuantisasi warna yang digunakan adalah 10, 15, 20, 25, dan 30. Hal ini bertujuan untuk mencari kuantisasi yang optimal. Nilai bin yang digunakan yaitu 30 bin karena bin tersebut meningkatkan hasil precision temu kembali. Pada perhitungan FCH diperlukan matriks derajat keanggotaan. Matriks ini diperoleh dari fungsi Cauchy. Persamaan fungsi Cauchy dapat dilihat pada Persamaan 1. 1 ???????????? ?????? = (1) ?????? ,1+ ??????(?????? ,??????)/??????

dengan d(c,c) = jarak Euclid antara warna c dengan c, c = warna pada bin FCH, c = warna semesta, = digunakan untuk menentukan kehalusan dari fungsi, = untuk menentukan lebar dari fungsi keanggotaan. Percobaan dilakukan dengan nilai sebesar 10, 15, 20, 25, dan 30. Nilai yang digunakan =30 karena meningkatkan hasil precision temu kembali. Matriks derajat keanggotaan dari fungsi Cauchy ini kemudian dikalikan dengan nilai histogram. Perhitungan FCH ini dapat dilihat pada Persamaan 2. 2 ?????? = ?????? ?????? 1 ?????? ???????????? ?????? , (2) dengan h2 ?????? = fuzzy color histogram (FCH), h ?????? = conventional color histogram, ?????? (?????? ) = nilai keanggotaan dari warna c ke warna c. Hasil perhitungan FCH ini kemudian dinormalisasi. Persamaan normalisasi tersebut dapat dilihat pada Persamaan 3. 2 ?????? ?????? = (3) .?????????????????? ?????? ?????? 2 ??????

2

b Ekstraksi ciri bentuk Tahap awal ekstraksi ciri bentuk dilakukan pendeteksian tepi menggunakan metode canny edge detector. Pendeteksi tepi canny akan menandai piksel-piksel yang mengalami perubahan intensitas gradien yang cukup signifikan dan memberi nilai nol pada piksel-piksel lain yang tidak mengalami perubahan intensitas gradien yang signifikan. Tiap piksel yang ditandai oleh pendeteksi tepi atau yang bernilai 1 kemudian diperiksa untuk mencari kemungkinan kurva yang melalui piksel tersebut. Setiap piksel pada citra yang dilalui representasi bentuk diberi voting 1. Begitu seterusnya sampai semua piksel pada citra biner diperiksa. Pada bagian akhir, semua nilai akumulasi untuk masing-masing piksel untuk mengetahui kemungkinan bentuk yang terbaca pada citra. Nilai-nilai tersebut menandakan frekuensi banyaknya representasi bentuk yang melalui titik tersebut dan nilai-nilai tertinggi menandakan bahwa kemungkinan besar bentuk-bentuk yang (membentuk voting) melalui titik-titik tersebut memang berada di dalam citra. Titik-titik yang memiliki nilai voting tertinggi disebut sebagai peak atau local maxima. Peak yang ditemukan kemudian diperiksa kembali apakah kurva yang berasal dari titik tersebut benar mendekati data sebenarnya dalam citra. Peak yang nantinya menjadi fitur ciri dari citra adalah peak yang paling banyak mendekati data pada citra sebenarnya. Pada penelitian ini dilakukan pengambilan seratus buah peak yang memiliki nilai voting tertinggi melalui hough transform dan dibuat threshold untuk pengambilan jumlah kurva yang paling dekat dengan citra sebenarnya. Nilai threshold yang diambil mulai dari 5, 10, 15, dan 20. Pengambilan nilai threshold yang bervariasi bertujuan untuk melihat banyaknya jumlah kurva yang paling optimal dalam mendekati data dalam citra. c Ekstraksi ciri tekstur Langkah awal yang dilakukan untuk mendapatkan informasi tekstur dari sebuah citra hasil segmentasi adalah dengan menentukan co-occurrence matrix. Cooccurrence matrix menggunakan beberapa level keabuan yaitu 8, 16, 32 dan 64. Level keabuan yang dipakai adalah delapan level

keabuan karena mengoptimalkan precision citra ikan.

nilai

Co-occurrence matrix dihitung dalam empat arah yaitu 00, 450, 900, dan 1350. Jadi, untuk setiap citra akan dihasilkan empat cooccurrence matrix. Setelah itu, nilai energy, IDM, entropy, MP, contrast, correlation, dan homogenity dihitung untuk setiap cooccurrence matrix sehingga untuk setiap fitur akan diperoleh empat nilai, masingmasing untuk arah 00, 450, 900, dan 1350. Nilai dari setiap fitur diperoleh dengan menghitung rata-rata keempat nilai fitur yang bersangkutan. Informasi tersebut kemudian direpresentasikan dengan sebuah vektor yang memiliki tujuh elemen dan nilai akhir dari informasi tekstur diperoleh dengan melakukan normalisasi terhadap vektor masing-masing citra. Pengukuran Kemiripan Pengukuran kemiripan antara citra kueri dengan citra yang ada dalam basis data untuk salah satu informasi warna, bentuk, dan tekstur menggunakan ukuran kesamaan cosine. Rumus ukuran kesamaan cosine dapat dilihat pada Persamaan 4 (Rodrigues dan Araujo 2004). ??????????????????( , )= ?????? ?????? dengan I = citra dalam basis data Q = citra kueri. Pengukuran citra kueri dengan citra di dalam basis data berdasarkan gabungan ketiga informasi (warna, bentuk, dan tekstur) dihitung menggunakan Bayesian Network (Rodrigues & Araujo 2004). Rumus Bayesian Network dapat dilihat pada Persamaan 5.?????? ???????????? ?????? = ?????? [1 1 ?????? ?????????????????? | ???????????? ?????? ?????????????????? | ???????????? ?????? 1 ], (5)?????? ?????? ?????? ?????? ??????

=

?????? ??????=1 ???????????? ???????????? ?????? ?????? 2 ??????=1 ?????? ?????? ?????? 2 ??????=1 ??????

,

(4)

?????? 1 ?????? ?????????????????? | ????????????

dengan P(CCj|CC) = nilai kemiripan warna P(CSj|CS) = nilai kemiripan bentuk P(CTj|CT) = nilai kemiripan tekstur. Evaluasi Temu Kembali Citra Evaluasi dilakukan untuk mengukur tingkat keberhasilan dalam proses temu kembali citra ikan. Proses evaluasi dilakukan dengan menghitung nilai interpolasi dari recall dan precision berdasarkan penilaian relevansinya terhadap masing-masing famili citra ikan. Semua citra di basis data dijadikan sebagai

3

kueri sehingga total kueri yang digunakan sebanyak 320 citra. HASIL PERCOBAAN Segmentasi Segmentasi pada citra ikan dilakukan untuk mengelompokkan warna yang dikandung oleh setiap piksel dari citra ke beberapa segmen (cluster) yaitu dua, tiga, empat, lima, enam, dan tujuh. Cluster ini merupakan representasi dari warna-warna dominan citra. Pada tahap ini diambil sebanyak sepuluh citra ikan berbagai karakter yang dijadikan sample untuk menentukan cluster terbaik pada citra ikan. Tahapan segmentasi ini bertujuan mendapatkan kelompok-kelompok warna dominan dan mengurangi jumlah warna citra asli. Berdasarkan hasil percobaan, jumlah cluster terbaik yang digunakan untuk segmentasi citra ikan adalah tujuh cluster. Citra hasil segmentasi ini selanjutnya digunakan untuk tahapan ekstraksi ciri warna, bentuk, dan tekstur. Hasil Ekstraksi Ciri a Ekstraksi ciri warna Ekstraksi ciri warna menggunakan FCH untuk seluruh citra yang ada di basis data adalah matriks berukuran 30 x 320. Hal ini dikarenakan jumlah bin yang digunakan merupakan jumlah bin yang optimal, yaitu 30 dengan 320 citra yang ada di basis data. b Ekstraksi ciri bentuk Setelah didapatkan hasil segmentasi, dilakukan proses pendeteksian tepi menggunakan pendeteksi tepi Canny dengan nilai threshold 0.5 dan variant 1.3. Contoh citra biner hasil pendeteksi tepi Canny untuk setiap famili dapat dilihat pada Gambar 1. Hasil citra biner kemudian menjadi masukan bagi penerapan metode HT. (f) The Livebearers (e) The Catfishes

(g) Barbs and Minnows

(h) Other Families Gambar 1 Contoh citra deteksi tepi Canny. HT menggunakan pendekatan lingkaran, dari tiap titik tepi pada citra biner akan dibuat sejumlah lingkaran dengan nilai radius yang berbeda-beda pada rentang nilai r =1 piksel hingga r = N piksel dengan N adalah ukuran panjang citra maksimum. Hal tersebut dilakukan untuk mendefinisikan semua kemungkinan lingkaran yang terdapat pada citra yang dipusatkan pada titik tepi tersebut. Accumulator array (x0, y0, r) mencatat jumlah lingkaran dengan radius r yang melalui (x0, y0). Pada akhir proses HT dipilih jumlah voting pada accumulator array yang memiliki voting paling banyak untuk masing-masing nilai radius yang disebut sebagai nilai peak. Kemudian diperiksa kembali apakah kurva (lingkaran) yang ditandai oleh peak tersebut benar mendekati data sebenarnya di dalam citra. Dari proses tersebut dihasilkan matriks dua dimensi berukuran sama dengan ukuran citra yang diolah. Pada matriks tersebut terdapat sejumlah peaks yang menandai keberadaan kurva (lingkaran) yang sesuai dengan citra. Hasil HT dapat dilihat pada Gambar 2. Untuk setiap percobaan dilakukan pengambilan jumlah peak yang berbeda. Berdasarkan percobaan, pengambilan jumlah peak yang optimal sebanyak lima peak. Berdasarkan percobaan awal terhadap jenis HT yang digunakan untuk citra ikan, HT lingkaran lebih meningkatkan precision temu kembali citra daripada HT elips. Oleh karena itu, metode penciri bentuk yang digunakan adalah HT lingkaran.

(a) Family Cichlidae

(b) The Anabantoids

(c) Killifishes and Relatives

(d) The Characoid Fishes

(a) Family Cichlidae

4

(b) The Anabantoids

keberhasilan dalam proses temu kembali citra. Perhitungan nilai precision dari suatu famili dilakukan dengan cara menjadikan setiap citra yang ada di famili tersebut sebagai citra kueri. Nilai yang disajikan adalah nilai precision berdasarkan ciri warna, bentuk, tekstur dan penggabungan ketiganya dengan Bayesian Network. Perbandingan rata-rata nilai precision untuk seluruh famili dapat dilihat pada Tabel 1. Nilai rata-rata precision terbesar untuk seluruh famili diperoleh menggunakan gabungan warna, bentuk, dan tekstur (model Bayesian Network) yaitu sebesar 0.2639. Namun demikian, nilai rata-rata precision terkecil untuk seluruh famili diperoleh menggunakan penciri tekstur. Hal ini disebabkan tekstur pada citra ikan umumnya lebih beragam. Tabel 1 Perbandingan nilai recall precision untuk seluruh famili

(c) Killifishes and Relatives

(d) The Characoid Fishes

(e) The Catfishes

(f) The Livebearers

(g) Barbs and Minnows

(h) Other Families Gambar 2 Hasil hough transform lingkaran. c Ekstraksi ciri tekstur Hasil dari ekstraksi ciri tekstur untuk seluruh citra hasil segmentasi yang ada di basis data adalah sebuah matriks berukuran 7 x 320, karena terdapat 320 buah citra di basis data dan setiap citra direpresentasikan dengan sebuah vektor yang memiliki elemen sebanyak tujuh buah yaitu energy, IDM, entropy, MP, contrast, correlation, dan homogeneity. Hasil Temu Kembali Temu kembali yang dihasilkan merupakan citra-citra yang memiliki kemiripan yang paling tinggi dengan citra kueri berdasarkan ciri bentuk, ciri tekstur dan gabungan ketiganya dengan model Bayesian Network. Hasil temu kembali menggunakan model Bayesian Network dapat dilihat pada Gambar 3. Evaluasi Temu Kembali Citra Perhitungan nilai recall dan precision dilakukan untuk menentukan tingkat

Recall 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Rataan Pengujian

Warna 1 0.3411 0.2396 0.1959 0.1824 0.1659 0.1538 0.1468 0.1441 0.1422 0.1333 0.2586

Bentuk 1 0.3283 0.2381 0.1980 0.1830 0.1704 0.1620 0.1531 0.1461 0.1391 0.1295 0.2589

Tekstur 1 0.2866 0.2097 0.1785 0.1738 0.1656 0.1570 0.1485 0.1419 0.1357 0.1292 0.2479

Bayesian 1 0.3363 0.2423 0.2040 0.1944 0.1810 0.1696 0.1582 0.1473 0.1408 0.1298 0.2639

Pengujian digunakan untuk menguji kesamaan kinerja antara beberapa metode, yaitu penciri warna, bentuk, tekstur dan bayesian. Pengujian dilakukan dengan menghitung nilai ANOVA berdasarkan pendekatan rataan precision setiap famili ikan hias air tawar. Hasil ANOVA dengan =0.05 dapat dilihat pada Tabel 2. Tabel 2. ANOVA berdasarkan rataan precisionSK Perlakuan Galat Total JK0.00110

db3

KT0.00036

FHit0.16 84

Fkritis (F())2.9467

0.06098 0.06208

28 31

0.00217

5

Gambar 3 Hasil temu kembali menggunakan model Bayesian Network. Hipotesis Pengujian: H0 : tidak ada metode yang berbeda nyata H1 : minimal ada sepasang metode yang berbeda nyata Keputusan terima H0 dapat diambil karena Fhit < F. Kesimpulan yang didapat adalah tidak ada metode yang berbeda nyata antara penciri warna, bentuk, tekstur dan bayesian. KESIMPULAN DAN SARAN Kesimpulan Ekstraksi ciri warna, bentuk, dan tekstur pada citra ikan hias air tawar berhasil dilakukan. Nilai rata-rata precision seluruh citra dalam database paling baik menggunakan penciri bentuk, yaitu sebesar 0.2589 sedangkan untuk penciri warna sebesar 0.2586, dan penciri tekstur menghasilkan nilai terkecil yaitu 0.2479. Gabungan ketiga ciri (warna, bentuk, dan tekstur) dapat menghasilkan nilai rata-rata precision sebesar 0.2639. Tidak ada metode yang berbeda nyata antara penciri warna, bentuk, tekstur dan gabungan ketiganya. Saran Penelitian lebih lanjut berupa ekstraksi ciri warna, bentuk, dan tekstur pada citra ikan menggunakan tahap segmentasi dengan pendekatan lokal (local-based) dan pendekatan bagian (part-based). DAFTAR PUSTAKA Aunuddin. 2005. Statistika: Rancangan dan Analisis Data. Bogor: IPBPRESS. Axelrod HR. 1995. Mini-Atlas of Freshwater Aquarium Fishes Mini-Edition. United States: T. F. H. Publications, Inc. Belongie S, et al. 1998. Color- and TextureBased Image Segmentation Using EM and Its Application to Content-Based Image Retrieval. Berkeley: ICCV. Balqis DP. 2006. Fuzzy Color Histogram untuk Temu Kembali Citra Bunga. [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Chen Y, et al. 2004. Machine Learning and Statistical Modeling Approaches to Image Retrieval. United States of America: Kluwer Academic Publishers. Han J, Ma K. 2002. Fuzzy Color Histogram and Its Use in Color Image Retrieval. IEEE Transaction on Image Processing, vol 11, no. 8. Hastuti YP. 2007. Analisis Kinerja Algoritma Expectation Maximization untuk Segmentasi dan Sistem Temu Kembali Citra. [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. McAndrew A. 2004. Introduction to Digital Image Processing with MATLAB. Boston: Thomson.

Moyle PB, Cech JJ. 1992. Fishes: An Introduction to Ichthyology. New York: Prentice Hall. Nixon MS, Aguado AS. 2002. Feature Extraction and Image Processing. London: Newnes. Osadebey ME. 2006. Integrated Content-Based Image Retrieval Using Texture, Shape and Spasial Information. [Thesis]. Umea: Department of Applied Phyiscs and Electronics, Umea University. Pebuardi R. 2008. Pengukuran Kemiripan Citra Berbasis Warna, Bentuk, dan Tekstur Menggunakan Bayesian Network. [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengethuan Alam, Institut Pertanian Bogor. Rodrigues PS & Araujo A. 2004. A Bayesian Network Model Combining Color, Shape and Texture Information to Improve Content Based Image Retrieval System. Brazil: LNCC. Wahyuningsih Y. 2006. Metode Hough Transform untuk ekstraksi ciri bentuk pada citra bunga. [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Walpole RE. 1992. Pengantar Statistika. Jakarta: PT Gramedia Pustaka Utama.

Yates B & Neto R. 1999. Modern Information Retrieval. New York: Addison Wesley. Zhang R, Zhang Z. 2004. A Robust Color Object Analysis Approach to Efficient Image. EURASIP Journal on Applied Signal Processing, 6, 871-885.

4