abstrak ta muhamad alif (080411100040)

1
PENERAPAN KOMBINASI METODE ENHANCED CONFIX STRIPPING DAN PORTER STEMMER TERHADAP KONTEN BAHASA INDONESIA PADA RESEARCH INDONESIAN SEARCH ENGINE Muhamad Alif (08.04.111.00040) Pembimbing I : Firdaus Solihin,S.Kom.,M.Kom. Pembimbing II : Bain Khusnul Khotimah,S.T.,M.Kom. ABSTRAK Stemming adalah suatu proses pengembalian suatu kata berimbuhan ke bentuk dasarnya. Metode pada stemming Bahasa Indonesia adalah ECS (Enhanced Confix Stripping) dan Porter Stemmer. ECS adalah metode stemming yang sudah teruji keakuratanya tetapi prosesnya lambat dan Porter Stemmer merupakan metode stemming paling cepat dalam proses data namun hasilnya tidak seakurat ECS. Kombinasi Enhanced Confix Stripping (ECS) dan Porter Stemmer telah diimplementasikan dalam sebuah Stemmer pengembangan yaitu Enhanced Confix Stripping Porter (ECSP). ECSP merupakan hasil perpaduan algoritma dan rule ECS dengan Porter. ECSP dimplementasikan pada sebuah aplikasi sederhana dengan melakukan uji coba partisi dokumen data penelitian Fadhilah Tala serta pada data RISE (Research Indonesian Search Engine). Pada uji coba yang diambil dari 300 dokumen penelitian Fadhilah Tala, ECS mereduksi 82% dengan kecepatan 37 detik, Porter Stemmer mampu mereduksi 61% pada lama proses 0,091 detik dan ECSP berhasil dikembangkan serta telah mampu mereduksi 67% dengan kecepatan proses 0,139 detik. Sedangkan pada uji coba menggunakan 50 dokumen data RISE, ECSP dapat mereduksi 47% dengan waktu 0,02 detik dan mengalahkan keakurasian Porter Stemmer serta kecepatan prosesnya. ECSP juga mampu memperkecil selisih keakuratan hasil ujicoba sebanyak 10% terhadap ECS. Kata kunci : RISE, stemming, Enhanced Confix Stripping, Porter Stemmer, Enhanced Confix Stripping Porter

Upload: ahmad-shodiq

Post on 28-Jan-2016

227 views

Category:

Documents


4 download

DESCRIPTION

Abstrak

TRANSCRIPT

Page 1: Abstrak Ta Muhamad Alif (080411100040)

PENERAPAN KOMBINASI METODE ENHANCED

CONFIX STRIPPING DAN PORTER STEMMER

TERHADAP KONTEN BAHASA INDONESIA

PADA RESEARCH INDONESIAN

SEARCH ENGINE Muhamad Alif

(08.04.111.00040)

Pembimbing I : Firdaus Solihin,S.Kom.,M.Kom.

Pembimbing II : Bain Khusnul Khotimah,S.T.,M.Kom.

ABSTRAK

Stemming adalah suatu proses pengembalian suatu kata

berimbuhan ke bentuk dasarnya. Metode pada stemming Bahasa

Indonesia adalah ECS (Enhanced Confix Stripping) dan Porter

Stemmer. ECS adalah metode stemming yang sudah teruji

keakuratanya tetapi prosesnya lambat dan Porter Stemmer

merupakan metode stemming paling cepat dalam proses data namun

hasilnya tidak seakurat ECS.

Kombinasi Enhanced Confix Stripping (ECS) dan Porter

Stemmer telah diimplementasikan dalam sebuah Stemmer

pengembangan yaitu Enhanced Confix Stripping Porter (ECSP).

ECSP merupakan hasil perpaduan algoritma dan rule ECS dengan

Porter. ECSP dimplementasikan pada sebuah aplikasi sederhana

dengan melakukan uji coba partisi dokumen data penelitian Fadhilah

Tala serta pada data RISE (Research Indonesian Search

Engine).

Pada uji coba yang diambil dari 300 dokumen penelitian

Fadhilah Tala, ECS mereduksi 82% dengan kecepatan 37 detik,

Porter Stemmer mampu mereduksi 61% pada lama proses 0,091

detik dan ECSP berhasil dikembangkan serta telah mampu

mereduksi 67% dengan kecepatan proses 0,139 detik. Sedangkan

pada uji coba menggunakan 50 dokumen data RISE, ECSP dapat

mereduksi 47% dengan waktu 0,02 detik dan mengalahkan

keakurasian Porter Stemmer serta kecepatan prosesnya. ECSP juga

mampu memperkecil selisih keakuratan hasil ujicoba sebanyak 10%

terhadap ECS.

Kata kunci : RISE, stemming, Enhanced Confix Stripping,

Porter Stemmer, Enhanced Confix Stripping Porter