abstrak ta muhamad alif (080411100040)
DESCRIPTION
AbstrakTRANSCRIPT
PENERAPAN KOMBINASI METODE ENHANCED
CONFIX STRIPPING DAN PORTER STEMMER
TERHADAP KONTEN BAHASA INDONESIA
PADA RESEARCH INDONESIAN
SEARCH ENGINE Muhamad Alif
(08.04.111.00040)
Pembimbing I : Firdaus Solihin,S.Kom.,M.Kom.
Pembimbing II : Bain Khusnul Khotimah,S.T.,M.Kom.
ABSTRAK
Stemming adalah suatu proses pengembalian suatu kata
berimbuhan ke bentuk dasarnya. Metode pada stemming Bahasa
Indonesia adalah ECS (Enhanced Confix Stripping) dan Porter
Stemmer. ECS adalah metode stemming yang sudah teruji
keakuratanya tetapi prosesnya lambat dan Porter Stemmer
merupakan metode stemming paling cepat dalam proses data namun
hasilnya tidak seakurat ECS.
Kombinasi Enhanced Confix Stripping (ECS) dan Porter
Stemmer telah diimplementasikan dalam sebuah Stemmer
pengembangan yaitu Enhanced Confix Stripping Porter (ECSP).
ECSP merupakan hasil perpaduan algoritma dan rule ECS dengan
Porter. ECSP dimplementasikan pada sebuah aplikasi sederhana
dengan melakukan uji coba partisi dokumen data penelitian Fadhilah
Tala serta pada data RISE (Research Indonesian Search
Engine).
Pada uji coba yang diambil dari 300 dokumen penelitian
Fadhilah Tala, ECS mereduksi 82% dengan kecepatan 37 detik,
Porter Stemmer mampu mereduksi 61% pada lama proses 0,091
detik dan ECSP berhasil dikembangkan serta telah mampu
mereduksi 67% dengan kecepatan proses 0,139 detik. Sedangkan
pada uji coba menggunakan 50 dokumen data RISE, ECSP dapat
mereduksi 47% dengan waktu 0,02 detik dan mengalahkan
keakurasian Porter Stemmer serta kecepatan prosesnya. ECSP juga
mampu memperkecil selisih keakuratan hasil ujicoba sebanyak 10%
terhadap ECS.
Kata kunci : RISE, stemming, Enhanced Confix Stripping,
Porter Stemmer, Enhanced Confix Stripping Porter