abstrak ta muhamad alif (080411100040)

Post on 28-Jan-2016

227 Views

Category:

Documents

4 Downloads

Preview:

Click to see full reader

DESCRIPTION

Abstrak

TRANSCRIPT

PENERAPAN KOMBINASI METODE ENHANCED

CONFIX STRIPPING DAN PORTER STEMMER

TERHADAP KONTEN BAHASA INDONESIA

PADA RESEARCH INDONESIAN

SEARCH ENGINE Muhamad Alif

(08.04.111.00040)

Pembimbing I : Firdaus Solihin,S.Kom.,M.Kom.

Pembimbing II : Bain Khusnul Khotimah,S.T.,M.Kom.

ABSTRAK

Stemming adalah suatu proses pengembalian suatu kata

berimbuhan ke bentuk dasarnya. Metode pada stemming Bahasa

Indonesia adalah ECS (Enhanced Confix Stripping) dan Porter

Stemmer. ECS adalah metode stemming yang sudah teruji

keakuratanya tetapi prosesnya lambat dan Porter Stemmer

merupakan metode stemming paling cepat dalam proses data namun

hasilnya tidak seakurat ECS.

Kombinasi Enhanced Confix Stripping (ECS) dan Porter

Stemmer telah diimplementasikan dalam sebuah Stemmer

pengembangan yaitu Enhanced Confix Stripping Porter (ECSP).

ECSP merupakan hasil perpaduan algoritma dan rule ECS dengan

Porter. ECSP dimplementasikan pada sebuah aplikasi sederhana

dengan melakukan uji coba partisi dokumen data penelitian Fadhilah

Tala serta pada data RISE (Research Indonesian Search

Engine).

Pada uji coba yang diambil dari 300 dokumen penelitian

Fadhilah Tala, ECS mereduksi 82% dengan kecepatan 37 detik,

Porter Stemmer mampu mereduksi 61% pada lama proses 0,091

detik dan ECSP berhasil dikembangkan serta telah mampu

mereduksi 67% dengan kecepatan proses 0,139 detik. Sedangkan

pada uji coba menggunakan 50 dokumen data RISE, ECSP dapat

mereduksi 47% dengan waktu 0,02 detik dan mengalahkan

keakurasian Porter Stemmer serta kecepatan prosesnya. ECSP juga

mampu memperkecil selisih keakuratan hasil ujicoba sebanyak 10%

terhadap ECS.

Kata kunci : RISE, stemming, Enhanced Confix Stripping,

Porter Stemmer, Enhanced Confix Stripping Porter

top related