jurnal_13635

10
Prediksi Nasabah yang Berpotensi Membuka Simpanan Deposito Menggunakan Naive Bayes Berbasis Particle Swarm Optimization Alvino Dwi Rachman Prabowo Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Dian Nuswantoro Semarang Jl. Nakula 1 No. 5-11, Semarang, 50131, Telp: (024) 3517261, Fax : (024) 325 0165 E-mail : [email protected] _________________________________________________________ Abstrak Deposito masih merupakan pilihan utama masyarakat untuk berinvestasi dan hal ini merupakan kesempatan bagi bank untuk menentukan strategi pemasaran dan promosi yang lebih efisien dan efektif. Atas dasar permasalahan tersebut, maka dilakukan penelitian untuk memprediksi nasabah yang berpotensi membuka deposito dengan menggunakan teknik data mining khususnya algoritma Naive Bayes berbasis PSO. PSO pada penelitian ini akan digunakan untuk seleksi fitur. Hasil dari penelitian ini, akurasi algoritma Naive Baiyes adalah 82,19% dan akurasi algoritma Naive Baiyes berbasis PSO adalah 89,70%. Penggunaan algoritma PSO ternyata meningkatkan akurasi sebesar 7,51% dan algoritma tersebut dapat digunakan untuk sistem pendukung keputusan pada penelitian ini. Kata kunci : prediksi nasabah yang berpotensi membuka deposito, data mining, naive baiyes, particle swarm optimization, seleksi fitur Abstract Deposits are still the main choice for people to invest this time and it was an opportunity for the banks to determine marketing strategies and promotion of more efficient and effective. From the basis of these problems, the research conducted to predict the potential customers who will make deposits by using data mining techniques, especially Naive Bayes algorithm based PSO. PSO in this study will be used for feature selection. The results of this study,the accuracy of the Naive Bayes algorthm is 82,19% and the accuracy of the PSO based Naive Bayes algorithm is 89,70%. The use of PSO algorithm has increased by 7,51% and the accuracy of the algorithm can be used for decision support systems in this study. Keyword : prediction of the potential customers who will open deposits , data mining, naive bayes, particle swarm optimization, feature selection I. PENDAHULUAN Deposito masih merupakan primadona bagi masyarakat yang ingin berinvestasi namun dengan sedikit resiko. Ini bisa dilihat dari meningkatnya jumlah rekening deposito dari bulan Juni 2013 ke bulan Juli 2013 dari 2.940.178 pemilik rekening menjadi 2.955.539 pemilik rekening [1]. Menurut Undang Undang Nomor 10 tahun 1998, deposito sendiri memiliki definisi yaitu simpanan yang penarikannya hanya dapat dilakukan pada waktu tertentu berdasarkan perjanjian nasabah penyimpan dengan bank [2]. Hal itu dikarenakan deposito memiliki tingkat suku bunga per tahun yang diterima lebih tinggi apabila dibandingkan dengan suku bunga giro atau simpanan tabungan biasa [3]. Untuk itu, suatu bank harus mengambil kesempatan ini dengan melakukan promosi dan strategi pemasaran yang efisien salah satunya dengan melakukan pemasaran langsung dan salah satu cara yang dapat digunakan yaitu memprediksi nasabah yang berpotensi membuka simpanan deposito pada bank tersebut. Prediksi tersebut dapat digunakan dengan menggunakan data-data nasabah yang sudah ada lalu diproses sehingga menemukan hubungan yang berarti, pola, dan kecenderungan dengan memeriksa dalam sekumpulan besar data yang tersimpan dalam penyimpanan dengan menggunakan teknik pengenalan pola seperti statistik dan matematika. Proses tersebut dinamakan Data Mining [4]. Proses prediksi tersebut dapat menggunakan teknik klasifikasi.

Upload: miftachul-munir

Post on 18-Aug-2015

6 views

Category:

Documents


4 download

DESCRIPTION

jurnal untuk menambah wawasan bagi para mahasiswa untuk dibuat sebagai daftar pustaka atau sebagai wawasan sehingga mempermudah untuk mengerjakan suatu tugas

TRANSCRIPT

Prediksi Nasabah yang Berpotensi Membuka Simpanan DepositoMenggunakan Naive Bayes Berbasis Particle Swarm OptimizationAlvino Dwi Rachman PrabowoProgram Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Dian Nuswantoro SemarangJl. Nakula 1 No. 5-11, Semarang, 50131, Telp: (024) 3517261, Fax : (024) 325 0165E-mail : [email protected]_________________________________________________________AbstrakDepositomasihmerupakanpilihanutamamasyarakatuntukberinvestasidanhalinimerupakankesempatan bagi bank untuk menentukan strategi pemasaran dan promosi yang lebih efisien dan efektif.Atasdasarpermasalahantersebut,makadilakukanpenelitianuntukmemprediksinasabahyangberpotensi membuka deposito dengan menggunakan teknik data mining khususnya algoritma Naive BayesberbasisPSO. PSOpadapenelitianiniakandigunakanuntukseleksifitur. Hasildaripenelitianini,akurasi algoritma Naive Baiyes adalah 82,19% dan akurasi algoritma Naive Baiyes berbasis PSO adalah89,70%.PenggunaanalgoritmaPSOternyatameningkatkanakurasisebesar7,51%danalgoritmatersebut dapat digunakan untuk sistem pendukung keputusan pada penelitian ini.Katakunci: prediksinasabahyangberpotensimembukadeposito, datamining, naivebaiyes, particleswarm optimization, seleksi fiturAbstractDeposits are still the main choice for people to invest this time and it was an opportunity for the banks todetermine marketingstrategiesandpromotionofmoreefficientandeffective.Fromthebasisoftheseproblems, the research conducted to predict the potential customers who will make deposits by using dataminingtechniques,especiallyNaiveBayesalgorithmbasedPSO.PSOinthisstudywillbeusedforfeatureselection. Theresultsofthisstudy,theaccuracyoftheNaiveBayesalgorthmis82,19%andtheaccuracy of the PSO based Naive Bayes algorithm is 89,70%. The use of PSO algorithm has increased by7,51% and the accuracy of the algorithm can be used for decision support systems in this study.Keyword: predictionofthepotentialcustomerswhowillopendeposits , datamining, naivebayes,particleswarm optimization, feature selectionI. PENDAHULUANDepositomasihmerupakanprimadonabagimasyarakatyanginginberinvestasinamundengansedikitresiko.InibisadilihatdarimeningkatnyajumlahrekeningdepositodaribulanJuni2013kebulanJuli2013dari2.940.178pemilikrekeningmenjadi2.955.539pemilikrekening [1].MenurutUndang Undang Nomor 10 tahun 1998, deposito sendirimemilikidefinisiyaitusimpananyangpenarikannya hanya dapat dilakukan pada waktutertentuberdasarkanperjanjiannasabahpenyimpandenganbank [2].Halitudikarenakandepositomemilikitingkatsukubungapertahunyangditerimalebihtinggiapabiladibandingkandengansukubungagiroatau simpanan tabungan biasa [3].Untukitu,suatubankharusmengambilkesempataninidenganmelakukanpromosidanstrategipemasaranyangefisien salahsatunyadenganmelakukanpemasaranlangsungdansalahsatucarayangdapatdigunakan yaitumemprediksinasabahyangberpotensimembukasimpanandepositopadabanktersebut.Prediksitersebutdapatdigunakandenganmenggunakandata-datanasabahyangsudahadalaludiprosessehinggamenemukanhubungan yang berarti, pola, dan kecenderungandenganmemeriksadalamsekumpulanbesardatayangtersimpandalampenyimpanandenganmenggunakanteknikpengenalanpolaseperti statistik dan matematika. Proses tersebutdinamakanDataMining [4]. Prosesprediksitersebut dapat menggunakan teknik klasifikasi.Teknikklasifikasiadalahsalahsatudariteknikdataminingyangtermasuk supervisedlearning.Supervisedlearningartinyaprosespembentukansebuahkorespondensi(fungsi)menggunakansebuah training dataset,dilihatsebagaisebuah"pengalamanmasalalu"darisebuahmodel.Tujuannyaadalahuntukmemprediksidarisebuahnilai(output)darisebuahfungsiuntuksetiapobjekbaru(input)setelah menyelesaikan proses training [5].Klasifikasimerupakansuatupekerjaanmenilaiobjekdatauntukmemasukkannyakedalamkelastertentudarisejumlahkelasyangtersedia.Dalamklasifikasiadaduapekerjaanutamayangdilakukanyaitupembangunanmodelsebagai prototypeuntukdisimpansebagai memori dan penggunaan model tersebutuntukmelakukanpengenalan/klasifikasi/prediksipadaunsurobjekdatalainagardiketahuidikelasmanaobjekdatatersebutdalammodelyangsudahdisimpannya. [6].Adabeberapaalgoritmaklasifikasidataminingyangdapatdigunakanuntukstrategipemasarandanpromosi,sepertiyangditulisolehSergioMorodanRaulM.S.LaureanodiantaranyaNaveBayes(NB),DecisionTrees(DT) dan Support Vector Machines (SVM) [7].NaiveBayesmerupakanteknikprediksiberbasisprobabilistiksederhanayangberdasarpadapenerapanteoremaatauaturanbayesdenganasumsiindependensiyangkuatpadafitur,artinyabahwasebuahfiturpadasebuahdatatidakberkaitandenganadaatautidaknyafitur lain dalam data yang sama [6].NamunNaiveBayesmemilikikelemahanyaituattributataufiturindependenseringsalahdanhasilestimasiprobabilitastidakdapatberjalanoptimal. Untukmengatasikelemahantersebutsalahsatucaranya denganmetodepembobotanattributuntukmeningkatkanakurasidariNaiveBayestersebut [8] dannantinyahasilbobotatributtersebutakandigunakanuntukmenseleksifiturdanatributyangada. Untukmelakukanmetodepembobotanattributtersebut,salahsatunyamenggunakanParticleSwarmOptimization(PSO).ParticleSwarmOptimization(PSO)adalahmetodeyangterinspirasidariperilakusosialsekelompokburungdanikan.MetodePSOmudah diterapkan dan dapatmemilih parameteryang sesuai. Metode optimasi ini terbukti efektifdanberhasildigunakanuntukmemecahkanmasalahoptimasi multidimensidanmultiparameterpadapembelajaranmachinelearningsepertiNeuralNetwork,SVM,danalgoritma teknik klasifikasi yang lain [9].Padapenelitiansebelumnyadenganmenggunakandatayangsama,namunmenggunakanalgoritmayangberbedayaitumenggunakanalgoritmaC4.5danalgoritmaC4.5berbasisPSO [10] danalgoritmaNaveBaiyes [11] dengan hasil akurasi algoritma C4.5sebesar 84,13% dengan AUC 0,837. Untuk hasilalgoritmaC4.5-PSOsebesar86,09%danAUC0,883. Sedangkan untuk algoritma Nave Baiyesmenghasilkan akurasi sebesar 87,03% dan AUC0,813.Padapenelitianini,PSOakandigunakanuntuk featureselection yaitudenganmemilihattributterbaikdenganmemilihattributyangsudah diberikan bobot untuk meningkatkan hasilakurasidariNaiveBayes.Hasildaripenelitianiniadalahmeningkatkanakurasiprediksinasabahyangberpotensi membukasimpanandepositodanmenunjukkanbahwametodetersebutlebihbaikdaripadametode-metodeyangsudahdigunakandalampenelitiansebelumnya.II. TINJAUAN PUSTAKAA. Related ResearchBeberapapenelitianberkaitantentangklasifikasidatamining yangdigunakanuntukprediksikhususnyauntukmemprediksisuatuhasil dan menggunakan algoritma optimasi telahbanyak dilakukan beberapa diantaranya : Jie LindanJiankunYu dariYunnanUniversityofFinanceandEconomicstelahmelakukanpenelitianmengenaipenggunaan WeightedNaiveBayesberbasis algoritmaParticleSwarmOptimization (PSO)yangdigunakan untukpembobotanatribut [12]. PSOdigunakanuntukfungsipencarianotomatisketikamempertahankanintegritasdarisetiapattributdata.MetodePSOtersebutternyatadapatmeningkatkanakurasidarialgoritmaNaiveBayes.MetodetersebutmemberikanhasilyangdiharapkansetelahmenggunakandatasetUCIdandapatdigunakansecaralayakdanefektif.Salahsatu hasilnyaadalahpadadatasettransfusion,jikamenggunakanNaiveBayesmendapatkan akurasi sebesar 0.751336898 atau75.1336898%.JikamenggunakanPSOWeightedNaiveBayesClassifier(PSOWNBC)makamendapatkanakurasisebesar0.771390374 atau 77.1390374%.B. Data MiningMenurut Tan (2006) pada [6] mendefinisikandatamining sebagaiprosesuntukmendapatkaninformasiyangbergunadarigudangbasisdatayangbesar. Datamining jugadapatdiartikansebagaipengekstrakaninformasibaruyangdiambildaribongkahandatabesaryangmembantudalampengambilankeputusan.Isitilah datamining kadangdisebutjugaknowledge discovery.C. Naive BayesNaiveBayesadalahpengklasifikasianstatistikyangdapatdigunakanuntukmemprediksiprobabilitaskeanggotaansuatuclass.NaiveBayesdidasarkanpadateoremaBayesyangmemilikikemampuanklasifikasiserupa dengan decision tree dan neural network.Naive Bayesterbuktimemilikiakurasidankecepatanyangtinggisaatdiaplikasikankedalam database dengan data yang besar [13].PrediksiBayesdidasarkanpadaformulateoremaBayesdenganformulaumumsebagaiberikut [6] :| =( | ) ( )( )(1)Sedangkan Formulasi dari Nave Bayes untukklasifikasi adalah [6]| =( ) ( | )( )(2)P(Y|X)adalahprobabilitasdatadenganvektor X pada kelas Y. P(Y) adalah probabilitasawalkelasY. ( | ) adalahprobabilitasindependenkelasYdarisemuafiturdalamvector X. Nilai P(X) selalu tetap sehingga dalamperhitunganprediksinantinyakitatinggalmenghitungbagian ( ) ( | ) denganmemilihyangterbesarsebagaikelasyangdipilihsebagaihasilprediksi.Sementaraprobabilitasindependen ( | ) tersebutmerupakanpengaruhsemuafiturdaridataterhadapsetiapkelasY,yangdinotasikandengan [6]:| = = ( | = )(3)Setiap set fitur X= { , , , . , } terdiriatas q atribut.Untukatributyangmempunyaitipedatakontinu,makadinyatakandalamformulasiberikut [6]:= | = =12( )(4)Dimana parameter bisa didapat dari meanataurata-ratasampel ( )darisemuadatalatih yang menjadi milik kelas sedangkandidapat dari varian sampel ( ) dari data latih.D. Particle Swarm Optimization (PSO)PSO adalahmetode pencarian populasi,yangberasaldaripenelitianuntukpergerakanberkelompokburungdanikandalammencarimakan [9].Sepertialgoritmagenetika,PSOmelakukanpencarianmenggunakanpopulasi(disebut swarm)dariindividu-individu(disebutpartikel) yang diperbarui dari setiap iterasi yangdilakukan.Untukmenemukansolusiyangoptimal,setiappartikelbergerakkearahposisiterbaikyangsebelumnya(pbest)danposisiglobalterbaik(gbest).Kecepatandanposisipartikeldapatterusdiperbaruiataumelakukaniterasi dengan persamaan berikut := 1 + + (5)= 1 + ( )= +1(6)Padapenelitianini,PSOdigunakanuntukmenyeleksifitur(featureselection).Untukmenyeleksi fitur atau atribut tersebut, maka PSOmenggunakanbobotatributyangtelahdihitungdanatributyangtelahdiseleksiakandiprediksimenggunakanalgoritma NaiveBayes.Untukmendapatkanbobottersebut,makafungsiyangdigunakan adalah [12] :Dimana (|~ ) merupakanjumlahprobabilitasdaridataXyangtidaktermasukdalamkelas .Langkah-langkahuntukmendapatkanbobottersebutadalahsebagaiberikut [12].1. Menyiapkan sampel dataset, siap untukmenghitung bobot dari record pertama,2. Inilisialisasipopulasi(swarm)P(t)sehinggaketikat=0,lokasi ( ) darisetiappartikel ( )disuaturuangyangluasmenjadi acak.3. Melaluisetiapposisipartikelsaatitu,( ) mengevaluasi performa dari F.4. Membandingkankinerjamasing-masingindividusaatinidenganindividuyangmempunyaikinerjaterbaikyangsejauhinidimiliki jika > maka= =5. Membandingkankinerjamasing-masingpartikeldengankinerjapartikelterbaiksecara global, jika > maka= =Ubahkecepatanvectordariparticledenganmenggunakanformula5. Setelahmendapatkankecepatannyalalu,tempatkansetiappartikelkelokasiyangbarumenggunakanformula 6.Kembali ke langkah nomor 2, ulangi perulanganhinggamendapatkannilaiyangkonvergendanmendapatkan bobot.6. Jikaperhitunganbobotdarirecordterakhir di data sampel selesai, maka akhiri. Jikatidak,siapuntukmenghitungbobotdarirecordberikutnyadankembalimengulangidarilangkah nomor 1.Setelahitu,laluhitungrata-ratabobotyangtelah dihitung dari data sampel tersebut.E. Cross ValidationCrossvalidation adalahpengujianstandaryangdilakukanuntukmemprediksi errorrate.Datatraining dibagisecara random kedalambeberapabagiandenganperbandinganyangsama kemudian error rate dihitung bagian demibagian,selanjutnyahitungrata-rataseluruherrorrate untukmendapat errorrate secarakeseluruhan [14].Crossvalidationmempunyaibanyakmodel,diantaranya k-foldcrossvaldiation dan leave-one-out cross validation.Biasanya,10-foldcrossvalidationdirekomendasikan untuk akurasi prediksi karenarelatif rendah nilai bias dan varian. pada 10-foldcrossvalidation,datadibagimenjadi10bagianterlebihdahulusecaraacakdenganperbandinganyangsama,laluhitungerrorratesetiapbagian,setelahitudiperoleherrorratesecarakeseluruhandarimenghitungrata-rataerror rate dari semua bagian data [15].Gambar 1 Ilustrasi 10-fold cross validation(Vercellis, 2009)F. Confusion MatrixConfusionmatrix merupakanalatyangbergunauntukmenganalisaseberapabaikklasifikasi tersebut dapatmengenali tuple-tupledari kelas-kelas yang berbeda.Darigambardiatas,TPdanTNmenunjukkan= | ( |~ ) (7)Gambar 2 Confusion Matrixbahwa klasifikasitersebutbernilaibenarataucocokdengannilaiasli,sedangkanFPdanFNmenunjukkan bahwa klasifikasi tersebut bernilaisalah atau tidak cocok dengan nilai asli.Rumustersebutmerupakanrumusdariconfusionmatrix yangdigunakanmendapatkanhasilakurasidarihasilklasifikasiyangsudahdilakukan.III. METODE YANG DIUSULKANA. CRISP-DM1) FasePemahamanBisnis(BusinessUnderstanding Phase)Padatahapawal, penulismenggunakan datasetpublicberjudul BankMarketing yang pernahdigunakanolehS.Moro,R.LaureanodanP.Cortez,yangberjudulUsingDataMiningforBankDirectMarketing:AnApplicationoftheCRISP-DMMethodology dariwebsiteUniversityofCalifornia,Irvine(UCI)MachineLearning.2) FasePemahamanData(DataUnderstanding Phase)Dataset BankMarketing tersebutterdiridari16attributprediktordan1attributlabel.Attributprediktor adalah attribut yang dijadikan penentunasabahyanghampirpastimembukarekeningdepositodanattributlabelyaituattributyangdijadikan hasil learning.Atributprediktoryangdigunakanpadapenelitianiniadalah age, job, marital,education, default, balance, housing, loan,contact, day, month, duration, campaign, pdays,previous, dan poutcome. Sedangkan atribut hasilatau label adalah y.Tabel 1 Attribut pada DatasetNo Attribut Keterangan dan Nilai1 Age Umur nasabah2 Job Jenispekerjaannasabah(admin./unknown/unemployed/management/housemaid/entrepreneur/student/blue-collar/selfemployed/retired/technician/services)3 Marital Status pernikahan(married/divorced/single)4 Education Pendidikan Nasabah(unknown/secondary/primary/tertiary)5 Default Apakahmempunyaikreditgagal?(no/yes)6 Balance Rata-ratapenghasilanpertahundalammatauangEuro7 Housing Apakahmempunyaikreditpeminjaman rumah?(no/yes)8 Loan Apakahmempunyaipinjaman pribadi?(no/yes)9 Contact Jeniskomunikasiyangdigunakan(unknwon/telephone/cellular)10 Day Tanggalterakhirmenghubungi11 Month Bulanterakhirmenghubungi(Januari/Februari/Maret/April/Mei/Juni/Juli/Agustus/September/Oktober/November/Desember)12 Duration Durasiterakhirmenghubungi dalam detik13 Campaign Jumlahkontakyangdilakukanselamapromosiini dan untuk klien ini14 Pdays Jumlahhariyangberlalusetelahnasabahterakhir=++ + +(8)dihubungidaripromosisebelumnya.15 Previous Jumlahkontakdilakukansebelumpromosiinidanuntuk klien ini.16 Poutcome Hasildaripromosipemasaran sebelumnya(Unknown/Other/Failure/Success)17 Y Apakahnasabahberlanggandepositoyangditawarkan? (no/yes)3) FasePengolahanData(DataPreparation Phase)Jumlahdatayangtelahdiperolehadalah45211recorddengan16atributprediktordansatuatribut hasil seperti yang telah diterangkan padatabel3.1.Namuntidaksemuadatadanatributdapat digunakansehinggaharusmelewati tahappersiapandata(datapreparation).Untukmendapatkandatayangberkualitasmakadapatdilakukanteknik-tekniksebagaiberikut(Vercellis,2009).1. DataValidation,kualitas daridatamungkintidakmemuaskandikarenakanadadatayangganjil(outlier/noise),datayangtidakkonsistendanadadatayangtidaklengkap(missingvalue).Jumlahdataawaladalah45211recorddengan 16 atribut prediktor dan satu atribut hasildandari keseluruhandatatidakterdapatdatayang missing, tidak konsisten ataupun noise.2. Data integrationandtransformation,untukmeningkatkanakurasidanefisiensialgoritmadapatdilakukandenganmelakukanbeberapatransformasi.Daridatasetyangdigunakan,karenauntukmempermudahimplementasikedalamMatlab,makadatanominalyangadaharusditransformasiketipedatanumerikterlebihdahulu dandatayangcontinueatauberlanjutsepertiatributbalancedanpdaysmenggunakannormalisasimin-maxdenganmenggunakan formula,=

+ (9)3. Data sizereductionanddiscritization,mengurangiatributatauvariabeluntukmeningkatkan akurasi dan memproses algoritmadenganlebihefisientanpamengorbankankualitasdarihasilyangakandiperoleh.Dalampenelitianini,untukmemprosesalgoritmadengan lebih efisien dan lebih cepat serta untukmeningkatkanakurasimakadigunakan FeatureSelection denganpembobotanatributterlebihdahulu menggunakan algoritma PSO.4) Fase Pemodelan (Modelling Phase)Penelitianinimenggunakanduametodeyaitualgoritma NaiveBayesClassifier (NBC)danalgoritmaNBCyangdikombinasikandenganalgoritmaPSOyangdigunakansebagaipembobotanatributuntuk featureselection.Prosesmembandingkandalampenelitianiniakanmenggunakan framework RapidMinerversi 5.3.008 untukmenemukan algoritmayangakuratdanpengimplementasiannyadarihasilNBC PSO menggunakan Matlab R2010a.Gambar 3 Model yang diusulkan dalampenelitianDimulaidari preprocessing aitudatasetdinormalisasidanditransformasiterlebihdahulu,laluakandilakukanduaprosesyaituyanghanyadinormalisasimenggunakannormalisasimin-maxdanprosesyangmenggunakannormalisasimin-maxsertamencariatributterbaikuntukmeningkatkanakurasidanefisiensimenggunakanPSO.PSOberfungsiuntukattributeweightingyangdigunakanuntuk featureselection.Padapenelitianiniatributyangberbobot1akandigunakankarenasangatberpengaruhterhadapakurasidanefisiensi,sedangkanatribut yangberbobot0yangtidakmempengaruhiakurasi,akan dihilangkan untuk efisiensi pada algoritmayang digunakan untuk model penelitian.Setelahmelaluitahap preprocessing,datasettersebutakandimodelmenggunakanalgoritmaNaiveBayes,dimanadatasetyangmenggunakanPSOdanyangtidakmenggunakanPSOakandibandingkanakurasidanefisiensinyamenggunakanConfussionmatrixdanCurvaROC.Akurasiyangterbaikakandigunakansebagai DecisionSupportSystem (DSS). DSS tersebut akan menggunakanprogramMatlabR2010asebagaiimplementasinya.5) FaseEvaluasidanValidasi(Evaluation Phase)Dalamtahapinidilakukanvalidasidengandankeakuratan hasil akurasi serta efisiensi algoritmapada model menggunakan beberapa teknik yangterdapatpadaframeworkrapidminer versi5.3.008danMatlab,antaralainmenggunakanConfussionMatrix,untukmengukurakurasipada model yang digunakan, serta 10-fold CrossValidation untuk validasi model.IV. PEMBAHASANPadapercobaanpertamamenggunakanalgoritmaNaiveBayesterlebihdahulu tanpamenggunakanPSOuntukseleksifitur.Percobaantersebutmenggunakan45211datadan16atributprediktoryangsudahdinormalisasimenjadidatanumerikterlebihdahulu,yaitu age, job, marital, education,default, balance, housing, loan, contact, day,month, duration, campaign, pdays, previous,dan poutcome sertadigunakanjuga10-foldCrossValidationuntukvalidasidanconfussionmatrix untuk mengetahui tingkat akurasi.Percobaantersebutdilakukanselama10kalikarenasetiappercobaanmendapatkan nilaiakurasidantingkatkesalahanyangberbedayangdisebabkanolehdatayangdiambilsecaraacakpadasetiappercobaanwalaupuntetapdibagikedalam10bagianyanghampirsamajumlahnyadandiambilnilaiakurasiyangtertinggi.Tabel 2 Hasil Percobaan Naive BayesPercobaanKe -TingkatAkurasiTingkatKesalahanWaktuProses1 0,8215 0,1785 2 s2 0,8216 0,1784 2 s3 0,8211 0,1789 2 s4 0,8212 0,1788 2 s5 0,8217 0,1783 2 s6 0,8211 0,1789 2 s7 0,8214 0,1786 2 s8 0,8219 0,1781 2 s9 0,8218 0,1782 2 s10 0,8213 0,1787 2 sBerdasarkantabeldiatasyangmerupakanhasildaripercobaanyangdilakukandiMatlabR2010a,makanilaiakurasitertingginyaadalah0,8219atau82,19%dantingkatkesalahannyaadalah0,1781atau17,81%.Nilaiakurasitersebutdidapatdari confusionmatrix dataujiyang didapat dari 45211 record data yang sudahdibagi10bagianyanghampirsama.Hasildariconfusion matrix sebagai berikut.Tabel 3 Hasil Confusion MatrixClass/HasilPrediksiPrediksi0Prediksi1TotalClass 0 34309 2440 36749Class 1 5613 2849 8462Total 39922 5289 45211SedangkanhasilpercobaanyangmenggunakanalgoritmaNaiveBayesberbasisPSOmenggunakanrapidminerdan dimulaidenganmemberinilaiparameter populationsize 5-50dengankelipatannilai5dan maximumnumberofgeneration 30-50dengankelipatan10.Populationsize adalahjumlahindividutiapgenerasi,sedangkan maximumnumberofgeneration adalahjumlahgenerasimaksimumuntukmenghentikanjalannyaalgoritma.Terdapat30hasildaripercobaantersebutyangbisa dilihat seperti pada tabel 4 dibawah ini.Tabel 4 Hasil Percobaan Naive Bayes berbasisPSO dengan maximum number of generation30-50 dan population size 5-50 menggunakanRapidminerPopsizeMaxnumofgenerationAkurasiWaktuProsesJumlahAtributyangterpilih5 30 88,64% 5 m 46 s 85 40 88,41% 8 m 2 s 85 50 88,41% 9 m 57 s 810 30 88,68% 10 m 50 s 910 40 88,69% 12 m 47 s 810 50 88,24% 16 m 29 s 915 30 88,63% 13 m 46 s 815 40 88,68% 18 m 52 s 815 50 88,68% 23 m 50 s 820 30 89,31% 17 m 16 s 720 40 89,31% 23 m 1 s 720 50 89,31% 28 m 49 s 725 30 88,98% 23 m 9 s 825 40 88,98% 32 m 31 s 825 50 89,50% 38 m 18 s 630 30 89,69% 25 m 14 s 630 40 89,45% 35 m 32 s 630 50 89,70% 43 m 38 s 535 30 89,61% 33 m 8 s 835 40 89,56% 43 m 2 s 735 50 89,56% 53 m 740 30 88,93% 41 m 49 s 940 40 88,92% 54 m 7 s 840 50 88,85% 1 h 16 m49 s945 30 88,87% 47 m 11 s 945 40 88,88% 1 h 2 m 27s945 50 88,88% 1 h 28 m 2 9s50 30 89,65% 39 m 450 40 89,60% 1 h 44 s 750 50 89,12% 1 h 9 m 14s6Daritabel4diatas,diperoleh setting PSOterbaik sebagai pembobot adalah population size30dan maximumnumberofgeneration nya50denganakurasi89,70%danatributyangberbobot lebih dari 0 adalah 5 atribut. Jika lebihdariitumakaakanterjadiiterasiyangberlebihanyangberdampakpadabertambahnyawaktueksekusidanhasilakurasinyatidakmeningkat.Pernyataantersebuttelahdibuktikkandengancontohpadapercobaanyangdilakukandengan populationsize 30danmaximumnumberofgeneration 100,hasilakurasinyaadalah89,57%denganwaktu1jam16 menit 34 detik.Hasil akurasi tersebut didapatkan dari confusionmatrix yang ditunjukkan oleh gambar 5 berikut.Gambar 4 Confusion Matrix Naive BayesBerbasis PSOHasilatributdaripembobotanatributmenggunakanPSOadalahsepertiyangditunjukkan pada gambar 6.Gambar 5 Bobot Atribut dari proses AlgoritmaNaive Bayes berbasis PSOBerdasarkanhasildiatas,makaatributyangdigunakanada5yaitu marital, education,housing,dan poutcome yangbernilai1danduration yangbernilai0,856.Atributyangbernilai 0 tidak mendapat pembobotan sehinggasecaratidaklangsungdapatdihilangkanataudiseleksikarenaatributtersebuttidakoptimalsehinggadapatmeningkatkanhasilakurasisetelah dihilangkan.V. KESIMPULAN DAN SARANA. KesimpulanPadapenelitianini,algoritmaParticleSwarmOptimization(PSO)ternyatadapatmengoptimalkanalgoritmaNaiveBaiyesdenganpembobotanatributterlebihdahulusehinggaakurasidapatmeningkat. Dapatdibuktikandengan akurasialgoritmaNaiveBaiyesadalah82,19%dan untuk algoritmaNaiveBayesberbasis ParticleSwarmOptimization akurasimeningkatmenjadi89,70%,yangberartiakurasinya meningkat7,51%.Sedangkanperbandingandenganpenelitiansebelumnyayaitupenelitian [10] yangmenggunakandatasetyangsamanamunmenggunakanalgoritmayangberbedayaitualgoritmaC4.5 mempunyaiakurasisebesar88,83% danC4.5-PSOmemperoleh akurasisebesar 89,26% danuntuk Naivebaiyesmemperolehakurasisebesar82,19%sedangkanalgoritmaNaiveBaiyes-PSOmemperolehakurasisebesar89,70%,sehinggadapatdisimpulkan padapenelitianini bahwaalgoritmaNaiveBaiyes-PSOmerupakanalgoritmaterbaikyangdigunakanuntukmemprediksidatasetbankmarketingyangdigunakanuntukmemprediksinasabahyangberpotensimembukasimpanandepositopadabank.B. SaranPenelitianinimemilikibanyakkekurangandanmasihdapatdikembangkanlagipadapenelitianberikutnya.Beberapasaranuntukpengembangan penelitian selanjutnya adalah1. PenelitianinimembandingkanantaraalgoritmaNaiveBaiyesdenganNaiveBaiyesberbasisPSO,untukpenelitianselanjutnyadapatdikembangkandenganmembandingkanalgortimaklasifikasilainnyasepertialgoritmaSupport Vector Machine, Decision Tree, NeuralNetwork,yangdapatdikombinasikandenganalgoritmaoptimasilainsepertiGeneticAlgorithm(GA),AntColonyOptimization(ACO),Adaboostdanalgoritmaoptimasiyanglainnya.2. Penelitianinimenggunakandataset publicbankmarketingdariUCIMachineLearningRepository,untukpenelitianselanjutnyadapatmenggunakan datasetyang lainnya, dari datasetprivate atau dataset public untuk menguji modelalgoritma tersebut.3. Penelitianinidiharapkandapatdigunakanolehbankyangdapatdigunakanuntukmenentukankebijakandalammelakukanpromosiprodukdepositoterhadapnasabahsehinggadapatmelaksanakanpromosiyangseefisien mungkin.VI. DAFTAR PUSTAKA[1] LembagaPenjaminSimpanan,"DistribusiSimpanan BankUmum,"LembagaPenjaminSimpanan, 2013.[2] DewanPerwakilanRakyatRepublikIndonesia,"Undang-UndangRepublikIndonesiaNomor10Tahun1998,"DewanPerwakilanRakyatRepublik Indonesia, 1998.[3] S.Y.Baswara,"AnalisaNilaiHasilInvestasiDepositoRupiah,DepositoDolarAmerika,danDinarEmasDenganEmasSebagaiAlatUkur,"Skripsi Akuntansi Universitas Diponegoro, 2012.[4] D.T.Larose, DiscoveringKnowledgeInData.UnitedStatesofAmerica:JohnWiley&Sons,Inc., 2005.[5] F.Gorunescu, DataMiningConcepts,Modelsand Techniques. Chennai, India: Springer, 2011.[6] E.Prasetyo, DataMining:KonsepdanAplikasimenggunakanMATLAB,1sted.Yogyakarta,Indonesia: Andi, 2012.[7] S.MoroandR.M.S.Laureano,"UsingDataMiningfor BankDirectMarketing:AnApplicationofTheCRISP-DMMethodology,"Instituto Universitrio de Lisboa, 2011.[8] N.A.Zaidi,J.Cerquides,M.J.Carman,andG.I.Webb,"AlleviatingNaiveBayesAttributeIndependenceAssumptionbyAttributeWeighting," JournalofMachineLearning Research, no. 14, pp. 1947-1988, 2013.[9] S.-W.Fei,Y.-B.Miao,andC.-L.Liu,"ChineseGrainProductionForecastingMethodBasedonParticleSwarmOptimization-basedSupportVectorMachine,"in RecentPatentsonEngineering, Shanghai, 2009, pp. 8-12.[10] S.Mujab,"PENCARIANMODELTERBAIKANTARAALGORITMAC4.5DANC4.5BERBASISPARTICLESWARMOPTIMIZATIONUNTUKPREDIKSIPROMOSIDEPOSITO,"UniversitasDianNuswantoro Skripsi Teknik Informatika, 2013.[11] A.D.Pradibyo,"AnalisaPerbandinganKinerjaAlgoritmaKlasifikasiDataMiningUntukPrediksiNasabahBankyangBerpotensiMembukaSimpananDepositoBerjangka,"UniversitasDianNuswantoroSkripsiTeknikInformatika, 2013.[12] J.LinandJ.Yu,"WeightedNaiveBayesClassificationAlgorithmBasedonParticleSwarm Optimization," IEEE, 2011.[13] Kusrini and E. T. Luthfi, Algoritma Data Mining,1st ed. Yogyakarta, Indonesia: Andi, 2009.[14] H.Leidiyana,"PENERAPANALGORITMAK-NEARESTNEIGHBORUNTUKPENENTUANRESIKOKREDITKEPEMILIKANKENDARAANBEMOTOR," JurnalPenelitianIlmuKomputer,SystemEmbedded&Logic,vol.1, pp. 65-76, 2013.[15] J.Han,M.Kamber,andJ.Pei, DataMiningConceptsandTechniques.Waltham,UnitedStates of America: Morgan Kaufmann, 2012.