jurnal_13635

Prediksi Nasabah yang Berpotensi Membuka Simpanan DepositoMenggunakan Naive Bayes Berbasis Particle Swarm OptimizationAlvino Dwi Rachman PrabowoProgram Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Dian Nuswantoro SemarangJl. Nakula 1 No. 5-11, Semarang, 50131, Telp: (024) 3517261, Fax : (024) 325 0165E-mail : [email protected]_________________________________________________________AbstrakDepositomasihmerupakanpilihanutamamasyarakatuntukberinvestasidanhalinimerupakankesempatan bagi bank untuk menentukan strategi pemasaran dan promosi yang lebih efisien dan efektif.Atasdasarpermasalahantersebut,makadilakukanpenelitianuntukmemprediksinasabahyangberpotensi membuka deposito dengan menggunakan teknik data mining khususnya algoritma Naive BayesberbasisPSO. PSOpadapenelitianiniakandigunakanuntukseleksifitur. Hasildaripenelitianini,akurasi algoritma Naive Baiyes adalah 82,19% dan akurasi algoritma Naive Baiyes berbasis PSO adalah89,70%.PenggunaanalgoritmaPSOternyatameningkatkanakurasisebesar7,51%danalgoritmatersebut dapat digunakan untuk sistem pendukung keputusan pada penelitian ini.Katakunci: prediksinasabahyangberpotensimembukadeposito, datamining, naivebaiyes, particleswarm optimization, seleksi fiturAbstractDeposits are still the main choice for people to invest this time and it was an opportunity for the banks todetermine marketingstrategiesandpromotionofmoreefficientandeffective.Fromthebasisoftheseproblems, the research conducted to predict the potential customers who will make deposits by using dataminingtechniques,especiallyNaiveBayesalgorithmbasedPSO.PSOinthisstudywillbeusedforfeatureselection. Theresultsofthisstudy,theaccuracyoftheNaiveBayesalgorthmis82,19%andtheaccuracy of the PSO based Naive Bayes algorithm is 89,70%. The use of PSO algorithm has increased by7,51% and the accuracy of the algorithm can be used for decision support systems in this study.Keyword: predictionofthepotentialcustomerswhowillopendeposits , datamining, naivebayes,particleswarm optimization, feature selectionI. PENDAHULUANDepositomasihmerupakanprimadonabagimasyarakatyanginginberinvestasinamundengansedikitresiko.InibisadilihatdarimeningkatnyajumlahrekeningdepositodaribulanJuni2013kebulanJuli2013dari2.940.178pemilikrekeningmenjadi2.955.539pemilikrekening [1].MenurutUndang Undang Nomor 10 tahun 1998, deposito sendirimemilikidefinisiyaitusimpananyangpenarikannya hanya dapat dilakukan pada waktutertentuberdasarkanperjanjiannasabahpenyimpandenganbank [2].Halitudikarenakandepositomemilikitingkatsukubungapertahunyangditerimalebihtinggiapabiladibandingkandengansukubungagiroatau simpanan tabungan biasa [3].Untukitu,suatubankharusmengambilkesempataninidenganmelakukanpromosidanstrategipemasaranyangefisien salahsatunyadenganmelakukanpemasaranlangsungdansalahsatucarayangdapatdigunakan yaitumemprediksinasabahyangberpotensimembukasimpanandepositopadabanktersebut.Prediksitersebutdapatdigunakandenganmenggunakandata-datanasabahyangsudahadalaludiprosessehinggamenemukanhubungan yang berarti, pola, dan kecenderungandenganmemeriksadalamsekumpulanbesardatayangtersimpandalampenyimpanandenganmenggunakanteknikpengenalanpolaseperti statistik dan matematika. Proses tersebutdinamakanDataMining [4]. Prosesprediksitersebut dapat menggunakan teknik klasifikasi.Teknikklasifikasiadalahsalahsatudariteknikdataminingyangtermasuk supervisedlearning.Supervisedlearningartinyaprosespembentukansebuahkorespondensi(fungsi)menggunakansebuah training dataset,dilihatsebagaisebuah"pengalamanmasalalu"darisebuahmodel.Tujuannyaadalahuntukmemprediksidarisebuahnilai(output)darisebuahfungsiuntuksetiapobjekbaru(input)setelah menyelesaikan proses training [5].Klasifikasimerupakansuatupekerjaanmenilaiobjekdatauntukmemasukkannyakedalamkelastertentudarisejumlahkelasyangtersedia.Dalamklasifikasiadaduapekerjaanutamayangdilakukanyaitupembangunanmodelsebagai prototypeuntukdisimpansebagai memori dan penggunaan model tersebutuntukmelakukanpengenalan/klasifikasi/prediksipadaunsurobjekdatalainagardiketahuidikelasmanaobjekdatatersebutdalammodelyangsudahdisimpannya. [6].Adabeberapaalgoritmaklasifikasidataminingyangdapatdigunakanuntukstrategipemasarandanpromosi,sepertiyangditulisolehSergioMorodanRaulM.S.LaureanodiantaranyaNaveBayes(NB),DecisionTrees(DT) dan Support Vector Machines (SVM) [7].NaiveBayesmerupakanteknikprediksiberbasisprobabilistiksederhanayangberdasarpadapenerapanteoremaatauaturanbayesdenganasumsiindependensiyangkuatpadafitur,artinyabahwasebuahfiturpadasebuahdatatidakberkaitandenganadaatautidaknyafitur lain dalam data yang sama [6].NamunNaiveBayesmemilikikelemahanyaituattributataufiturindependenseringsalahdanhasilestimasiprobabilitastidakdapatberjalanoptimal. Untukmengatasikelemahantersebutsalahsatucaranya denganmetodepembobotanattributuntukmeningkatkanakurasidariNaiveBayestersebut [8] dannantinyahasilbobotatributtersebutakandigunakanuntukmenseleksifiturdanatributyangada. Untukmelakukanmetodepembobotanattributtersebut,salahsatunyamenggunakanParticleSwarmOptimization(PSO).ParticleSwarmOptimization(PSO)adalahmetodeyangterinspirasidariperilakusosialsekelompokburungdanikan.MetodePSOmudah diterapkan dan dapatmemilih parameteryang sesuai. Metode optimasi ini terbukti efektifdanberhasildigunakanuntukmemecahkanmasalahoptimasi multidimensidanmultiparameterpadapembelajaranmachinelearningsepertiNeuralNetwork,SVM,danalgoritma teknik klasifikasi yang lain [9].Padapenelitiansebelumnyadenganmenggunakandatayangsama,namunmenggunakanalgoritmayangberbedayaitumenggunakanalgoritmaC4.5danalgoritmaC4.5berbasisPSO [10] danalgoritmaNaveBaiyes [11] dengan hasil akurasi algoritma C4.5sebesar 84,13% dengan AUC 0,837. Untuk hasilalgoritmaC4.5-PSOsebesar86,09%danAUC0,883. Sedangkan untuk algoritma Nave Baiyesmenghasilkan akurasi sebesar 87,03% dan AUC0,813.Padapenelitianini,PSOakandigunakanuntuk featureselection yaitudenganmemilihattributterbaikdenganmemilihattributyangsudah diberikan bobot untuk meningkatkan hasilakurasidariNaiveBayes.Hasildaripenelitianiniadalahmeningkatkanakurasiprediksinasabahyangberpotensi membukasimpanandepositodanmenunjukkanbahwametodetersebutlebihbaikdaripadametode-metodeyangsudahdigunakandalampenelitiansebelumnya.II. TINJAUAN PUSTAKAA. Related ResearchBeberapapenelitianberkaitantentangklasifikasidatamining yangdigunakanuntukprediksikhususnyauntukmemprediksisuatuhasil dan menggunakan algoritma optimasi telahbanyak dilakukan beberapa diantaranya : Jie LindanJiankunYu dariYunnanUniversityofFinanceandEconomicstelahmelakukanpenelitianmengenaipenggunaan WeightedNaiveBayesberbasis algoritmaParticleSwarmOptimization (PSO)yangdigunakan untukpembobotanatribut [12]. PSOdigunakanuntukfungsipencarianotomatisketikamempertahankanintegritasdarisetiapattributdata.MetodePSOtersebutternyatadapatmeningkatkanakurasidarialgoritmaNaiveBayes.MetodetersebutmemberikanhasilyangdiharapkansetelahmenggunakandatasetUCIdandapatdigunakansecaralayakdanefektif.Salahsatu hasilnyaadalahpadadatasettransfusion,jikamenggunakanNaiveBayesmendapatkan akurasi sebesar 0.751336898 atau75.1336898%.JikamenggunakanPSOWeightedNaiveBayesClassifier(PSOWNBC)makamendapatkanakurasisebesar0.771390374 atau 77.1390374%.B. Data MiningMenurut Tan (2006) pada [6] mendefinisikandatamining sebagaiprosesuntukmendapatkaninformasiyangbergunadarigudangbasisdatayangbesar. Datamining jugadapatdiartikansebagaipengekstrakaninformasibaruyangdiambildaribongkahandatabesaryangmembantudalampengambilankeputusan.Isitilah datamining kadangdisebutjugaknowledge discovery.C. Naive BayesNaiveBayesadalahpengklasifikasianstatistikyangdapatdigunakanuntukmemprediksiprobabilitaskeanggotaansuatuclass.NaiveBayesdidasarkanpadateoremaBayesyangmemilikikemampuanklasifikasiserupa dengan decision tree dan neural network.Naive Bayesterbuktimemilikiakurasidankecepatanyangtinggisaatdiaplikasikankedalam database dengan data yang besar [13].PrediksiBayesdidasarkanpadaformulateoremaBayesdenganformulaumumsebagaiberikut [6] :| =( | ) ( )( )(1)Sedangkan Formulasi dari Nave Bayes untukklasifikasi adalah [6]| =( ) ( | )( )(2)P(Y|X)adalahprobabilitasdatadenganvektor X pada kelas Y. P(Y) adalah probabilitasawalkelasY. ( | ) adalahprobabilitasindependenkelasYdarisemuafiturdalamvector X. Nilai P(X) selalu tetap sehingga dalamperhitunganprediksinantinyakitatinggalmenghitungbagian ( ) ( | ) denganmemilihyangterbesarsebagaikelasyangdipilihsebagaihasilprediksi.Sementaraprobabilitasindependen ( | ) tersebutmerupakanpengaruhsemuafiturdaridataterhadapsetiapkelasY,yangdinotasikandengan [6]:| = = ( | = )(3)Setiap set fitur X= { , , , . , } terdiriatas q atribut.Untukatributyangmempunyaitipedatakontinu,makadinyatakandalamformulasiberikut [6]:= | = =12( )(4)Dimana parameter bisa didapat dari meanataurata-ratasampel ( )darisemuadatalatih yang menjadi milik kelas sedangkandidapat dari varian sampel ( ) dari data latih.D. Particle Swarm Optimization (PSO)PSO adalahmetode pencarian populasi,yangberasaldaripenelitianuntukpergerakanberkelompokburungdanikandalammencarimakan [9].Sepertialgoritmagenetika,PSOmelakukanpencarianmenggunakanpopulasi(disebut swarm)dariindividu-individu(disebutpartikel) yang diperbarui dari setiap iterasi yangdilakukan.Untukmenemukansolusiyangoptimal,setiappartikelbergerakkearahposisiterbaikyangsebelumnya(pbest)danposisiglobalterbaik(gbest).Kecepatandanposisipartikeldapatterusdiperbaruiataumelakukaniterasi dengan persamaan berikut := 1 + + (5)= 1 + ( )= +1(6)Padapenelitianini,PSOdigunakanuntukmenyeleksifitur(featureselection).Untukmenyeleksi fitur atau atribut tersebut, maka PSOmenggunakanbobotatributyangtelahdihitungdanatributyangtelahdiseleksiakandiprediksimenggunakanalgoritma NaiveBayes.Untukmendapatkanbobottersebut,makafungsiyangdigunakan adalah [12] :Dimana (|~ ) merupakanjumlahprobabilitasdaridataXyangtidaktermasukdalamkelas .Langkah-langkahuntukmendapatkanbobottersebutadalahsebagaiberikut [12].1. Menyiapkan sampel dataset, siap untukmenghitung bobot dari record pertama,2. Inilisialisasipopulasi(swarm)P(t)sehinggaketikat=0,lokasi ( ) darisetiappartikel ( )disuaturuangyangluasmenjadi acak.3. Melaluisetiapposisipartikelsaatitu,( ) mengevaluasi performa dari F.4. Membandingkankinerjamasing-masingindividusaatinidenganindividuyangmempunyaikinerjaterbaikyangsejauhinidimiliki jika > maka= =5. Membandingkankinerjamasing-masingpartikeldengankinerjapartikelterbaiksecara global, jika > maka= =Ubahkecepatanvectordariparticledenganmenggunakanformula5. Setelahmendapatkankecepatannyalalu,tempatkansetiappartikelkelokasiyangbarumenggunakanformula 6.Kembali ke langkah nomor 2, ulangi perulanganhinggamendapatkannilaiyangkonvergendanmendapatkan bobot.6. Jikaperhitunganbobotdarirecordterakhir di data sampel selesai, maka akhiri. Jikatidak,siapuntukmenghitungbobotdarirecordberikutnyadankembalimengulangidarilangkah nomor 1.Setelahitu,laluhitungrata-ratabobotyangtelah dihitung dari data sampel tersebut.E. Cross ValidationCrossvalidation adalahpengujianstandaryangdilakukanuntukmemprediksi errorrate.Datatraining dibagisecara random kedalambeberapabagiandenganperbandinganyangsama kemudian error rate dihitung bagian demibagian,selanjutnyahitungrata-rataseluruherrorrate untukmendapat errorrate secarakeseluruhan [14].Crossvalidationmempunyaibanyakmodel,diantaranya k-foldcrossvaldiation dan leave-one-out cross validation.Biasanya,10-foldcrossvalidationdirekomendasikan untuk akurasi prediksi karenarelatif rendah nilai bias dan varian. pada 10-foldcrossvalidation,datadibagimenjadi10bagianterlebihdahulusecaraacakdenganperbandinganyangsama,laluhitungerrorratesetiapbagian,setelahitudiperoleherrorratesecarakeseluruhandarimenghitungrata-rataerror rate dari semua bagian data [15].Gambar 1 Ilustrasi 10-fold cross validation(Vercellis, 2009)F. Confusion MatrixConfusionmatrix merupakanalatyangbergunauntukmenganalisaseberapabaikklasifikasi tersebut dapatmengenali tuple-tupledari kelas-kelas yang berbeda.Darigambardiatas,TPdanTNmenunjukkan= | ( |~ ) (7)Gambar 2 Confusion Matrixbahwa klasifikasitersebutbernilaibenarataucocokdengannilaiasli,sedangkanFPdanFNmenunjukkan bahwa klasifikasi tersebut bernilaisalah atau tidak cocok dengan nilai asli.Rumustersebutmerupakanrumusdariconfusionmatrix yangdigunakanmendapatkanhasilakurasidarihasilklasifikasiyangsudahdilakukan.III. METODE YANG DIUSULKANA. CRISP-DM1) FasePemahamanBisnis(BusinessUnderstanding Phase)Padatahapawal, penulismenggunakan datasetpublicberjudul BankMarketing yang pernahdigunakanolehS.Moro,R.LaureanodanP.Cortez,yangberjudulUsingDataMiningforBankDirectMarketing:AnApplicationoftheCRISP-DMMethodology dariwebsiteUniversityofCalifornia,Irvine(UCI)MachineLearning.2) FasePemahamanData(DataUnderstanding Phase)Dataset BankMarketing tersebutterdiridari16attributprediktordan1attributlabel.Attributprediktor adalah attribut yang dijadikan penentunasabahyanghampirpastimembukarekeningdepositodanattributlabelyaituattributyangdijadikan hasil learning.Atributprediktoryangdigunakanpadapenelitianiniadalah age, job, marital,education, default, balance, housing, loan,contact, day, month, duration, campaign, pdays,previous, dan poutcome. Sedangkan atribut hasilatau label adalah y.Tabel 1 Attribut pada DatasetNo Attribut Keterangan dan Nilai1 Age Umur nasabah2 Job Jenispekerjaannasabah(admin./unknown/unemployed/management/housemaid/entrepreneur/student/blue-collar/selfemployed/retired/technician/services)3 Marital Status pernikahan(married/divorced/single)4 Education Pendidikan Nasabah(unknown/secondary/primary/tertiary)5 Default Apakahmempunyaikreditgagal?(no/yes)6 Balance Rata-ratapenghasilanpertahundalammatauangEuro7 Housing Apakahmempunyaikreditpeminjaman rumah?(no/yes)8 Loan Apakahmempunyaipinjaman pribadi?(no/yes)9 Contact Jeniskomunikasiyangdigunakan(unknwon/telephone/cellular)10 Day Tanggalterakhirmenghubungi11 Month Bulanterakhirmenghubungi(Januari/Februari/Maret/April/Mei/Juni/Juli/Agustus/September/Oktober/November/Desember)12 Duration Durasiterakhirmenghubungi dalam detik13 Campaign Jumlahkontakyangdilakukanselamapromosiini dan untuk klien ini14 Pdays Jumlahhariyangberlalusetelahnasabahterakhir=++ + +(8)dihubungidaripromosisebelumnya.15 Previous Jumlahkontakdilakukansebelumpromosiinidanuntuk klien ini.16 Poutcome Hasildaripromosipemasaran sebelumnya(Unknown/Other/Failure/Success)17 Y Apakahnasabahberlanggandepositoyangditawarkan? (no/yes)3) FasePengolahanData(DataPreparation Phase)Jumlahdatayangtelahdiperolehadalah45211recorddengan16atributprediktordansatuatribut hasil seperti yang telah diterangkan padatabel3.1.Namuntidaksemuadatadanatributdapat digunakansehinggaharusmelewati tahappersiapandata(datapreparation).Untukmendapatkandatayangberkualitasmakadapatdilakukanteknik-tekniksebagaiberikut(Vercellis,2009).1. DataValidation,kualitas daridatamungkintidakmemuaskandikarenakanadadatayangganjil(outlier/noise),datayangtidakkonsistendanadadatayangtidaklengkap(missingvalue).Jumlahdataawaladalah45211recorddengan 16 atribut prediktor dan satu atribut hasildandari keseluruhandatatidakterdapatdatayang missing, tidak konsisten ataupun noise.2. Data integrationandtransformation,untukmeningkatkanakurasidanefisiensialgoritmadapatdilakukandenganmelakukanbeberapatransformasi.Daridatasetyangdigunakan,karenauntukmempermudahimplementasikedalamMatlab,makadatanominalyangadaharusditransformasiketipedatanumerikterlebihdahulu dandatayangcontinueatauberlanjutsepertiatributbalancedanpdaysmenggunakannormalisasimin-maxdenganmenggunakan formula,=

+ (9)3. Data sizereductionanddiscritization,mengurangiatributatauvariabeluntukmeningkatkan akurasi dan memproses algoritmadenganlebihefisientanpamengorbankankualitasdarihasilyangakandiperoleh.Dalampenelitianini,untukmemprosesalgoritmadengan lebih efisien dan lebih cepat serta untukmeningkatkanakurasimakadigunakan FeatureSelection denganpembobotanatributterlebihdahulu menggunakan algoritma PSO.4) Fase Pemodelan (Modelling Phase)Penelitianinimenggunakanduametodeyaitualgoritma NaiveBayesClassifier (NBC)danalgoritmaNBCyangdikombinasikandenganalgoritmaPSOyangdigunakansebagaipembobotanatributuntuk featureselection.Prosesmembandingkandalampenelitianiniakanmenggunakan framework RapidMinerversi 5.3.008 untukmenemukan algoritmayangakuratdanpengimplementasiannyadarihasilNBC PSO menggunakan Matlab R2010a.Gambar 3 Model yang diusulkan dalampenelitianDimulaidari preprocessing aitudatasetdinormalisasidanditransformasiterlebihdahulu,laluakandilakukanduaprosesyaituyanghanyadinormalisasimenggunakannormalisasimin-maxdanprosesyangmenggunakannormalisasimin-maxsertamencariatributterbaikuntukmeningkatkanakurasidanefisiensimenggunakanPSO.PSOberfungsiuntukattributeweightingyangdigunakanuntuk featureselection.Padapenelitianiniatributyangberbobot1akandigunakankarenasangatberpengaruhterhadapakurasidanefisiensi,sedangkanatribut yangberbobot0yangtidakmempengaruhiakurasi,akan dihilangkan untuk efisiensi pada algoritmayang digunakan untuk model penelitian.Setelahmelaluitahap preprocessing,datasettersebutakandimodelmenggunakanalgoritmaNaiveBayes,dimanadatasetyangmenggunakanPSOdanyangtidakmenggunakanPSOakandibandingkanakurasidanefisiensinyamenggunakanConfussionmatrixdanCurvaROC.Akurasiyangterbaikakandigunakansebagai DecisionSupportSystem (DSS). DSS tersebut akan menggunakanprogramMatlabR2010asebagaiimplementasinya.5) FaseEvaluasidanValidasi(Evaluation Phase)Dalamtahapinidilakukanvalidasidengandankeakuratan hasil akurasi serta efisiensi algoritmapada model menggunakan beberapa teknik yangterdapatpadaframeworkrapidminer versi5.3.008danMatlab,antaralainmenggunakanConfussionMatrix,untukmengukurakurasipada model yang digunakan, serta 10-fold CrossValidation untuk validasi model.IV. PEMBAHASANPadapercobaanpertamamenggunakanalgoritmaNaiveBayesterlebihdahulu tanpamenggunakanPSOuntukseleksifitur.Percobaantersebutmenggunakan45211datadan16atributprediktoryangsudahdinormalisasimenjadidatanumerikterlebihdahulu,yaitu age, job, marital, education,default, balance, housing, loan, contact, day,month, duration, campaign, pdays, previous,dan poutcome sertadigunakanjuga10-foldCrossValidationuntukvalidasidanconfussionmatrix untuk mengetahui tingkat akurasi.Percobaantersebutdilakukanselama10kalikarenasetiappercobaanmendapatkan nilaiakurasidantingkatkesalahanyangberbedayangdisebabkanolehdatayangdiambilsecaraacakpadasetiappercobaanwalaupuntetapdibagikedalam10bagianyanghampirsamajumlahnyadandiambilnilaiakurasiyangtertinggi.Tabel 2 Hasil Percobaan Naive BayesPercobaanKe -TingkatAkurasiTingkatKesalahanWaktuProses1 0,8215 0,1785 2 s2 0,8216 0,1784 2 s3 0,8211 0,1789 2 s4 0,8212 0,1788 2 s5 0,8217 0,1783 2 s6 0,8211 0,1789 2 s7 0,8214 0,1786 2 s8 0,8219 0,1781 2 s9 0,8218 0,1782 2 s10 0,8213 0,1787 2 sBerdasarkantabeldiatasyangmerupakanhasildaripercobaanyangdilakukandiMatlabR2010a,makanilaiakurasitertingginyaadalah0,8219atau82,19%dantingkatkesalahannyaadalah0,1781atau17,81%.Nilaiakurasitersebutdidapatdari confusionmatrix dataujiyang didapat dari 45211 record data yang sudahdibagi10bagianyanghampirsama.Hasildariconfusion matrix sebagai berikut.Tabel 3 Hasil Confusion MatrixClass/HasilPrediksiPrediksi0Prediksi1TotalClass 0 34309 2440 36749Class 1 5613 2849 8462Total 39922 5289 45211SedangkanhasilpercobaanyangmenggunakanalgoritmaNaiveBayesberbasisPSOmenggunakanrapidminerdan dimulaidenganmemberinilaiparameter populationsize 5-50dengankelipatannilai5dan maximumnumberofgeneration 30-50dengankelipatan10.Populationsize adalahjumlahindividutiapgenerasi,sedangkan maximumnumberofgeneration adalahjumlahgenerasimaksimumuntukmenghentikanjalannyaalgoritma.Terdapat30hasildaripercobaantersebutyangbisa dilihat seperti pada tabel 4 dibawah ini.Tabel 4 Hasil Percobaan Naive Bayes berbasisPSO dengan maximum number of generation30-50 dan population size 5-50 menggunakanRapidminerPopsizeMaxnumofgenerationAkurasiWaktuProsesJumlahAtributyangterpilih5 30 88,64% 5 m 46 s 85 40 88,41% 8 m 2 s 85 50 88,41% 9 m 57 s 810 30 88,68% 10 m 50 s 910 40 88,69% 12 m 47 s 810 50 88,24% 16 m 29 s 915 30 88,63% 13 m 46 s 815 40 88,68% 18 m 52 s 815 50 88,68% 23 m 50 s 820 30 89,31% 17 m 16 s 720 40 89,31% 23 m 1 s 720 50 89,31% 28 m 49 s 725 30 88,98% 23 m 9 s 825 40 88,98% 32 m 31 s 825 50 89,50% 38 m 18 s 630 30 89,69% 25 m 14 s 630 40 89,45% 35 m 32 s 630 50 89,70% 43 m 38 s 535 30 89,61% 33 m 8 s 835 40 89,56% 43 m 2 s 735 50 89,56% 53 m 740 30 88,93% 41 m 49 s 940 40 88,92% 54 m 7 s 840 50 88,85% 1 h 16 m49 s945 30 88,87% 47 m 11 s 945 40 88,88% 1 h 2 m 27s945 50 88,88% 1 h 28 m 2 9s50 30 89,65% 39 m 450 40 89,60% 1 h 44 s 750 50 89,12% 1 h 9 m 14s6Daritabel4diatas,diperoleh setting PSOterbaik sebagai pembobot adalah population size30dan maximumnumberofgeneration nya50denganakurasi89,70%danatributyangberbobot lebih dari 0 adalah 5 atribut. Jika lebihdariitumakaakanterjadiiterasiyangberlebihanyangberdampakpadabertambahnyawaktueksekusidanhasilakurasinyatidakmeningkat.Pernyataantersebuttelahdibuktikkandengancontohpadapercobaanyangdilakukandengan populationsize 30danmaximumnumberofgeneration 100,hasilakurasinyaadalah89,57%denganwaktu1jam16 menit 34 detik.Hasil akurasi tersebut didapatkan dari confusionmatrix yang ditunjukkan oleh gambar 5 berikut.Gambar 4 Confusion Matrix Naive BayesBerbasis PSOHasilatributdaripembobotanatributmenggunakanPSOadalahsepertiyangditunjukkan pada gambar 6.Gambar 5 Bobot Atribut dari proses AlgoritmaNaive Bayes berbasis PSOBerdasarkanhasildiatas,makaatributyangdigunakanada5yaitu marital, education,housing,dan poutcome yangbernilai1danduration yangbernilai0,856.Atributyangbernilai 0 tidak mendapat pembobotan sehinggasecaratidaklangsungdapatdihilangkanataudiseleksikarenaatributtersebuttidakoptimalsehinggadapatmeningkatkanhasilakurasisetelah dihilangkan.V. KESIMPULAN DAN SARANA. KesimpulanPadapenelitianini,algoritmaParticleSwarmOptimization(PSO)ternyatadapatmengoptimalkanalgoritmaNaiveBaiyesdenganpembobotanatributterlebihdahulusehinggaakurasidapatmeningkat. Dapatdibuktikandengan akurasialgoritmaNaiveBaiyesadalah82,19%dan untuk algoritmaNaiveBayesberbasis ParticleSwarmOptimization akurasimeningkatmenjadi89,70%,yangberartiakurasinya meningkat7,51%.Sedangkanperbandingandenganpenelitiansebelumnyayaitupenelitian [10] yangmenggunakandatasetyangsamanamunmenggunakanalgoritmayangberbedayaitualgoritmaC4.5 mempunyaiakurasisebesar88,83% danC4.5-PSOmemperoleh akurasisebesar 89,26% danuntuk Naivebaiyesmemperolehakurasisebesar82,19%sedangkanalgoritmaNaiveBaiyes-PSOmemperolehakurasisebesar89,70%,sehinggadapatdisimpulkan padapenelitianini bahwaalgoritmaNaiveBaiyes-PSOmerupakanalgoritmaterbaikyangdigunakanuntukmemprediksidatasetbankmarketingyangdigunakanuntukmemprediksinasabahyangberpotensimembukasimpanandepositopadabank.B. SaranPenelitianinimemilikibanyakkekurangandanmasihdapatdikembangkanlagipadapenelitianberikutnya.Beberapasaranuntukpengembangan penelitian selanjutnya adalah1. PenelitianinimembandingkanantaraalgoritmaNaiveBaiyesdenganNaiveBaiyesberbasisPSO,untukpenelitianselanjutnyadapatdikembangkandenganmembandingkanalgortimaklasifikasilainnyasepertialgoritmaSupport Vector Machine, Decision Tree, NeuralNetwork,yangdapatdikombinasikandenganalgoritmaoptimasilainsepertiGeneticAlgorithm(GA),AntColonyOptimization(ACO),Adaboostdanalgoritmaoptimasiyanglainnya.2. Penelitianinimenggunakandataset publicbankmarketingdariUCIMachineLearningRepository,untukpenelitianselanjutnyadapatmenggunakan datasetyang lainnya, dari datasetprivate atau dataset public untuk menguji modelalgoritma tersebut.3. Penelitianinidiharapkandapatdigunakanolehbankyangdapatdigunakanuntukmenentukankebijakandalammelakukanpromosiprodukdepositoterhadapnasabahsehinggadapatmelaksanakanpromosiyangseefisien mungkin.VI. DAFTAR PUSTAKA[1] LembagaPenjaminSimpanan,"DistribusiSimpanan BankUmum,"LembagaPenjaminSimpanan, 2013.[2] DewanPerwakilanRakyatRepublikIndonesia,"Undang-UndangRepublikIndonesiaNomor10Tahun1998,"DewanPerwakilanRakyatRepublik Indonesia, 1998.[3] S.Y.Baswara,"AnalisaNilaiHasilInvestasiDepositoRupiah,DepositoDolarAmerika,danDinarEmasDenganEmasSebagaiAlatUkur,"Skripsi Akuntansi Universitas Diponegoro, 2012.[4] D.T.Larose, DiscoveringKnowledgeInData.UnitedStatesofAmerica:JohnWiley&Sons,Inc., 2005.[5] F.Gorunescu, DataMiningConcepts,Modelsand Techniques. Chennai, India: Springer, 2011.[6] E.Prasetyo, DataMining:KonsepdanAplikasimenggunakanMATLAB,1sted.Yogyakarta,Indonesia: Andi, 2012.[7] S.MoroandR.M.S.Laureano,"UsingDataMiningfor BankDirectMarketing:AnApplicationofTheCRISP-DMMethodology,"Instituto Universitrio de Lisboa, 2011.[8] N.A.Zaidi,J.Cerquides,M.J.Carman,andG.I.Webb,"AlleviatingNaiveBayesAttributeIndependenceAssumptionbyAttributeWeighting," JournalofMachineLearning Research, no. 14, pp. 1947-1988, 2013.[9] S.-W.Fei,Y.-B.Miao,andC.-L.Liu,"ChineseGrainProductionForecastingMethodBasedonParticleSwarmOptimization-basedSupportVectorMachine,"in RecentPatentsonEngineering, Shanghai, 2009, pp. 8-12.[10] S.Mujab,"PENCARIANMODELTERBAIKANTARAALGORITMAC4.5DANC4.5BERBASISPARTICLESWARMOPTIMIZATIONUNTUKPREDIKSIPROMOSIDEPOSITO,"UniversitasDianNuswantoro Skripsi Teknik Informatika, 2013.[11] A.D.Pradibyo,"AnalisaPerbandinganKinerjaAlgoritmaKlasifikasiDataMiningUntukPrediksiNasabahBankyangBerpotensiMembukaSimpananDepositoBerjangka,"UniversitasDianNuswantoroSkripsiTeknikInformatika, 2013.[12] J.LinandJ.Yu,"WeightedNaiveBayesClassificationAlgorithmBasedonParticleSwarm Optimization," IEEE, 2011.[13] Kusrini and E. T. Luthfi, Algoritma Data Mining,1st ed. Yogyakarta, Indonesia: Andi, 2009.[14] H.Leidiyana,"PENERAPANALGORITMAK-NEARESTNEIGHBORUNTUKPENENTUANRESIKOKREDITKEPEMILIKANKENDARAANBEMOTOR," JurnalPenelitianIlmuKomputer,SystemEmbedded&Logic,vol.1, pp. 65-76, 2013.[15] J.Han,M.Kamber,andJ.Pei, DataMiningConceptsandTechniques.Waltham,UnitedStates of America: Morgan Kaufmann, 2012.

jurnal_13635

Documents