identifikasi pencurian tenaga listrik menggunakan ... · identifikasi pencurian tenaga listrik...

21
Identifikasi Pencurian Tenaga Listrik menggunakan Algoritma Klasifikasi Naive Bayes Artikel Ilmiah Peneliti: Gabriela Ori Lumondo (672015253) Dr. Kristoko Dwi Hartomo, M.Kom. Program Studi Teknik Informatika Fakultas Teknologi Informasi Universitas Kristen Satya Wacana Salatiga Januari 2018

Upload: others

Post on 21-Jan-2020

31 views

Category:

Documents


1 download

TRANSCRIPT

Identifikasi Pencurian Tenaga Listrik menggunakan

Algoritma Klasifikasi Naive Bayes

Artikel Ilmiah

Peneliti:

Gabriela Ori Lumondo (672015253)

Dr. Kristoko Dwi Hartomo, M.Kom.

Program Studi Teknik Informatika

Fakultas Teknologi Informasi

Universitas Kristen Satya Wacana

Salatiga

Januari 2018

Identifikasi Pencurian Tenaga Listrik menggunakan

Algoritma Klasifikasi Naive Bayes

Artikel Ilmiah

Diajukan kepada

Fakultas Teknologi Informasi

untuk memperoleh Gelar Sarjana Komputer

Peneliti:

Gabriela Ori Lumondo (672015253)

Dr. Kristoko Dwi Hartomo, M.Kom.

Program Studi Teknik Informatika

Fakultas Teknologi Informasi

Universitas Kristen Satya Wacana

Salatiga

Januari 2018

1

Identifikasi Pencurian Tenaga Listrik menggunakan

Algoritma Klasifikasi Naive Bayes

1)

Gabriela Ori Lumondo, 2)

Kristoko Dwi Hartomo

Fakultas Teknologi Informasi

Universitas Kristen Satya Wacana

Jl. Dr. O. Notohamidjojo, Kel.Blotongan, Kec. Sidorejo, Salatiga 50714, Indonesia

Email: 1)

[email protected], 2)

[email protected]

Abstract

These days, almost all life aspects need electricity. The more electricity

consumption needed, the bigger the expense will be. Some customers would even steal the

electric power to fulfill their need. Naive Bayes algorithm is used to solve this matter on

this research. The application of Naive Bayes is used to classify theft done by PLN

customers. From the data tested by Naive Bayes, it is known that 14.28% of customers is

identified as operation target, 9.52% is on fraud, and 76.2% is categorized as normal.

Keywords: Electricity, Classification Naive Bayes Algorithm

Abstrak

Hampir semua aspek kehidupan manusia sekarang ini membutuhkan listrik.

Semakin banyak tenaga listrik yang dibutuhkan maka semakin banyak biaya yang harus

dikeluarkan. Sehingga ada pelanggan yang melakukan pencurian tenaga listrik untuk

memenuhi kebutuhan tersebut. Algoritma Naive Bayes digunakan untuk menyelesaikan

masalah pada penelitian kali ini. Penerapan Naive Bayes ini bertujuan untuk

mengklasifikasi pencurian yang dilakukan pelanggan PLN. Dari data yang diuji oleh

Naive Bayes dihasilkan 14,28 persen pelanggan diidentifikasikan dalam golongan sasaran

operasi, kemudian 9,52 persen dalam golongan penyimpangan, dan 76,2 persen

digolongkan normal.

Kata Kunci: Listrik, Algoritma Klasifikasi Naive Bayes

1)Mahasiswa Fakultas Teknologi Informasi Program Studi Teknik Informatika, Universitas Kristen Satya

Wacana Salatiga. 2) Pengajar Fakultas Teknologi Informasi, Universitas Kristen Satya Wacana Salatiga.

2

I. Pendahuluan

Hampir semua aspek kehidupan manusia sekarang ini membutuhkan

tenaga listrik. Tak terkecuali di negara kita Indonesia. Seperti yang telah

diketahui, bahwa di Indonesia ada Perusahaan Listrik Negara sebagai Badan

Usaha Milik Negara yang berbentuk Perusahaan Perseroan (Persero)

berkewajiban untuk menyediakan tenaga listrik bagi kepentingan umum

dengan tetap memperhatikan tujuan perusahaan yaitu menghasilkan keuntungan sesuai dengan Undang – Undang Nomor 19 Tahun

2003 Pasal 12 tentang Badan Usaha Milik Negara. Namun dalam usaha

menghasilkan keuntungan tersebut, PT PLN masih mengalami beberapa

kendala salah satunya pencurian yang dilakukan oleh pelanggan PLN. Terdapat

empat jenis pencurian P2TL. Pencurian golongan I (P I), merupakan pencurian

yang mempengaruhi batas tenaga. Pencurian golongan II (P II), merupakan

pencurian yang mempengaruhi pengukuran energi. Pencurian golongan III (P

III), merupakan pencurian yang mempengaruhi batas tenaga dan

mempengaruhi pengukuran energi. Sedangkan pencurian yang terakhir adalah

pencurian golongan IV (P IV), merupakan pencurian yang dilakukan oleh

bukan pelanggar. Pencurian seperti di atas dapat menghasilkan susut, karena ada tenaga

listrik yang digunakan secara cuma-cuma tanpa membayar, yang disebut

sebagai energi yang hilang. Seperti yang tertulis dalam Surat Keputusan

Menteri Keuangan Nomor : 431/KMK.06/2002, bahwa “Susut adalah sejumlah

energi yang hilang dalam proses pengaliran energi listrik mulai dari Gardu

Induk sampai dengan konsumen. Apabila tidak terdapat gardu induk, susut

dimulai dari gardu distribusi sampai dengan konsumen.” Susut sendiri

dibedakan menjadi dua susut yang disebabkan oleh masalah teknis atau non

teknis. Susut yang disebabkan oleh pencurian tenaga listrik adalah susut non

teknis. Dalam usaha mengurangi jumlah susut yang diakibatkan oleh pencurian

tenaga listrik, maka PLN mengambil langkah dengan menertibkan pengguna

atau pemakaian Tenaga Listrik melalui P2TL, singkatan dari Penertiban

Pemakaian Tenaga Listrik. Namun PT PLN masih mengalami sedikit kendala

dalam menjalannya program P2TL, yaitu saat melakukan perhitungan ternyata

hasil perhitungan kurang valid. Sehingga sering terjadi kesalahan perkiraan. Penelitian ini akan membantu program P2TL dalam memprediksi obyek sasaran pencurian penggunaan tenaga listrik dengan lebih tepat dengan

mengunakan metode klasifikasi algoritma Naive Bayes. Pada penelitian

sebelumnya algoritma Naive Bayes juga digunakan memprediksi besarnya

penggunaan listrik rumah tangga [1]. Metode Bayes juga dinilai berpotensi

baik dalam mengklasifikasi dokumen dibandingkan metode pengklasifikasian

yang lain dalam hal akurasi dan efisiensi komputasi [2]

3

II. Tinjauan Pustaka

“Pengunaan listrik harus seimbang persediaan listrik. Oleh karena itu

setiap rumah tangga haruslah paham penggunaan listrik yang efektif.

Penerapan metode naïve bayes diharapkan mampu untuk memprediksi

besarnya penggunaan listrik tiap rumah tangga agar lebih mudah mengatur

penggunaan listrik dari 60 data penggunaan listrik rumah tangga yang diuji

dengan metode naïve bayes, maka diperoleh hasil persentase 78,3333% untuk

keakuratan prediksi, di mana dari 60 data penggunaan listrik rumah tangga

yang diuji terdapat 47 data penggunaan listrik rumah tangga yang berhasil

diklasifikasikan dengan benar.” [1]

“Permasalahan pencurian listrik adalah permasalahan yang kompleks

karena penyebab maupun modusnya beragam. Untuk mengamati mekanisme

terjadinya pencurian listrik, menguji kebijakan penanganan pencurian listrik

yang ada saat ini, serta mengetahui kebijakan yang baik untuk mengurangi

angka pencurian listrik ini, maka dibangunlah model berbasis agen untuk

mensimulasikan pola pencurian listrik ini. Mekanisme pengambilan keputusan

agen disini menggunakan permainan norma dari Axelrod (1986) dan learning

proses masing-masing agen diadaptasi dari teori lokus control (Rotter, 1966)

dimana agen dibedakan menjadi lokus kontrol internal dan lokus kontrol

eksternal. Hasil simulasi yang dijalankan menunjukkan bahwa kebijakan

penanganan pencurian listrik yang ada saat ini masih tidak dapat mengurangi

angka pencurian listrik. Dengan memberikan reward bagi pelapor kegiatan

pencurian listrik, jumlah pencurian listrik dapat dikurangi, namun pengurangan

tenaga yang hilang akibat kegiatan pencurian listrik tidak signifikan.” [3]

“Kondisi yang ada pada pelaksanaan P2TL adalah masalah kurangnya

optimalisasi pelaksanaan P2TL, dan cara mengoptimalisasikannya dengan

menggunakan metode kombinasi kualitatif dan kuantitatif. Pendekatan yang

digunakan melalui observasi. Hasil penelitian ini mencatat bahwa penghematan

kWh yang diperoleh pada bulan Januari-Maret sebesar 48.599 kWh atau sekitar

13% dari tabungan yang ditargetkan melalui pelaksanaan P2TL kWh, sehingga

disimpulkan bahwa kinerja P2TL belum optimal. Efek dari kWh yang

disimpan mampu menekan penyusutan pada bulan Januari sebesar 0,16% dan

pada bulan Maret sebesar 0,5%. Upaya yang harus dilakukan dalam rangka

optimalisasi pelaksanaan P2TL secara teknis adalah melalui Deteksi Dini

Pencurian.” [4]

Pada penelitian yang dilakukan oleh Alfa Saleh ditemukan cara

memprediksi besarnya penggunaan listrik rumah tangga menggunakan

algoritma Naive Bayes. Algoritma tersebut sudah tepat hanya saja data yang

digunakan dalam penilitian ini masih kurang banyak untuk mendapatkan hasil

yang lebih akurat. Cara tersebut juga dapat diaplikasikan dalam penelitian ini,

hanya saja penelitian ini tidak memprediksi besarnya penggunaan listrik rumah

tangga namun memprediksi adanya pencurian pemakaian tenaga listrik.

Sedangkan pada penelitian dari Devilla Sari, Utomo Sarjono Putro,Yos

Sunitiyoso, Pri Hermawan, dan Dhanan Sarwo Utomo memiliki tujuan yang

sama dengan penilitian ini yaitu untuk mengatasi pencurian listrik, namun pada

4

penelitian ini menggunakan aplikasi Norm Game dan Locus of Control.

Namun pada penelitian ini lebih kearah penanggulangan terjadinya pencurian

tenaga listrik tersebut. Menurut Irene Ega Novena Putri, ArkhanSubari

penertiban pemakaian tenaga listrik harus di optimalkan, berbanding lurus

dengan penelitian ini. Namun pada penelitian tersebut lebih tentang bagaimana

cara melakukan optimalisasi upaya peningkatan saving Kwh. Penelitian

tersebut sudah cukup baik karena masalah dapat diselesaikan hanya saja data –

data yang ada belum direkap dengan baik sehingga perhitungannya bisa lebih

efisien.

III. Metodologi Penelitian

Tahapan penelitian yang digunakan dalam Sistem Pendukung

Keputusan Pemilihan Mentor untuk kegiatan Mentoring pada Fakultas

Teknologi Informasi UKSW menggunakan Fuzzy Multi-Atribute Decision

Making-Simple Additive Weighting, ditunjukkan pada Gambar 1.

Tahapan Penelitian pada Gambar 1 dijelaskan sebagai berikut, tahap 1

adalah analisis masalah, pada tahap ini menganalisis dan mengamati

permasalahan yang berhubungan dengan faktor – faktor pencurian atau

pencurian penggunaan tenaga listrik. Sehingga dapat ditemukan rumusan

Analisis Masalah

Studi Literatur

Mengumpulkan Data

Analisa Data

Pengujian

Pengambilan Kesimpulan

Metodologi Penelitian

Gambar 1 Plot Atribut Tenaga dengan Label Hasil Periksa.

5

masalah dalam penelitian. Tahap 2 adalah mencari studi literatur, mempelajari

dan memperdalam tentang P2TL (Penertiban Pemakaian Tenaga Listrik) juga

tentang algoritma Naive Bayes. Studi literatur yang didapatkan bisa berupa

jurnal, buku, penelitian-penelitian terdahulu tentang P2TL atau tentang

algoritma Naive Bayes.

Tahap 3 adalah pengumpulan data , pada penelitian ini data – data yang

dikumpulkan atau yang akan digunakan adalah data – data masa lalu atau

berdasarkan kejadian sebelumnya. Data-data nya seperti nama pelanggan,

pemakaian kWh, atau jam pakai nya, hal-hal yang berhubungan dengan

penggunaan atau pemakain listrik sehingga nantinya kita bisa menentukan

variabel apa saja yang akan digunakan. Setelah data terkumpul, maka pada

tahap selanjutnya yaitu tahap ke-4 ada metodologi penelitian, pada tahap ini

dibahas tentang algoritma atau metode apa yang akan digunakan dalam

penilitian, di sini menggunakan algoritma Naive Bayes dalam menyelesaikan

masalah.

Tahap ke-5 akan dilakukan analisa data tersebut menggunakan

Algoritma Naive Bayes dengan Tools yang digunakan adalah tools R. Pada

tahap analisis data akan ditemukan hasil dari perhitungan menggunakan Naive

Bayes tersebut. Tahap 6 pengujian keakuratan hasil atau solusi dari analisa

data. Maka pada tahap ini dilakukan pengujian menggunakan data testing.

Dilakukan pengujian dengan tujuan mengetahui apakah penelitian yang telah

dilakukan berhasil, apakah tepat perhitungannya. Jika solusi atau hasil dari

analisa data sudah teruji akurat, maka sudah bisa diambil keputusan dari

penelitian ini, atau di ambil kesimpulannya. Tahap ke-7 ini adalah pengambilan

kesimpulan.

IV. Pembahasan dan Hasil Pengujian

Data yang telah didapat akan melewati proses penghapusan data yang

tidak konsisten. Data yang digunakan dalam penelitian ini memiliki beberapa

record yang tidak sesuai/ salah ketik. Data yang tidak konsisten tersebut

diubah/dilengkapi agar menjadi data yang konsisten. Saat data dimasukkan ke

dalam rapidminer, ternyata tidak ditemukan missing values sehingga tahap ini

dilewati.

Selanjutnya dilakukan proses penggabungan data dari beberapa sumber

yang menunjang. Data yang didapatkan untuk proses ini ada dua yaitu data jam

nyala penggunaan listrik dan data pembelian token listrik. Kedua data tersebut

digabungkan menjadi satu sehingga atributnya bisa saling melengkapi.

6

Tabel 1 Hasil Penggabungan Data Jam Nyala dan Data Pembelian Token

Row

No.

IDPEL HASIL

PERIKSA

DAYA KWH JAM

NYALA

KRITERIA

1 523013192979 SASARAN

OPERASI

240000 9600 40 > 6

2 523100542286 NORMAL 41500 4939 119 < 6

3 523020545413 SASARAN

OPERASI

345000 13368 39 > 6

4 523100327691 NORMAL 7700 1450 188 < 6

5 523030862410 NORMAL 1300 110 85 < 6

6 523030612427 NORMAL 1300 150 115 < 6

... ... ... ... ... ... ...

3000 523021863281 NORMAL 450 124 53 < 6

Pada tabel 1 menunjukkan hasil dari penggabungan dua data yaitu data

jam nyala penggunaan listrik dan data pembelian token. Sebelumnya, data jam

nyala tidak memiliki atribut pembelian token, begitu sebaliknya. Setelah

digabungkan, maka dalam satu tabel bisa memiliki atribut jam nyala dan

pembelian token. Sehingga semua atribut yang dibutuhkan bisa berada di satu

tabel yang sama.

Selanjutnya data diseleksi, mana yang digunakan dan tidak digunakan.

Namun pada data yang digunakan pada percobaan kali ini tidak memiliki

atribut yang tidak berpengaruh sehingga semua atribut digunakan. Jam nyala

adalah atribut tentang jam nyala listrik yang digunakan oleh pelanggan PLN

selama satu bulan, daya adalah besarnya daya yang digunakan, kWh adalah

besarnya energi yang digunakan, dan kriteria adalah atribut mengenai jarak

waktu berapa lama pembelian token yang dilakukan pelanggan PLN terakhir

kali. Semua itu adalah atribut yang diperlukan dalam proses.

Tabel 2 Data Jam Nyala yang Tadinya Numerik diubah Menjadi Nominal.

Row

No.

IDPEL HASIL

PERIKSA

CLUSTER DAYA KWH KRITERIA

1 523013192979 SASARAN

OPERASI

Cluster_0 450 171 <6

2 523100542286 NORMAL Cluster_0 450 158 <6

3 523020545413 SASARAN

OPERASI

Cluster_0 450 82 <6

4 523100327691 NORMAL Cluster_2 1300 241 <6

5 523030862410 NORMAL Cluster_0 900 136 <6

6 523030612427 NORMAL Cluster_0 555000 52208 <6

... ... ... ... ... ... ...

3000 523021863281 NORMAL Cluster_0 124 53 < 6

Tabel 2 merupakan data yang telah melalui tranformasi. Data numerik

yang ada diubah menjadi polinominal atau binominal agar mudah dalam

penghitungan Naive Bayes. Data jam nyala memiliki tipe data numerik yang

diubah dalam bentuk polinominal untuk mempermudah dalam perhitungan

algoritma Naive Bayes. Tranformasi dilakukan menggunakan metode

clustering. Clustering adalah metode pembagian data ke dalam kelompok

dengan objek yang serupa. Setiap kelompok atau cluster terdiri dari objek yang

7

serupa atau sejenis namun berbeda antara satu kelompok dengan kelompok

lainnya [13]. Dapat dilihat pada gambar tersebut bahwa atribut jam nyala

memiliki tipe data numerik, sedangkan attribute cluster adalah nilai dari atribut

jam nyala yang telah diubah tipe datanya menjadi polinominal.

Pengelompokkan data menggunakan nilai k = 3, yang artinya dibagi menjadi 3

cluster.

Setelah dilakukan beberapa tahapan di atas maka dihasilkan data

training seperti pada tabel 4 di bawah ini. Data training adalah data latihan

yang digunakan untuk melatih algoritma yang digunakan. Data training yang

digunakan adalah data pemakaian listrik 3000 pelanggan PT PLN Distribusi

Jawa Tengah dan D.I.Yogyakarta yang ada di Semarang.

Algoritma Naive Bayes merupakan pengklasifikasian dengan metode

probabilitas dan statistik yang dikemukakan Thomas Bayes, yaitu memprediksi

peluang di masa depan berdasarkan pengalaman di masa sebelumnya [7].

Algoritma ini merupakan salah satu algoritma dari metode klasifikasi. Jadi,

data masa lalu yang dimiliki akan digunakan sebagai tolak ukur dalam

menentukan hasil dari data di masa sekarang, atau data yang akan diuji. Pada

penelitian ini digunakan algoritma Naive Bayes karena Metode ini

memanfaatkan data training untuk menghasilkan probabilitas setiap kriteria

untuk class yang berbeda. Data penggunaan tenaga listrik berdasarkan jam

nyala dan pembelian token tersebut dijadikan sebagai data training yang bisa

menghasilkan probabilitas apakah pelanggan melakukan pencurian tenaga

listrik atau tidak. Berikut algoritma Naive Bayes :

Persamaan Metode Naive Bayes

Persamaan dari teorema Bayes adalah [8] :

P(𝐻|𝑋)= ( | ) ( )

( ) (1)

Di mana :

X : Data dengan class yang belum diketahui

H : Hipotesis data merupakan suatu class spesifik

P(H|X) : Probabilitas hipotesis H berdasar kondisi X (posteriori

probabilitas)

P(H) : Probabilitas hipotesis H (prior probabilitas)

P(X|H) : Probabilitas X berdasarkan kondisi pada hipotesis H

P(X) : Probabilitas X

Untuk menjelaskan metode Naive Bayes, perlu diketahui bahwa

proses klasifikasi memerlukan sejumlah petunjuk untuk menentukan

kelas apa yang cocok bagi sampel yang dianalisis tersebut. Karena itu,

metode Naive Bayes di atas disesuaikan sebagai berikut:

8

P(𝐶|𝐹1 … 𝐹𝑛) = ( ) ( | )

( ) (2)

Di mana :

C : Class

F1...Fn : Karakteristik petunjuk yang dibutuhkan untuk

melakukan klasifikasi

P(C|F1...Fn) : Probabilitas karakteristik tertentu pada kelas C.

P(C) : Probabilitas class (prior probabilitas)

P(F1...Fn|C) : Probabilitas karakteristik-karakteristik sampel pada

kelas C

P(F1...Fn) : Probabilitas karakteristik-karakteristik sampel secara

global.

Di mana Variabel C merepresentasikan kelas, sementara variabel

F1 ... Fn merepresentasikan karakteristik petunjuk yang dibutuhkan

untuk melakukan klasifikasi. Maka rumus tersebut menjelaskan bahwa

peluang masuknya sampel karakteristik tertentu dalam kelas C

(Posterior) adalah peluang munculnya kelas C (sebelum masuknya

sampel tersebut, seringkali disebut prior), dikali dengan peluang

kemunculan karakteristik-karakteristik sampel pada kelas C (disebut

juga likelihood), dibagi dengan peluang kemunculan karakteristik-

karakteristik sampel secara global (disebut juga evidence). Karena itu,

rumus di atas dapat pula ditulis secara sederhana sebagai berikut:

Posterior =

(3)

Nilai Evidence selalu tetap untuk setiap kelas pada satu sampel.

Nilai dari posterior tersebut nantinya akan dibandingkan dengan nilai-

nilai posterior kelas lainnya untuk menentukan kekelas apa suatu

sampel akan diklasifikasikan. Penjabaran lebih lanjut rumus Bayes

tersebut dilakukan dengan menjabarkan P(𝐶|𝐹1, … , 𝐹𝑛) menggunakan

aturan perkalian sebagai berikut:

P (𝐶|𝐹1, … , = 𝑃(𝐶)𝑃(𝐹1, … , 𝐹𝑛|𝐶)

= (𝐶)(𝐹1 |𝐶)𝑃(𝐹2, … , 𝐹𝑛|𝐶, 𝐹1)

= 𝑃(𝐶)𝑃(𝐹1 |𝐶)𝑃(𝐹2|𝐶, 𝐹1 )𝑃(𝐹3, … , 𝐹𝑛|𝐶, 𝐹1,𝐹2

= (𝐶)𝑃(𝐹1 |𝐶)𝑃(𝐹2 |𝐶, 𝐹1 )𝑃(𝐹3|𝐶, 𝐹1,𝐹2)𝑃(𝐹4, … , 𝐹𝑛|𝐶, 𝐹1, 𝐹2,

𝐹3)

= 𝑃(𝐶)𝑃(𝐹1 |𝐶)𝑃(𝐹2 |𝐶, 𝐹1 )𝑃(𝐹3|𝐶, 𝐹1,𝐹2) … 𝑃(𝐹𝑛 |𝐶, 𝐹1, 𝐹2, 𝐹3, …

, 𝐹𝑛−1 ) (4)

Dapat dilihat bahwa hasil penjabaran tersebut menyebabkan

semakin banyak dan semakin kompleksnya faktor-faktor syarat yang

mempengaruhi nilai probabilitas, yang hampir mustahil untuk dianalisa

satu per satu. Akibatnya, perhitungan tersebut menjadi sulit untuk

9

dilakukan. Di sinilah digunakan asumsi independensi yang sangat tinggi

(naif), bahwa masing-masing petunjuk (F1,F2...Fn) saling bebas

(independen) satu sama lain. Dengan asumsi tersebut, maka berlaku

suatu kesamaan sebagai berikut:

P(𝐹𝑖 |𝐹𝑗) = ( )

( ) =

( ) ( )

( ) = (𝐹𝑖 ) (5)

Untuki≠j ,sehingga

P(𝐹𝑖 |𝐶, 𝐹𝑗) = 𝑃(𝐹𝑖 |𝐶) (6)

Persamaan di atas merupakan model dari teorema Naive Bayes

yang selanjutnya akan digunakan dalam proses klasifikasi. Untuk

klasifikasi dengan data kontinyu digunakan rumus Densitas Gauss :

P(𝑋𝑖 = 𝑥𝑖 |𝑌 = 𝑦𝑗)=

√ ( )

(7)

Di mana :

P : Peluang

Xi : Atribut ke i

xi : Nilai atribut ke i

Y : Kelas yang dicari

yi : Sub kelas Y yang dicari

µ : Mean, menyatakan rata-rata dari seluruh atribut

σ : Deviasi standar, menyatakan varian dari seluruh atribut.

Data training yang tadi telah diolah akan digunakan untuk melatih

algoritma Naive Bayes. Algoritma Naive Bayes dihubungkan dengan data

training. Setelah algoritma Naive Bayes dihubungkan dengan data training,

maka algoritma Naive Bayes akan merubah parameter pada dirinya untuk

menyesuaikan dengan data latihan. Selanjutnya dihubungkan dengan Apply

Model untuk menerapkan model tersebut.

Setelah model diterapkan maka akan diuji lagi, namun sebelum

melakukan pengujian, dapat dilihat plot hubungan antar atribut dengan label

hasil periksa terlebih dahulu seperti pada gambar berikut ini :

10

Gambar 2 menunjukkan plot antara atribut jam nyala dengan label hasil

periksa. Berdasarkan gambar tersebut dapat disimpulkan bahwa pemakaian jam

nyala dengan nilai yang rendah bisa diklasifikasikan menjadi sasaran operasi.

Pengguna yang masuk ke dalam klasifikasi normal adalah pelanggan PLN

dengan jam nyala sedang. Sedangkan pelanggan dengan jam nyala yang sangat

tinggi diklasifikasikan ke dalam penyimpangan.

Gambar 3 menunjukkan plot atribut tenaga dengan label hasil periksa.

Berdasarkan data yang ada, pelangan PLN yang masuk klasifikasi normal bisa

siapa saja pelanggan dengan tenaga berapapun. Sama halnya dengan klasifikasi

sasaran operasi. Sedangkan pada data tersebut klasifikasi penyimpangan

ditemukan pada pelanggan dengan tenaga 450, 1300, 3500, 4400, 16500,

19700, 345000.

Gambar 2 Plot Atribut Jam Nyala dengan Label Hasil Periksa.

Gambar 3 Plot Atribut Tenaga dengan Label Hasil Periksa.

11

Gambar 4 menunjukkan plot atribut kWh dengan label hasil periksa.

Berdasarkan data yang ada, dapat dilihat bahwa atribut kWh tidak terlalu

memiliki pengaruh yang besar dalam menentukan klasifikasi sasaran operasi,

normal atau penyimpangan karena pada gambar ditunjukkan rata – rata plot

yang sama diantara ketiganya.

Gambar 5 menunjukkan plot atribut kriteria dengan label hasil periksa.

Atribut kriteria ini menjelaskan selang waktu pelanggan membeli token listrik

yang dibagi menjadi dua bagian yaitu kurang dari enam bulan dan lebih dari

enam bulan. Bedasarkan data training yang ada, pelanggan yang masuk

klasifikasi sasaran operasi adalah pelanggan yang dengan kriteria lebih dari

enam bulan. Sedangkan yang masuk klasifikasi penyimpangan adalah

pelanggan dengan kriteria kurang dari enam bulan. Klasifikasi normal bisa

dimungkinkan untuk pelanggan dengan kriteria lebih ataupun kurang dari enam

bulan.

Gambar 4 Plot Atribut kWh dengan Label Hasil Periksa.

Gambar 5 Plot Atribut Kriteria dengan Label Hasil Periksa.

12

Tabel 3 Data Testing yang digunakan Dalam Proses.

Row

No.

NAMA ALAMAT TENAGA KWH JAM

NYALA

KRITERIA

1 SO IM DS

SEKOPEK/SARI

REJO

450 171 380 <6

2 NGATNO JL TM

BOROBUDUR

RMR RT 8 RW 9

MANYARAN

450 158 351 <6

3 PIATUN DS

TUNGGULSRI

BRANGS

450 82 182 <6

4 KARNO JL WR

SUPRATMAN 15

RT 5

GISIKDRONO

1300 241 185 <6

5 MUSLIKHAH

BT BASRI

GG .MASJID

RT.4/2 REJ

900 136 151 <6

6 IBIS

BUDGET

HOTEL

JL PIERE

TENDEAN 21

SEMARANG

555000 52208 94 <6

7 MDA

MIFTAHUL

ATHFAL

DS PIDODO

WETAN PTB

1300 113 87 <6

8 EDY

MUDJIANTO

DS ROWOSARI

METESEH RT 05

RW 5 BOJA

11000 952 87 <6

... ... ... ... ... ... ...

21 YATNO

HADI

PU RWOSARI 6

RT7 RK1

450 342 760 <6

Pengujian algoritma dengan menggunakan data testing. Data testing

pada tabel 3 dimasukkan ke dalam proses dengan menggunakan data training

dan algoritma Naive Bayes. Setelah proses dijalankan maka hasilnya seperti

tabel di bawah ini.

13

Tabel 4 Hasil Pengujian.

N

o

Prediction

(Hasil

Periksa)

Confiden

ce

(Sasaran

Operasi)

Confiden

ce

(Normal

Confiden

ce

(Penyim

pangan)

Nama Alamat Ten

aga

kW

h

Jam

Nya

la

Kriteria

1 Normal 0 0,791 0,209 SO IM DS

SEKOPE

K/SARI

REJO

450 171 380 <6

2 Normal 0 0,890 0,110 NGATNO JL TM

BOROB

UDUR

RMR RT

8 RW 9

MANYA

RAN

450 158 351 <6

3 Normal 0 0,998 0,002 PIATUN DS

TUNGG

ULSRI

BRANG

S

450 82 182 <6

4 Normal 0 1,000 0 KARNO JL WR

SUPRAT

MAN 15

RT 5

GISIKD

RONO

130

0

241 185 <6

5 Normal 0 1,000 0 MUSLIKH

AH BT

BASRI

GG

.MASJID

RT.4/2

REJ

900 136 151 <6

... ... ... ... ... ... ... ... ... ... ...

21 Penyimpan

gan

0 0 1,000 YATNO

HADI

PU

RWOSA

RI 6 RT7

RK1

450 342 760 <6

Jadi implementasinya adalah dari 21 data testing yang ada, dihasilkan

klasifikasi sebagai berikut, ada 3 pelanggan yang masuk ke dalam klasifikasi

sasaran operasi, 2 pelanggan masuk ke dalam klasifikasi penyimpangan, dan 16

pelanggan masuk ke dalam klasifikasi normal.

V. Simpulan

Berdasarkan hasil pengujian dengan algoritma Naive Bayes terhadap

data penggunaan listrik pelanggan PLN Semarang, maka dapat diambil

beberapa kesimpulan sebagai berikut : (1) Algoritma Naive Bayes dapat

menyelesaikan masalah yang ada yaitu mengklasifikasi pencurian yang

dilakukan pelanggan PLN, apakah masuk ke dalam klasifikasi sasaran operasi,

14

normal atau penyimpangan; (2) Algoritma klasifikasi Naive Bayes adalah

algoritma yang tepat dalam implementasi proses pencarian pencurian

pelanggan PLN.

Berdasarkan pengujian yang telah dilakukan memang sudah mencapai

tujuan namun masih ada kekurangan. Kekurangan dapat dikembangkan pada

penelitian lain. Ada saran yang mungkin dilakukan untuk penelitian lain

menggunakan atribut yang lebih detail jika ada, menggunakan data lebih dari

3000 data sehingga hasilnya bisa lebih akurat lagi, bisa menggabungkan dua

algoritma atau lebih.

VI. Daftar Pustaka

[1]. Saleh, A.,2015, Implementasi Metode Klasifikasi Naive Bayes Dalam

Memprediksi Besarnya Penggunaan Listrik Rumah Tangga, Citec

Journal, Vol.2 No.3, pp 207-217.

[2]. Ting, S. L., Ip, W. H.,& Tsang, A. H.C., 2011, Is Naive Bayes a Good

Classifier for Document Classification?, International Journal of

Software Engineering and Its Applications, Vol. 5, No. 3, Hal 37-46.

[3]. Sari, Devilla, dkk, 2010, Aplikasi Norm Game dan Locus of Control

untuk Pengembangan Kebijakan Penanggulangan Pencurian Listrik,

Jurnal Manajemen Teknologi, Vol. 9 No.1.

[4]. Putri, I.E.N,& Arkhan, S.,2015,Optimasi Pelaksanaan Penertiban

Pemakaian Tenaga Listrik (P2TL) Sebagai Upaya Peningkatan Saving

KWH dan Penekanan Susut Non Teknis di PT.PLN (Persero) Rayon

Semarang Selatan, Jurnal Gema Teknologi, Vol. 18 No.2 Periode

Oktober 2014 – April 2015.

[5]. Taruna R., S.,& Hiranwal, S., 2013, Enhanced Naive Bayes Algorithm

for Intrusion Detection in Data Mining, International Journal of

Computer Science and Information Technologies, Vol.6, No. 4, Hal

960-962.

[6]. Ridwan, M., dkk, 2013, Penerapan Data Mining untuk Evaluasi

Kinerja Akademik Mahasiswa Menggunakan Algoritma Naive Bayes

Classifier, Jurnal EECCIS, Vol 1, No. 7, Hal. 59-64

15

[7]. Bustami, 2014, Penerapan Algoritma Naive Bayes untuk

Mengklasifikasi Data Nasabah Asuransi, Jurnal Informatika,Vol.8

No.1, pp. 884-898.

[8]. Bustami, 2013, Penerapan Algoritma Naive Bayes Untuk

Mengklasifikasi Data Nasabah Asuransi, TECHSI : Jurnal Penelitian

Teknik Informatika, Vol. 3, No.2, Hal. 127-146.

[9]. Verma, A.,& Ashwani K., 2014, Performance Enhancement of

KMeans Clustering Algorithms for High Dimensional Data Sets,

International Journal of Advanced Research in Computer Science and

Software Engineering, Vol.4, Issue 1, January 2014.