jurnal - analisa dan penerapan metode c4.5 untuk prediksi loyalitas pelanggan

10
Jurnal Ilmiah Fakultas Teknik LIMITS Vol. 10 No.1 ISSN 0216 - 1184 ANALISA DAN PENERAPAN METODE C4.5 UNTUK PREDIKSI LOYALITAS PELANGGAN Teguh Budi Santoso Jurusan Teknik Informatika, Fakultas Teknik Universitas Satya Negara Indonesia Jl. Arteri Pondok Indah No. 11 Jakarta 12240 Email: [email protected] ABSTRAK Menurut Asosiasi Telekomunikasi Seluler Indonesia (ATSI) pada akhir tahun 2011 meningkat pesat menjadi 240 juta pengguna telekomunikasi. Berbagai cara dilakukan oleh masing-masing provider untuk memenangkan persaingan, antara lain yakni dengan mempertahankan loyalitas pelanggan. Penelitian ini bertujuan membentuk model klasifikasi pohon keputusan untuk memprediksi loyalitas pelanggan dan melihat variable yang paling berpengaruh. Obyek dalam penelitian ini adalah pelanggan. Data yang digunakan adalah data primer dari penyebaran kuisioner berupa pertanyaan. Pembentukan model prediksi menggunakan metode C4.5. pada algoritma C4.5 dilakukan perhitungan entropy dan information gain dimana atribut loyalitas pelanggan sebagai atribut tujuan, sedangkan harga, pelayanan, promosi, citra perusahaan, dan kepercayaan sebagai atribut sumber untuk memperoleh node akar dan node lainnya. Berdasarkan Hasil klasifikasi menggunkan algoritma C4.5 menunjukkan bahwa diperoleh akurasi mencapai 97.5%, yang menunjukkan bahwa algoritma C4.5 cocok digunakan untuk mengukur tinggkat loyalitas pelanggan data seluler. Kata kunci: Loyalitas pelanggan, klasifikasi, decision tree, algoritma C4.5, ABSTRACT According to the Indonesian Cellular Telecommunications Association (ATSI) at the end of 2011 increased rapidly to 240 million telecom users. Various methods are used by each provider to win the competition, among others, namely by maintaining customer loyalty. This study aims to establish a decision tree classification models to predict customer loyalty and see the most influential variables. Objects in this study is the customer. The data used is primary data from questionnaires in the form of a question. Predictive modeling using C4.5. C4.5 algorithm calculating entropy and information gain customer loyalty which attributes as destination attributes, while the price, service, promotion, corporate image, and confidence as a source attribute to obtain the root node and other nodes. By using our algorithm C4.5 classification results indicate that the obtained accuracy reaches 97.5%, which shows that C4.5 algorithm suitable for measuring customer loyalty tinggkat mobile data. Keywords: Customer loyalty, classification, decision tree, C4.5 algorithm, 1. PENDAHULUAN Pada akhir tahun 2010, jumlah pengguna seluler di Indonesia adalah 180 juta dan menurut Asosiasi Telekomunikasi Seluler Indonesia (ATSI) pada akhir tahun 2011 meningkat pesat menjadi 240 juta pengguna, atau tumbuh 33%. Bila dirasio secara persentase pengguna seluler indonesia terhadap jumlah penduduk pada tahun 2010 yang berjumlah 258 juta, maka didapat angka 70%. Artinya dari 10 jiwa, 7 di antaranya adalah pengguna seluler. Sementara dari 240 juta pengguna seluler, 95% di antaranya adalah pelanggan kartu prabayar. Memperhatikan data statistik di atas, bisa disimpulkan peluang bisnis seluler sangat terbuka lebar dan memikat hati para pelaku bisnis. [1] Era telepon selular, khususnya Global System for Mobile communications (GSM), memang baru marak dalam beberapa tahun belakangan ini. Dari segi teknologi dan merek serta jenis, ponsel

Upload: rama-doank

Post on 20-Nov-2015

80 views

Category:

Documents


19 download

DESCRIPTION

Jurnal Data Mining Mengunakan Algoritma C4.5

TRANSCRIPT

  • Jurnal Ilmiah Fakultas Teknik LIMITS Vol. 10 No.1 ISSN 0216 - 1184 ANALISA DAN PENERAPAN METODE C4.5 UNTUK PREDIKSI LOYALITAS PELANGGAN

    Teguh Budi Santoso Jurusan Teknik Informatika, Fakultas Teknik

    Universitas Satya Negara Indonesia Jl. Arteri Pondok Indah No. 11 Jakarta 12240

    Email: [email protected]

    ABSTRAK Menurut Asosiasi Telekomunikasi Seluler Indonesia (ATSI) pada akhir tahun 2011 meningkat pesat menjadi 240 juta pengguna telekomunikasi. Berbagai cara dilakukan oleh masing-masing provider untuk memenangkan persaingan, antara lain yakni dengan mempertahankan loyalitas pelanggan. Penelitian ini bertujuan membentuk model klasifikasi pohon keputusan untuk memprediksi loyalitas pelanggan dan melihat variable yang paling berpengaruh. Obyek dalam penelitian ini adalah pelanggan. Data yang digunakan adalah data primer dari penyebaran kuisioner berupa pertanyaan. Pembentukan model prediksi menggunakan metode C4.5. pada algoritma C4.5 dilakukan perhitungan entropy dan information gain dimana atribut loyalitas pelanggan sebagai atribut tujuan, sedangkan harga, pelayanan, promosi, citra perusahaan, dan kepercayaan sebagai atribut sumber untuk memperoleh node akar dan node lainnya. Berdasarkan Hasil klasifikasi menggunkan algoritma C4.5 menunjukkan bahwa diperoleh akurasi mencapai 97.5%, yang menunjukkan bahwa algoritma C4.5 cocok digunakan untuk mengukur tinggkat loyalitas pelanggan data seluler. Kata kunci: Loyalitas pelanggan, klasifikasi, decision tree, algoritma C4.5,

    ABSTRACT

    According to the Indonesian Cellular Telecommunications Association (ATSI) at the end of 2011 increased rapidly to 240 million telecom users. Various methods are used by each provider to win the competition, among others, namely by maintaining customer loyalty. This study aims to establish a decision tree classification models to predict customer loyalty and see the most influential variables. Objects in this study is the customer. The data used is primary data from questionnaires in the form of a question. Predictive modeling using C4.5. C4.5 algorithm calculating entropy and information gain customer loyalty which attributes as destination attributes, while the price, service, promotion, corporate image, and confidence as a source attribute to obtain the root node and other nodes. By using our algorithm C4.5 classification results indicate that the obtained accuracy reaches 97.5%, which shows that C4.5 algorithm suitable for measuring customer loyalty tinggkat mobile data. Keywords: Customer loyalty, classification, decision tree, C4.5 algorithm, 1. PENDAHULUAN

    Pada akhir tahun 2010, jumlah pengguna seluler di Indonesia adalah 180 juta dan menurut Asosiasi Telekomunikasi Seluler Indonesia (ATSI) pada akhir tahun 2011 meningkat pesat menjadi 240 juta pengguna, atau tumbuh 33%. Bila dirasio secara persentase pengguna seluler indonesia terhadap jumlah penduduk pada tahun 2010 yang berjumlah 258 juta, maka didapat angka 70%. Artinya dari 10 jiwa, 7 di antaranya adalah pengguna seluler. Sementara dari 240 juta pengguna seluler, 95% di antaranya adalah pelanggan kartu prabayar. Memperhatikan data statistik di atas, bisa disimpulkan peluang bisnis seluler sangat terbuka lebar dan memikat hati para pelaku bisnis. [1] Era telepon selular, khususnya Global System for Mobile communications (GSM), memang baru marak dalam beberapa tahun belakangan ini. Dari segi teknologi dan merek serta jenis, ponsel

    mailto:[email protected]

  • Jurnal Ilmiah Fakultas Teknik LIMITS Vol. 10 No.1 ISSN 0216 - 1184 yang beredar di Indonesia sama sekali tidak ketinggalan dari Negara lain. Performance sebuah ponsel sangat tergantung pada kecepatan mengatasi masalah after sales service yang sangat diharapkan oleh pelanggan. Terdapat banyak operator selular di Indonesia membuat persaingan dibisnis ini menjadi semakin tinggi maka mengakibatkan pelanggan memiliki banyak pilihan untuh memilih operator sellular yang memberikan pelayanan yang terbaik dengan harga dan promosi penjulan untuk menarik minat mereka. Dengan banyaknya operator celluler yang bermunculan maka membuat persaingan diantara operator sellular semakin tinggi. Oleh sebab itu diperlukan strategi pemasaran yang tepat untuk dapat mempertahankan pelanggan agar mampu bertahan dibisnis ini. Salah satu strategi pemasaran yang tepat untuk bertahan dari persaingan tinggi dalam dunia usaha operator sellular saat ini adalah dengan mempertahankan loyalitas pelanggannya. [2] Ada enam alasan mengapa suatu institusi perlu mempertahankan loyalitas pelanggannya. Pertama: pelanggan yang ada lebih prospektif, artinya pelanggan yang loyal akan memberikan keuntungan yang besar kepada institusi. Kedua: biaya mendapatkan pelanggan yang baru jauh lebih besar dibandingkan menjaga dan mempertahankan pelanggan yang sudah ada. Ketiga: pelanggan yang sudah percaya pada institusi dalam suatu urusan akan percaya dalam urusan yang lain. Keempat: biaya operasi institusi akan menjadi efisien jika memiliki banyak pelanggan yang loyal. Kelima: institusi dapat mengurangkan biaya psikologis dan sosial dikarenakan pelanggan yang lama telah mempunyai banyak pengalaman positif dengan institusi. Keenam: pelanggan yang loyal akan selalu membela institusi bahkan berusaha pula untuk menarik dan memberi saran kepada orang lain untuk menjadi pelanggan. Kepedulian terhadap konsumen merupakan hal yang penting. [3] menciptakan hubungan yang kuat dan erat dengan pelanggan adalah mimpi semua pemasar dan hal ini sering menjadi kunci keberhasilan pemasaran jangka panjang. Loyalitas terjadi apabila pelanggan merasa puas dengan merek atau kualitas pelayanan yang diterimanya dan berniat untuk terus melanjutkan hubungannya dengan perusahaan tersebut. [4] Tingkat kepuasan customer sendiri tergantung pada kualitas pelayanan yang ditawarkan oleh perusahaan. Bila kinerja jauh lebih rendah ketimbang harapan, customer tidak puas, jika kinerja sesuai harapan, maka customer puas, bila kinerja melebihi harapan, maka customer merasa amat puas. customer yang merasa amat puas dan customer yang merasa puas akan tetap loyal dan mereka akan memberikan informasi kepada orang lain mengenai pengalaman baik dengan kinerja yang dirasakan. [5] mengatakan pelanggan adalah tujuan dari apa yang kita lakukan dan bukannya mereka tergantung pada kami, kami sangat tergantung pada mereka. Itulah alasan utama mengapa organisasi saat ini berfokus pada loyalitas pelanggan.

    Beberapa tahun terakhir banyak metode yang digunakan untuk klasifikasi data. Penelitian yang dilakukan oleh [6] menggunakan metode klasifikasi Decision Tree Techniques, C4.5 Decision Tree Classifier untuk memprediksi kinerja karyawan. Dalam penelitian ini, hasil analisis, C4.5 classifier memiliki potensi besar untuk prediksi kinerja. Peraturan klasifikasi yang dihasilkan dapat digunakan untuk memprediksi kinerja karyawan dengan tingkat hasil akurasi sebesar 77%, Penelitian yang dilakukan [7] data mining dengan algoritma C4.5. Rules yang dihasilkan ada 11 rules serta tingkat akurasi yang dicapai 79.41%

    Dalam penelitian ini penulis menerapkan algoritma C45 untuk menganilisa loyalitas pelanggan .Variabel yang digunakan berdasarkan harga, sikap dalam melayani konsumen.

    2. DATA MINING Data mining [8] adalah suatu proses menemukan hubungan yang berarti, pola, dan kecenderungan dengan memeriksa dalam sekumpulan besar data yang tersimpan dalam penyimpanan dengan menggunakan teknik pengenalan pola seperti teknik statistik dan matematika.

    Beberapa solusi yang bisa diselesaikan dengan data mining [9] diantaranya: a) Menembak target pasar

    Data mining dapat melakukan pengelompokan (clustering) dari model-model pembeli dan melakukan klasifikasi terhadap setiap pembeli sesuai dengan karakteristik yang diinginkan seperti kesukaan yang sama, tingkat penghasilan yang sama, kebiasaan membeli dan karakteristik lainnya.

    b) Melihat pola beli pemakai dari waktu ke waktu Data mining dapat digunakan untuk melihat pola beli seseorang dari waktu ke waktu. Sebagai contoh, ketika seseorang menikah bisa saja dia kemudian memutuskan pindah dari single account ke joint account (rekening bersama) dan kemudian setelah itu pola beli-nya berbeda dengan ketika dia masih bujangan.

    c) Cross-Market Analysis dapat memanfaatkan data mining untuk melihat hubungan antara penjualan satu produk dengan produk lainnya.

    d) Profil Customer Data mining dapat membantu untuk melihat profil customer/pembeli/nasabah sehingga kita dapat mengetahui kelompok customer tertentu suka membeli produk apa saja.

  • Jurnal Ilmiah Fakultas Teknik LIMITS Vol. 10 No.1 ISSN 0216 - 1184

    2.1 Data Sampling Adapun eksperimen yang akan dilakukan yaitu dengan data primer yang diambil pada bulan Oktober sampai dengan November 2013 yang dapat dilihat pada table 3.2

    Tabel 3.2 hasil quesioner

    No Atribut Jumlah Kasus Ya Tidak

    Total 40 23 17

    1 Usia

    Tua 17 11 6

    Muda 23 12 11

    2 Pelayanan

    Ramah 19 19 0

    Kurang ramah 12 4 8

    Tidak ramah 9 0 9

    3 Promosi

    Gratis nelpon 13 7 6

    Gratis SMS 12 8 4

    Gratis Internet 15 8 7

    4 Harga

    Murah 20 20 0

    Mahal 20 3 17

    5 Citra Perusahaan

    Memiliki Citra Positif 13 9 4

    Inovatif dan Berwawasan luas 13 5 8

    Berpengalaman Dan stabil 14 9 4

    6 Kepercayaan

    Mengutamakan kepentingan konsumen 24 17 7

    jaringan yang luas 16 6 10

    2.2 Evaluasi Dan Validasi Evaluasi dan validasi hasil dalam penelitian ini adalah hasil klasifikasi pada data training berdasarkan waktu proses yang dibutuhkan, tingkat akurasi, serta jumlah data yang diklasifikasikan ke dalam kelas YA/TIDAK. Untuk mengetahui evaluasi dari kinerja model klasifikasi didasarkan pada banyaknya (count) dataset record yang diprediksi secara benar dan tidak benar pada model klasifikasi tersebut. Count ini ditabulasikan dalam sebuah hasil yang dikenal sebagai confusion matrix. Setelah didapatkannya sejumlah atribut maka tahap selanjutnya adalah proses pemilihan atribut. Pemilihan ini dilakukan untuk mendapatkan atribut-atribut dengan nilai yang relevan. Berikut ini penjelasan tentang tiap-tiap atribut: a. Usia

  • Jurnal Ilmiah Fakultas Teknik LIMITS Vol. 10 No.1 ISSN 0216 - 1184 Merupakan atribut yang berisi usia responden yang dikelompokkan dalam dua kategori yaitu Muda, dan tua.

    b. Pelayanan Merupakan atribut sikap pelayanan yang diberikan oleh call center yang dikelompokkan dalam 3 kategori yaitu ramah, kurang ramah, tidak ramah.

    c. Promosi Merupakan atribut promosi yang dikelompokkan dalam 3 kategori yaitu gratis sms, gratis internet, dan gratis nelpon.

    d. Harga Merupakan atribut harga yang diberikan atribut ini dikelompokan dalam 2 kategori yaitu murah, dan mahal.

    e. Citra perusahaan Merupakan atribut citra perusahaan yang dikelompokkan dalam 3 kategori yaitu memiliki citra positif, inovatif dan berwawasan luas, Berpengalaman dan stabil.

    f. Kepercayaan Merupakan atribut kepercayaan konsumen terhadap operator tersebut yang dikelompokkan dalam 2 kategori yaitu mengutamakan kepentingan konsumen, dan jaringan yang luas.

    Dalam penelitian ini eksperimen dan pengujian dilakukan dengan langkah-langkah sebagai berikut:

    a. Entropy dan Information Gain Tahap pertama yang dilakukan adalah menghitung nilai entropy dan information gain dapat dilihat pada tabel 1 dibawah ini:

    Table 1 Table Nilai Entropy dan Gain seluruh atribut

    Node Atribut Jumlah Kasus Ya Tidak

    Entropy Gain

    Total 40 23 17

    Usia

    0.0474

    Tua 17 11 6 Muda 23 12 11 1

    Pelayanan

    Ramah 19 19 0 Kurang ramah 12 4 8 Tidak ramah 9 0 9

    Promosi

    Gratis nelpon 13 7 6 Gratis SMS 12 8 4 Gratis Internet 15 8 7

    Harga

    Murah 20 20 0 Mahal 20 3 17

    Citra Perusahaan -

    Memiliki Citra Positif 13 9 4

    1.7601

    Inovatif dan 13 5 8 0.9612

  • Jurnal Ilmiah Fakultas Teknik LIMITS Vol. 10 No.1 ISSN 0216 - 1184 Berwawasan luas

    Berpengalaman Dan stabil 14 9 4

    0.8765

    Kepercayaan

    Mengutamakan kepentingan konsumen 24 17 7

    0.8709

    jaringan yang luas 16 6 10

    0.9544

    Untuk menghitung nilai entropy dan information gain digunakan rumus sebagai berikut: | || |

    Pada tabel 4.1 diatas atribut loyalitas = ya dikatakan sebagai sampel positif (+), dan atribut loyalitas = tidak dikatakan sebagai sampel negative (-) dari sampel data pada tabel 4.1, didapatkan: Values(Usia) = Tua, Muda [ ] | | [ ] [ ] [ ] [ ] Selanjutnya nilai-nilai entropy untuk S, , , untuk Usia adalah:

    Dan seterusnya

    Maka pohon keputusan akhir dapat dilihat pada gambar 1:

  • Jurnal Ilmiah Fakultas Teknik LIMITS Vol. 10 No.1 ISSN 0216 - 1184

    Gambar 1 Pohon Keputusan Akhir

    Dengan memperhatikan pohon keputusan pada gambar 1 diketahui bahwa semua kasus sudah masuk dalam

    kelas dengan demikian pohon keputusan pada gambar merupakan pohon keputusan terakhir yang terbentuk.Setelah pohon terbentuk, dihasilkan sejumlah aturan dalam pohon tersebut. Contoh aturan yang dapat terbentuk dari pohon pada gambar 1 adalah sebagai berikut:

    JIKA pelayanan = ramah MAKA class = YA JIKA pelayanan = tidak ramah MAKA class = TIDAK JIKA pelayanan = kurang ramah DAN harga = mahal MAKA class = TIDAK JIKA pelayanan = kurang ramah DAN harga = murah DAN citra perusahaan berpengalaman MAKA class = YA JIKA pelayanan = kurang ramah DAN harga = murah DAN citra perusahaan = inovatif DAN kepercayaan = mengutamakan konsumen MAKA class = YA JIKA pelayanan = kurang ramah DAN harga = murah DAN citra perusahaan = citra positif MAKA class = Tidak

    Hasil klasifikasi pada data sampel atribut pelayanan sebagai root pada decision tree, sedangkan atribut lainnya sebagai child node. Dari data sampel dengan 40 record dihasilkan jumlah aturan yang terbentuk sebanyak 6 aturan.

    Tahap selanjutnya yang akan dikerjakan adalah proses pengolahan data dari hasil yang diperoleh dari konsep algoritma C4.5. Sebelum diproses dengan WEKA data dipecah menjadi 2 bagian, yaitu pertama sebagai data training sebanyak 75% data testing sebanyak 35% hal ini dilakukan supaya dapat terbentuk suatu model dengan menggunakan data training, selanjutnya data yang terbentuk dengan menggunakan data training akan diujikan kembali menggunakan data testing.

    Hasil klasifikasi data training sebanyak 65% dengan menggunakan WEKA 3.7.7 dapat dilihat pada gambar dibawah ini:

    Gambar 2 Hasil klasifikasi data training menggunakan WEKA

    Pada saat menggunakan data training dengan menggunakan WEKA 3.7.7 waktu yang dibutuhkan untuk menguji model pada training ini adalah 0.02 second dalam mengklasifikasikan diaplikasi weka 3.7.7. dari confusion matrix

  • Jurnal Ilmiah Fakultas Teknik LIMITS Vol. 10 No.1 ISSN 0216 - 1184 dapat dilihat ada 13 rekords data diklasifikasikan sebagai class YA, 10 rekords data yang diklasifikasikan sebagai class TIDAK dan 2 record diklasifikasikan kedalam class yang tidak sesuai yaitu data diduga sebagai class YA ternyata adalah class TIDAK

    Gambar 3 Hasil akurasi detail oleh Class Training

    Tingkat positif benar (TP) Rate adalah proporsi contoh yang diklasifikasikan sebagai kelas x, diantara semua contoh yang benar-benar memiliki kelas x yang bernilai sama dengan recall. Untuk mencari nilai TP rate pada class YA adalah: Untuk mencari nilai FN sama pada class Tidak adalah Tingkat positif salah (FP) rate adalah proporsi yang diklasifikasikan sebagai kelas x, tetapi masuk kedalam kelas yang berbeda diantara semua contoh yang bukan dari kelas x. Untuk mencari nilai FP sama pada class Ya adalah: Untuk mencari nilai FN sama pada class Tidak adalah: Untuk mencari precision class YA: Untuk mencari precision class tidak: Proses selanjutnya yaitu klasifikasi menggunakan data testing sebanyak 35% dengan menggunakan weka. Hasil klasifikasi menggunakan data testing pada gambar dibawah ini:

    Gambar 4 Hasil klasifikasi data testing menggunakan WEKA Pada saat menggunakan data tes dengan menggunakan WEKA 3.7.7 waktu yang dibutuhkan untuk menguji model pada training ini adalah 0 second dalam mengklasifikasikan diaplikasi weka 3.7.7.dari confusion matrix dapat dilihat ada 8 rekords data diklasifikasikan sebagai class YA, 6 rekords data yang diklasifikasikan sebagai class TIDAK dan

  • Jurnal Ilmiah Fakultas Teknik LIMITS Vol. 10 No.1 ISSN 0216 - 1184 1 record diklasifikasikan kedalam class yang tidak sesuai yaitu data diduga sebagai class YA ternyata adalah class TIDAK

    Gambar 5 Hasil akurasi detail oleh Class Training

    Tingkat positif benar (TP) Rate adalah proporsi contoh yang diklasifikasikan sebagai kelas x, diantara semua contoh yang benar-benar memiliki kelas x yang bernilai sama dengan recall. Untuk mencari nilai TP rate pada class YA adalah: Untuk mencari nilai FN sama pada class Tidak adalah Tingkat positif salah (FP) rate adalah proporsi yang diklasifikasikan sebagai kelas x, tetapi masuk kedalam kelas yang berbeda diantara semua contoh yang bukan dari kelas x. Untuk mencari nilai FP sama pada class Ya adalah: Untuk mencari nilai FN sama pada class Tidak adalah: Untuk mencari precision class YA: Untuk mencari precision class tidak F-measure yang merupakan ukuran gabungan dari precision dan recal.proses perhitungannya adalah Untuk mencari F-Measure classYa: Untuk mencari F-measure class TIDAK: = 0.909 Tahap selanjutnya mengukur evaluasi untuk mengetahui evaluasi dari kinerja model klasifikasi. Pada weka classifier hasil klasifikasi yang diperoleh akan disertakan dengan beberapa alat ukur sebagai bukti terjadinya hasil proses pada klasifikasi tersebut yang telah tersedia didalamnya, salah satu alat ukur tersebut adalah confusion matrix. Berikut ini adalah hasil kesimpulan confusion matrik yang terdaat pada aplikasi WEKA dari hasil yang diperoleh dari data training

    \

  • Jurnal Ilmiah Fakultas Teknik LIMITS Vol. 10 No.1 ISSN 0216 - 1184 Gambar 6 Hasil confusion matrix data training

    Dari informasi tersebut, kemudian akan dilakukan proses perhitungan rata-rata persentasiakurasi keberhasilan dan error rate pada confusion matrix data training sebagai berikut: Persentase Akurasi = 0.975 x 100% = 97.5 % Persentase Error= 0.025 x 100%= 2.5% Proses selanjutnya adalah hasil kesimpulan confusion matrix yang terdapat pada aplikasi WEKA dari hasil yang diperoleh menggunakan data penjualan barang yang diambil merupakan data testing.

    Gambar 7 Hasil confusion matrix data testing

    Persentase Akurasi = 0.933 x 100% = 93.3 % Persentase Error rate= 0.06 x 100%= 6.6% Dari hasil rata-rata data training dan testing dapat dilihat pada tabel 4.4 dibawah ini:

    Tabel 2 Hasil akurasi dan error rate

    Dataset Akurasi (%) Error Rate (%) Data training 97.5 % 2.5% Data testing 93.3 % 6.6% Dari tabel diatas dapat dilihat nilai akurasi serta error rate data training serta data testing, dimana data

    training memiliki nilai akurasi yang lebih tinggi daripada data testing.dengan menggunakan algoritma C4.5 nilai akurasi dari data training dan data testing lebih dari 90% hingga mencapai 97,5%. Hal ini menunjukkan bahwa algoritma C4.5 dapat digunakan pada dataset pelanggan.

    3. KESIMPULAN

    Berdasarkan analisa penggunaan data minning dengan algoritma C4.5 dapat digunkan pada data set pelanggan kedalam kegiatan manajemen strategi sehingga dapat menahan selama mungkin pelanggannya dengan baik,aplikasi algoritma C4.5 ini hendaknya di masukkan kedalam personal computer yang ada sehingga dapat mengurangi kemungkinan pelanggan untuk berpindah operator atau untuk mempertahankan loyalitas pelanggannya.

  • Jurnal Ilmiah Fakultas Teknik LIMITS Vol. 10 No.1 ISSN 0216 - 1184 4. REFERENSI

    [1] Rahadian, s. s. (2006). Analisis Pengaruh Loyalitas Pelanggan Dan Prilaku Mencari Variasi

    Terhadap Perpindahan Merek (studi kasus pada pengguna kartu prabayar mentari dikota semarang). Semarang: Universitas Diponegoro.

    [2] Ikhsan, m. R. (2011). Pegaruh Kualitas Pelayanan Dan Promosi Penjualan Terhadap Loyalitas Pelanggan Indra Celllular Kudus. Semarang.

    [3] Kotler, p. (2001). Marketing Manajemen.Australia [4] Hermanto, a. w. (2008). Analisa Tingkat Kepuasan Konsumen Terhadap Penjualan Susu Kedelai.

    semarang. [5] Triswandari, U. (2011). Analisis Pengaruh Kualitas Pelayanan Jasa Terhadap Kepuasan Pelanggan

    Pada PT.PLN (PERSERO) Rayon Makasar Timur. Makasar. [6] Hamdan, A. R., & othman, Z. A. (2010). Human Talent Prediction in HRM using Classification

    Algorithm. selangor, malaysia. [7] Mandasari, V., & Tama, B. A. (2011). Analisis Kepuasan Konsumen Terhadap Restoran Cepat

    Saji Melalui Pendekatan Data Mining. [8] Larose, D. T. (2005). Discovering knowledge in data. [9] Han, J., & Kamber, M. (2001). Data Mining:Concepts and Technique. sanfransisco.