perbandingan penerapan datamining dalam penilaian...
TRANSCRIPT
PERBANDINGAN PENERAPAN DATAMINING DALAM
PENILAIAN KINERJA KARYAWAN PADA PERUSAHAAN
(Studi kasus pada 3 perusahaan)
Riza Adrianti Supono
PROGRAM STUDI MAGISTER MANAJEMEN SISTEM INFORMASI
UNIVERSITAS GUNADARMA JAKARTA
2020
Abstrak
Perusahaan yang sehat memiliki manajemen sumber daya yang baik di dalamnya. Terlebih lagi pada sumber daya manusia yang membantu berjalan lancarnya dari tingkat manajerial hingga tingkat operasional. Sumber daya manusia yang baik pula perlu dibentuk pula pembentukan daya saing untuk meningkatkan kinerja dari sumber daya tersebut. Batasan masalah dalam makalah ini yaitu bagaiaman implementasi data mining pada perusahaan perusahaan terkait penilaian kinerja karyawan dengan menggunakan 3 metode.
Penerapan data mining untuk melakukan penilaian kinerja karyawan pada
perusahaan. Dengan menetapkan pola klasifikasi yang tepat dan mudah digunakan, naive bayes C4.5 dan neural network dapat digunakan untuk mendapatkan informasi dari hasil klasifikasi penilaian karyawan. rata rata dari hasil beberapa penilitian yang menggunakan naive bayes memiliki akurasi diatas 93%. Hanya saja ketika membandingkan ketiga algoritma tersebut diketahui bahwa algoritma C4.5 memiliki nilai accuracy dan AUC paling tinggi. Dengan demikian algoritma C4.5 merupakan algoritma terbaik dan dapat memberikan pemecahan dalam permasalahan penilaian karyawan
DAFTAR ISI
HALAMAN JUDUL i
ABSTRAK ii
DAFTAR ISI iii
1. PENDAHULUAN 1
1.1. Latar Belakang ………………………………………………………................. 1
1.2. Rumusan Masalah …………………………………………………………........... 2
1.3. Batasan Masalah ………………………………………………………................ 2
1.4. Tujuan Penelitian ..……………………………………………............................. 2
2. TINJAUAN PUSTAKA ……………………………………………………………. 3
2.1. Data Mining ...............................………………………………………………….. 3
2.2. KLASIFIKASI PENETAPAN STATUS KARYAWAN DENGAN MENGGUNAKAN
Metode Naive Bayes .......................................................................................…………..
4
2.3. PENERAPAN ALGORITMA C4.5, NAÏVE BAYES DAN NEURAL NETWORK
UNTUK MEMENUHI PENILAIAN DATA KARYAWAN SERVICE LEVEL
Agreement di Bank ...................................……………………………………………
5
2.4. Algoritma Naive Bayes untuk Evaluasi Kinerja Karyawan pada PT. Pelita
Wira Sejahtera ..............................................................................................................................
6
3. PEMBAHASAN DAN HASIL .......................................................................................... 10
3.1. KLASIFIKASI PENETAPAN STATUS KARYAWAN DENGAN MENGGUNAKAN
Metode Naive Bayes .......................................................................................…………..
10
3.2. PENERAPAN ALGORITMA C4.5, NAÏVE BAYES DAN NEURAL NETWORK
UNTUK MEMENUHI PENILAIAN DATA KARYAWAN SERVICE LEVEL
Agreement di Bank ...................................……………………………………………
11
3.3. Algoritma Naive Bayes untuk Evaluasi Kinerja Karyawan pada PT. Pelita
Wira Sejahtera ..............................................................................................................................
13
4. PENUTUP 15
4.1. Kesimpulan ........... .......................................................................................………….. 15
4.2. Saran .......................................................…………………………………………… 15
DAFTAR PUSTAKA
1
BAB 1. PENDAHULUAN 1.1. Latar Belakang
Perusahaan yang sehat memiliki manajemen sumber daya yang baik di
dalamnya. Terlebih lagi pada sumber daya manusia yang membantu berjalan
lancarnya dari tingkat manajerial hingga tingkat operasional. Sumber daya manusia
yang baik pula perlu dibentuk pula pembentukan daya saing untuk meningkatkan
kinerja dari sumber daya tersebut.
Pada masa pandemik seperti sekarang ini, banyak perusahaan yang melakukan
pemutusan hubungan kerja (PHK) maupun merumahkan karyawannya untuk
menstabilkan kondisi perusahaan. Menurut Soetjipto (2001), dalam suatu
organisasi seringkali terjadi PHK, tidak cuma karyawan biasa, manajer pun banyak
yang menjadi korban. Dengan jumlah individu yang semakin sedikit, seorang atasan
kini rela untuk tidak memiliki bawahan sebanyak dulu. Pengurangan karyawan
seperti itu terkadang tidak diketahui atas dasar apa menentukan karyawan yang
akan dilakukan PHK/dirumahkan.
Selain melakukan pengurangan karyawan, perusahaan terkadang melakukan
pengangkatan karyawan kontrak atau tetap dalam jangka waktu satu tahun sekali.
Bagian SDM melakukan penilaian terhadap hal tersebut. Penilaian dilakukan untuk
menjaring karyawan yang berkompeten. Bagian SDM mengalami beberapa kendala
dalam proses penilaian penetapan status dalam segi teknis ataupun efektifitas.
Karena penilaian dinilai secara manual oleh kepala bidang. Pada proses ini
memakan waktu lama dan keputusannya sering dinilai secara subyektif.
Untuk menghindari adanya subjektifitas dalam penilaian kinerja karyawan dan
untuk mendapatkan penilaian yang kompeten maka dari beberapa penelitian
sebelumnya mencoba menerapkan datamining tepatnya menggunakan metode
klasifikasi Naive Bayes pada penilaian karyawan. Penerapan algoritma
pengklasifikasi Naïve Bayes dapat mengurangi data noise pada dataset berukuran
besar dan memiliki banyak kelas atau multi kelas sehingga akurasi klasifikasi
algoritma decision tree dapat meningkat (Khadafy & Wahono, 2015). Klasifikasi ini
merupakan klasifikasi penetapan status karyawan agar dapat mengembangkan
keputusan yang baik dan tidak subyektif lagi dalam penetapannya.
2
1.2. Rumusan masalah
Berdasarkan latar belakang permasalahan dan disesuaikan dengan pembahasan
makalah, maka dirumuskan masalah sebagai berikut:
Apa pengertian data mining?
Bagaimana penerapan metode yang digunakan dalam penilaian kinerja
pada suatu perusahaan?
1.3. Batasan Masalah
Batasan masalah dalam makalah ini yaitu bagaiaman implementasi data mining
pada perusahaan perusahaan terkait penilaian kinerja karyawan dengan
menggunakan metode klasifikasi Naive Bayes yang merujuk pada beberapa jurnal
yang berjudul Klasifikasi Penetapan Status Karyawan dengan Menggunakan Metode
Naïve Bayes, Kajian Penerapan Algoritma C4.5, Naïve Baye dan Neural Network untuk
Memenuhi Penilaian Data Karyawan Service Level Agreement di Bank, Analisis dan
Penerapan Algoritma Naive Bayes untuk Evaluasi Kinerja Karyawan pada PT. Pelita
Wira Sejahtera dan Penerapan Data Mining untuk Menentukan klasifikasi Kinerja
Pegawai pada Sistem Informasi Kepegawaian.
1.4. Tujuan penelitian
Tujuan pembahasan dalam makalah ini adalah untuk mengetahui implementasi
klasifikasi Naive Bayes yang digunakan pada perusahaan dalam penilaian kinerja
karyawan pada perusahaan.
3
BAB 2. TINJAUAN PUSTAKA 2.1. Data Mining
Data Mining merupakan kegiatan yang meliputi pengumpulan, pemakaian
data historis untuk menemukan keteraturan, pola atau hubungan dalam set data
berukuran besar. Keluaran dari data mining ini bisa dipakai untuk memperbaiki
pengambilan keputusan di masa depan Terdapat beberapa istilah lain yang memiliki
makna sama dengan data mining, yaitu Knowledge discovery in databases (KDD),
ekstraksi pengetahuan (knowledge extraction), Analisa data/pola (data/pattern
analysis), kecerdasan bisnis (business intelligence) dan data archaeology dan data
dredging (Larose, 2005).
Dalam menerapkan metode analisa data mining, terdapat beberapa tahapan
pada KDD seperti berikut :
Gambar 1 Tahapan pada KDD dalam Meotde Analisa Data Mining
1. Data Selection,
Pemilihan (seleksi) data dari sekumpulan data operasional perlu
dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data
hasil seleksi yang akan digunakan untuk proses data mining, disimpan
dalam suatu berkas, terpisah dari basis data operasional.
2. Preprocessing/Cleaning,
Sebelum proses data mining dapat dilaksanakan, perlu dilakukan
proses cleaning pada data yang menjadi fokus KDD. Proses cleaning
mencakup antara lain membuang duplikasi data, memeriksa data yang
inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan
4
cetak.
3. Transformation,
Coding adalah proses transformasi pada data yang telah dipilih,
sehingga data tersebut sesuai untuk proses data mining. Proses coding
dalam KDD merupakan proses kreatif dan sangat tergantung pada
sejenis atau pola informasi yang akan dicari dalam basis data.
4. Data Mining,
Data mining adalah proses mencari pola atau informasi menarik dalam
data terpilih dengan menggunakan teknik atau metode tertentu.
Teknik, metode, atau algoritma dalam data mining sangat bervariasi.
Pemilihan metode atau algoritma yang tepat sangat bergantung pada
tujuan dan proses KDD secara keseluruhan.
5. Evaluation,
Pola informasi yang dihasilkan dari proses data mining perlu
ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang
berkepentingan. Tahap ini merupakan bagian dari proses KDD yang
disebut interpretation. Tahap ini mencakup pemeriksaan apakah pola
atau informasi yang ditemukan bertentangan dengan fakta atau
hipotesis yang ada sebelumnya.
2.2. Klasifikasi Penetapan Status Karyawan dengan Menggunakan Metode
Naïve Bayes
Salah satu asset yang berharga dalam sebuah perusahaan adalah sumber daya
manusia (SDM). Karyawan adalah SDM tersebut. Karyawan menjadi peran penting.
Dalam perusahaan besar pasti mempunyai banyak karyawan. Di dalam perusahaan
terdapat tiga jenis karyawan yaitu, outsourcing, karyawan kontrak dan karyawan
tetap. Untuk mendapatkan karyawan tetap dilakukan proses penyariangan melaui
penilaian yang dilakukan oleh bagian SDM. Dalam proses tersebut mengalami
kendala dalam segi teknis dan efektifias karena penilaian manual dan kadang
keputusannya dinilai secara subyektif. Oleh karena itu dilakukan penilitian untuk
klasifikasi penetapan status karyawan dengan metode Naïve Bayes dan Rapidminer.
Dalam proses metodologi penelitian, Penelitian ini dilakukan dengan beberapa
langkah :
5
1. Identifikasi Masalah yaitu menentukan pola klasifikasi penetapan
status karyawan untuk mengembangkan keputusan dalam
penentapannya.
2. Pengumpulan Data yang didapat dari perusahaan pada tahun 2016.
Yaitu data untuk penetapan status karyawan.
3. Pengolahan data manual menggunakan metode Naïve Bayes Langkah
selanjutnya adalah pengolahan data menggunakan metode Naïve
Bayes. Langkah ini melakukan perhitungan manual dengan
menggunakan rumus Naïve Bayes dari data yang telah didapat
sebelumnya.
4. Pengolahan data menggunakan rapid miner dimana data yang didapat
dimasukan kedalam aplikasi rapid miner dan di proses dengan operasi
Naïve Bayes.
5. Kesimpulan yang nantinya akan dijelaskan setelah mendapatkan hasil
dari pengolahan data bak manual dan juga penggunaan rapid miner.
2.3. Penerapan Algoritma C4.5, Naïve Bayes dan Neural Network untuk
Memenuhi Penilaian Data Karyawan Service Level Agreement di Bank
Dunia Ekonomi dan Bisnis yang semakin kompetitif mendorong setiap
Organization Level berpacu dengan waktu dalam memenuhi kebutuhan pelanggan
(Customer Needs). Dalam bahasa Management kita kenal dengan istilah Service
Level Standard dan dalam beberapa Aspek atau Kriteria juga disebut Service Level
Agreement. Bank merupakan salah satu urat jantung perekonomian sebuah negara,
tanpa Bank, bisa kita bayangkan bagaimana kita sulitnya menyimpan dan
mengirimkan uang, memperoleh tambahan modal usaha atau melakukan transaksi
perdagangan Internasional secara efektif dan aman. Suatu Bank akan dapat
memberikan pelayanan yang baik/prima, apabila Bank tersebut memiliki standar
layanan yang baik. Maka standar layanan harus dapat dilaksanakan dengan baik dan
konsisten, maka dari itu diperlukan suatu alat yang dapat mendefinisikan dan
memonitor layanan unit kerja dalam masalah pelayanan permasalahan. Dengan
diimplementasikannya modul ini, setiap karyawan dapat melakukan kegiatannya
akan selalu berorientasi kepada peningkatan layanan sehingga dapat memenuhi
SLA/KPI-nya, karena dengan demikian akan mempengaruhi kinerja di unit kerja.
6
Penilaian Kinerja dilakukan dengan menggunakan Form yang telah ditetapkan dan
diimplementasi melalui system komputerisasi secara terpusat.dalam database.
Salah satu media yang dapat digunakan untuk mendefinisikan dan memonitor
layanan adalah dengan adanya Service Level Agreement (SLA). SLA merupakan
sistem yang dirancang untuk mengukur penilaian karyawan berdasarkan kinerja.
Salah satu input yang digunakan dalam SLA adalah Penerapan KPI (Key
Performance Indicators) yang diperoleh dari penerapan SLA berupa standar
acuan, yang merupakan kesepakatan antara pihak yang membutuhkan pelayanan
yang spesifik dan penyedia layanan yang bertanggung jawab untuk memberikan
layanan tersebut. Dengan adanya SLA, penyedia layanan akan berkomitmen untuk
memberikan layanan terbaik untuk mendukung kebutuhan bisnis nasabah.
Dalam penelitian ini, peneliti mengumpulkan materi-materi kepustakaan yang
berhubungan dengan pengambilan judul untuk studi penelitiannya, dilanjutkan
survey langsung ke tempat penelitian Tata Usaha Fakultas Teknik Matematika dan
Ilmu Pengetahuan Alam serta BAAK Universitas Indraprasta PGRI. Terdapat
permasalahan di setiap bulan, triwulan dan semesternya dengan jumlah nilai
karyawan mengalami penurunan. Untuk dapat meningkatkan nilai karyawan pada
setiap periode, perlu diketahui permasalahan-permasalahan yang terjadi pada diri
karyawan terutama karyawan yang bermasalah dalam bekerja. Peneliti juga
melakukan analisis komparasi tiga algoritma klasifikasi data mining yaitu algoritma
C4.5, Neural Network, dan Naïve Bayes dengan menggunakan data dari hasil survei
yaitu dari data mahasiswa dan data lainnya yang dapat digunakan dan diolah ke
menggunakan metode data mining, yaitu pertama kali menggunakan aplikasi
microsoft office excel.
2.4. Algoritma Naive Bayes untuk Evaluasi Kinerja Karyawan pada PT. Pelita
Wira Sejahtera
PT. Pelita Wira Sejahtera yang bergerak dibidang kontraktor umum
Transportasi Darat, Penyewaan Minyak Mentah, Alat Berat & Penyewaan Kendaraan
Ringan yang dimana memiliki jumlah karyawan yang cukup banyak. Berdasarkan
hasil wawancara dengan supervisor IT, bahwa setiap tahunnya selalu melakukan
penilaian kinerja terhadap karyawan. Penilaian kinerja karyawan dilakukan dengan
7
cara, yaitu karyawan dinilai oleh kepala bagian dan atau kepala departemennya
masing- masing. Jika karyawan yang diberhentikan meningkat setiap tahunnya akan
mempengaruhi pekerjaan di setiap bidangnya. Proses yang berjalan memiliki
kekurangan yaitu: 1. Belum mengetahui grafik kinerja karyawan setiap tahunnya. 2.
Keterbatasan dalam mengontrol setiap karyawan yang bekerja. 3. Penilaian
terkadang dilakukan secara subjektif. Untuk menghindari adanya subjektifitas
dalam penilaian kinerja karyawan dan untuk mendapatkan penilaian yang
kompeten maka penulis mencoba menerapkan metode klasifikasi Naive Bayes.
Tahapan tahapan pada penelitian ini terdiri dari:
1. Studi Literatur dengan melakukan pencarian terhadap landasan-
landasan teori yang diperoleh dari berbagai sumber seperti buku,
jurnal ilmiah dan juga referensi lainnya.
2. Identifikasi Masalah yang dijadikan permasalahan data mining terkait
kinerja pada karyawan PT Pelita Wira Sejahtera dan menentukan data
apa saja yang dibutuhkan dalam penelitian ini.
3. Pengumpulan Data ini dilakukan dengan beberapa metode yaitu :
Pengamatan (Observasi) dengan mengamati bagaimana pengelolaan
data-data karyawan, sehingga penulis mendapatkan hardcopy data-
data karyawan. Data karyawan ini diberikan oleh asisten HRD
perusahaan tersebut. Adapun atribut data yang diperoleh yaitu jenis
kelamin, jabatan, pengetahuan tentang pekerjaan, kejujuran dan
integritas, inisiatif dan kreatif, kemampuan berkomunikasi, tanggung
jawab dan ketelitian, kemampuan bekerja sama, kemampuan
menganalisa, kemampuan koordinasi, orientasi pada tugas dan
koordinasi, orientasi pada efisiensi. Wawancara secara langsung
dengan asisten HRD untuk memperoleh data dan informasi akurat
mengenai data karyawan yang penulis lakukan.
4. Klasifikasi Penilaian Kinerja Karyawan dengan beberapa tahapan.
Adapun alur proses pengklasifikasian dapat dilihat pada gambar
8
Data Karyawan merupakan data-data yang dimiliki oleh karyawan
termasuk data penilaian kinerja karyawan pada tahun yang telah lalu.
Atribut data yang digunakan yaitu, masa mengabdi, jenis kelamin,
jabatan, pengetahuan tentang pekerjaan, kejujuran dan integritas,
inisiatif dan kreatif, kemampuan berkomunikasi, tanggung jawab dan
ketelitian, kemampuan bekerja sama, kemampuan menganalisa,
kemampuan koordinasi, orientasi pada tugas dan koordinasi, orientasi
pada efisiensi. Untuk Cleaning data, dilakukan pembersihan atau
pemisahan data dari noise data dan data yang tidak konsiten seperti
karyawan yang memiliki atribut tidak lengkap. Selain itu ada beberapa
hal yang penulis lakukan dalam proses cleaning data yaitu sebagai
berikut:
a. Mengklasifikasikan penilaian kinerja menjadi 4 kategori yaitu >=30
SANGAT BAIK, <=29 BAIK, <=19 CUKUP dan <=10 KURANG.
b. Kemudian hasil dari cleaning data ini disusun dalam bentuk format
arff pada tools Notepad++.
c. Format arff dengan menggunakan WEKA. AtributeRelation File
Format (ARFF) merupakan tipe file text yang berisi berbagai
instance data yang berhubungan dengan suatu set atribut datayang
kemudian disusun dengan menggunakan tanda koma (,) sebagai
pemisah data per- atributnya.
d. Training dengan menerapkan algoritma klasifikasi naïve bayes
untuk membentuk sebuah model classifier pada data karyawan
yang sudah ada Algoritma ini merupakam representasi
pengetahuan yang akan digunakan untuk prediksi kelas data baru
yang belum pernah ada
e. Naïve Bayes Klasifikasi dengan menggunakan tools WEKA untuk
melakukan klasifikasi terhadap data karyawan yang sudah ditesting
menggunakan model classifier yang sudah dibentuk.
f. Akurasi Hasil Akurasi Hasil menunjukkan kedekatan hasil
pengukuran dengan nilai sesungguhnya.
g. K-fold Cross Validation untuk menilai/memvalidasi keakuratan
sebuah model yang dibangun berdasarkan dataset tertentu. Salah
9
satu metode cross-validation yang populer adalah K-Fold Cross
Validation.
5. Hasil Analisis akan menguji keakuratan naïve bayes dengan
menggunakan teknik K-Fold Cross Validation. Dimana dataset dibagi
menjadi sejumlah K-buah partisi secara acak. Kemudian dilakukan
sejumlah K-kali eksperimen, dimana masing-masing eksperimen
menggunakan data partisi ke-K sebagai data testing dan memanfaatkan
sisa partisi lainnya sebagai data training. Hasil yang muncul dengan
nilai persentasi terbesarlah yang akan di ambil. Selain itu, bentuk
visualisasi dari setiap atribut dapat dilihat pada tools WEKA
10
BAB 3. PEMBAHASAN DAN HASIL
3.1. Klasifikasi Penetapan Status Karyawan dengan Menggunakan Metode
Naïve Bayes
Data yang digunakan ada 5 buah dan menggunakan 1 buah labelnya adalah
diangkat [ya | tidak]
1. Absensi [ bagus | cukup ]
2. Attitude [ baik | buruk ]
3. Psikotes [ tinggi | sedang | rendah ]
4. Wawancara [ baik | buruk ]
5. diangkat [ya | tidak]
Dari data yang telah ditentukan dilakukan rekap data dengan 2 percobaan
yaitu perhitungan manual dan menggunakan rapidminer. Pada perhitungan manual
menentukan atribut yang bernilai positif lalu dimasukan ke dalam rumus Naïve
Bayes sebagai berikut Perhitungannya adalah sebagai berikut :
𝑓𝑐1(𝐸) = 17 × 16 × 22 × 12 × 17 = 1220736 30 30 30 30
30
24300000
𝑓𝑐2(𝐸) = 13 × 16 × 22 × 12 × 17 = 933504 30 30 30 30
30
24300000
11
Setelah itu dimasukan ke dalam perhitungan probabilitas dimana c1 =0.567
dan c2 = 0.433 . Hasil yang didapatkan nilai c1 yang terbesar (ya diangkat) maka
yang dipilih adalah c1.
Pada proses penggunaan rapidminer tahapannya setelah memasukan data
dalam bentuk excel dalam rapidminer, menentukan design untuk melakukan proses,
melakukan oenarikan data dengan memilih modeling yaitu naive bayes dan proses
labelingnya, dilanjutkan menjalankan proses rapidminer. Rapidminer akan
menampilakn hasil berupa text view. Pada rapidminer dapat menampilkan grafik
berdasarkan atribut serta tabel distribution untuk hasilnya c1 =0.567 dan c2 = 0.433
dengan 5 distibution.
Dari kedua perhitungan manual dan yang dihasilkan rapidminer nilainya
sama. Karena nilai probalitas yang tertinggi adalah c1 atau diangkat karyawan. Maka
didapatkan pola untuk penetapan status karyawan diangkat adalah berdasarkan
atribut dan nilai, absensi: bagus, attitude: bagus, psikotes: tinggi dan wawancara :
baik.
3.2. Penerapan Algoritma C4.5, Naïve Bayes dan Neural Network untuk
Memenuhi Penilaian Data Karyawan Service Level Agreement di Bank
Hasil dari pengujian model yang telah dilakukan yaitu dengam algoritma
C4.5, Neural Network, dan Naïve Bayes, dilakukan pengujian tingkat akurasi dengan
menggunakan confussion matrix dan kurva ROC/AUC (Area Under Cover).
Confusion Matrix pada algoritma c4.5 diketahui data training terdiri dari 100
record data, 85 data diklasifikasikan baik dan 7 data diprediksi baik tetapi ternyata
Buruk, 5 data dinyatakan buruk tetapi baik, dan, 3 data secara benar diklasifikasikan
Buruk. Dan pada data testing terdiri dari 30 record data, 26 data diklasifikasikan
baik dan 5 data diprediksi baik tetapi ternyata Buruk, 2 data diprediksi buruk tapi
baik dan 1 diprediksi buruk.
Pada confusion matrix algoritma Neural Network. Diketahui data training
terdiri dari 100 record data, 84 data diklasifikasikan baik dan 8 data diprediksi baik
tetapi ternyata Buruk, 6 data diklasifikasikan buruk tetapi ternyata Baik dan 2 data
secara diklasifikasikan buruk. Dan pada data testing Diketahui dari 30 data testing,
26 diklasifikasikan baik, 4 data diprediksi baik tetapi ternyata Buruk, 2 data
diprediksi dengan buruk klasifikasi Baik, dan 2 data diprediksi Buruk.
12
Pada confusion matrix algoritma Naïve Bayes, diketahui data training terdiri
dari 100 record data, 119 data diklasifikasikan Baik dan 12 data diprediksi benar
tetapi ternyata Buruk, 6 data secara buruk diklasifikasikan Baik dan 3 data
diprediksi buruk. Dan pada data testing terdiri dari 30 record data, 26 data
diklasifikasikan baik dan 4 data diprediksi benar tetapi ternyata Buruk, 2 data
secara benar diklasifikasikan Baik dan 2 data diprediksi Buruk. confusion matrix
diatas, selanjutnya dilakukan perhitungan nilai accuracy, precision, dan recall.
Perbandingan nilai accuracy, precision, dan recall yang telah dihitung untuk
metode C4.5, naïve bayes, dan neural network. Sehingga didapatkan seperti tabel
berikut.
Hasil perhitungan divisualisasikan dengan kurva ROC (Receiver Operating
Characteristic) atau AUC (Area Under Curve). ROC memiliki tingkat nilai diagnosa
yaitu (Gorunescu, 2011): a. Akurasi bernilai 0.90 – 1.00 = excellent classification b.
Akurasi bernilai 0.80 – 0.90 = good classification, c. Akurasi bernilai 0.70 – 0.80 =
fair classification d. Akurasi bernilai 0.60 – 0.70 = poor classification e. Akurasi
bernilai 0.50 – 0.60 = failure Perbandingan hasil perhitungan nilai AUC untuk metode
C4.5, Neural Network, dan Naïve Bayes
tingkat akurasi menggunakan data training tertinggi adalah dengan algoritma C4.5
memiliki tingkat ROC paling tinggi, yaitu 0.772 dan pada testing algoritma C4.5
memiliki tingkat ROC yang paling tinggi, yaitu 0.859 termasuk dalam katagori good
classification. Berdasarkan kolom ROC pada tabel 16, pada data training algoritma
C4.5 memiliki tingkat ROC paling tinggi, yaitu 0.772 dan pada testing algoritma C4.5
memiliki tingkat ROC yang paling tinggi, yaitu 0.859 termasuk dalam katagori good
classification.
13
Dengan mengunakan perbandingan data training dengan data testing, yaitu
100 berbanding 30, maka perbandingan komparasinya untuk akurasi dapat dilihat
Algoritma C4.5 memiliki tingkat akurasi, sehingga bisa digunakan untuk klasifikasi
data karyawan yang bermasalah dalam penilaian dengan persentase 88.00%.
3.3. Algoritma Naive Bayes untuk Evaluasi Kinerja Karyawan pada PT. Pelita
Wira Sejahtera
Hasil wawancara dan observasi yang sudah dilakukan, peneliti memperoleh
data-data karyawan sebanyak 154. Lalu dilakukan cleaning data dengan hasil data-
data karyawan ini ada beberapa yang mengalami noise sehingga data yang dapat
digunakan adalah 149 data. Data karyawan masing- masing dibagi menjadi 4 kelas
yaitu sebanyak 24 kelas SANGAT BAIK, 102 kelas BAIK, 23 kelas CUKUP dan 0 kelas
KURANG. Atribut yang digunakan pada seluruh data karyawan yaitu, masa
mengabdi, jenis kelamin, jabatan, pengetahuan tentang pekerjaan, kejujuran dan
integritas, inisiatif dan kreatif, kemampuan berkomunikasi, tanggung jawab dan
ketelitian, kemampuan bekerja sama, kemampuan menganalisa, kemampuan
koordinasi, orientasi pada tugas dan koordinasi, orientasi pada efisiensi dan Kelas
Penilaian. data yang kemudian disusun sesuai kebutuhan dalam format excel,
Cleaning data merupakan preproses dimana pada tahap ini dilakukan pembersihan
atau pemisahan data dari noise data dan data yang tidak konsiten seperti karyawan
yang memiliki atribut tidak lengkap maka akan dihapus setelah itu data karyawan
disusun dalam format arff.
Klasifikasi menggunakan algoritma naive bayes, pada WEKA dilakukan
dengan 3 set yaitu menggunakan Use Data Training, 5-cross validation dan 10- cross
validation. Dari hasil menggunakan data training menunjukkan hasil 142 prediksi
benar dengan akurasi sebesar 95.302 % dan 7 prediksi salah dengan persentasi
4.698 % dengan waktu klasifikasi selama 0 detik. pada pengujian 5- cross validation
menunjukkan hasil 140 prediksi benar dengan akurasi sebesar 93.9597 % dan 9
prediksi salah dengan persentasi 6.0403 % dengan waktu klasifikasi selama 0 detik.
14
Sedangkan dalam pengujian menggunakan 10-cross validation menunjukkan hasil
140 prediksi benar dengan akurasi sebesar 93.9597 % dan 9 prediksi salah dengan
persentasi 6.0403 % dengan waktu klasifikasi selama 0 detik.
15
BAB 4. PENUTUP 4.1. Kesimpulan
Penerapan data mining untuk melakukan penilaian kinerja karyawan pada
perusahaan. Dengan menetapkan pola klasifikasi yang tepat dan mudah digunakan,
naive bayes C4.5 dan neural network dapat digunakan untuk mendapatkan
informasi dari hasil klasifikasi penilaian karyawan. rata rata dari hasil beberapa
penilitian yang menggunakan naive bayes memiliki akurasi diatas 93%. Hanya saja
ketika membandingkan ketiga algoritma tersebut diketahui bahwa algoritma C4.5
memiliki nilai accuracy dan AUC paling tinggi. Dengan demikian algoritma C4.5
merupakan algoritma terbaik dan dapat memberikan pemecahan dalam
permasalahan penilaian karyawan.
4.2. Saran
Hasil dari makalah ini diharapkan bisa digunakan pada pihak perusahaan,
untuk lebih meningkatkan akurasi analisa data karyawan yang bermasalah dalam
penilaian. penelitian ini kedepannya juga dapat menggunakan data karyawan lebih
banyak lagi serta mencakup atribut lainnya agar memiliki persentasi kurasi yang
lebih baik. Dan data ini diujikan menggunakan algoritma klasifikasi lainnya. Model
klasifikasi karyawan diharapkan dapat dijadikan pendukung pengambilan kebijakan
pihak manajemen untuk membantu mengurangi kesalahan pada pekerjaan.
16
DAFTAR PUSTAKA Ariani, Fattya, Amir, Nur Ala,, Khairul Rizal. 2018. Klasifikasi Penetapan Status
Karyawan Dengan Menggunakan Metode Naïve Bayes. Paradigma
Faisal, Achmad. 2017. Kajian Penerapan Algoritma C4.5, Naïve Baye Dan Neural
Network Untuk Memenuhi Penilaian Data Karyawan Service Level Agreement Di
Bank. Jakarta Selatan. Universitas Indraprasta PGRI
Firdaus, Rafly Dikhi. 2017. Penerapan Data Mining Untuk MenentukanKlasifikasi
Kinerja Pegawai Pada Sistem Informasi Kepegawaian. Tasikmalaya. Universitas
Siliwangi
Hernawati, Fajar Astuti. 2013 Data Mining” CV. Andi OFFSET.
Khadafy, A. R., & Wahono, R. S. (2015). Penerapan Naïve Bayes Untuk Mengurangi
Data Noise Pada Klasifikasi Multi Kelas Dengan Decision Tree. Journal of Intelligent
Systems, 1(2), 136–142.
Larose, Daniel T. 2005. Discovering Knowledge in Data : An Introduction to Data
Mining. John Willey & Sons, Inc.
Sari, Viny Novika , Lola Yorita Astri, Errissya Rasywir. 2020. Analisis dan Penerapan
Algoritma Naive Bayes untuk Evaluasi Kinerja Karyawan pada PT. Pelita Wira
Sejahtera. Jambi. STIKOM Dinamika Bangsa