perbandingan penerapan datamining dalam penilaian...

20
PERBANDINGAN PENERAPAN DATAMINING DALAM PENILAIAN KINERJA KARYAWAN PADA PERUSAHAAN (Studi kasus pada 3 perusahaan) Riza Adrianti Supono PROGRAM STUDI MAGISTER MANAJEMEN SISTEM INFORMASI UNIVERSITAS GUNADARMA JAKARTA 2020

Upload: others

Post on 03-Nov-2020

8 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: PERBANDINGAN PENERAPAN DATAMINING DALAM PENILAIAN …adrianti.staff.gunadarma.ac.id/Publications/files/... · data-data karyawan, sehingga penulis mendapatkan hardcopy data-data karyawan

PERBANDINGAN PENERAPAN DATAMINING DALAM

PENILAIAN KINERJA KARYAWAN PADA PERUSAHAAN

(Studi kasus pada 3 perusahaan)

Riza Adrianti Supono

PROGRAM STUDI MAGISTER MANAJEMEN SISTEM INFORMASI

UNIVERSITAS GUNADARMA JAKARTA

2020

Page 2: PERBANDINGAN PENERAPAN DATAMINING DALAM PENILAIAN …adrianti.staff.gunadarma.ac.id/Publications/files/... · data-data karyawan, sehingga penulis mendapatkan hardcopy data-data karyawan

Abstrak

Perusahaan yang sehat memiliki manajemen sumber daya yang baik di dalamnya. Terlebih lagi pada sumber daya manusia yang membantu berjalan lancarnya dari tingkat manajerial hingga tingkat operasional. Sumber daya manusia yang baik pula perlu dibentuk pula pembentukan daya saing untuk meningkatkan kinerja dari sumber daya tersebut. Batasan masalah dalam makalah ini yaitu bagaiaman implementasi data mining pada perusahaan perusahaan terkait penilaian kinerja karyawan dengan menggunakan 3 metode.

Penerapan data mining untuk melakukan penilaian kinerja karyawan pada

perusahaan. Dengan menetapkan pola klasifikasi yang tepat dan mudah digunakan, naive bayes C4.5 dan neural network dapat digunakan untuk mendapatkan informasi dari hasil klasifikasi penilaian karyawan. rata rata dari hasil beberapa penilitian yang menggunakan naive bayes memiliki akurasi diatas 93%. Hanya saja ketika membandingkan ketiga algoritma tersebut diketahui bahwa algoritma C4.5 memiliki nilai accuracy dan AUC paling tinggi. Dengan demikian algoritma C4.5 merupakan algoritma terbaik dan dapat memberikan pemecahan dalam permasalahan penilaian karyawan

Page 3: PERBANDINGAN PENERAPAN DATAMINING DALAM PENILAIAN …adrianti.staff.gunadarma.ac.id/Publications/files/... · data-data karyawan, sehingga penulis mendapatkan hardcopy data-data karyawan

DAFTAR ISI

HALAMAN JUDUL i

ABSTRAK ii

DAFTAR ISI iii

1. PENDAHULUAN 1

1.1. Latar Belakang ………………………………………………………................. 1

1.2. Rumusan Masalah …………………………………………………………........... 2

1.3. Batasan Masalah ………………………………………………………................ 2

1.4. Tujuan Penelitian ..……………………………………………............................. 2

2. TINJAUAN PUSTAKA ……………………………………………………………. 3

2.1. Data Mining ...............................………………………………………………….. 3

2.2. KLASIFIKASI PENETAPAN STATUS KARYAWAN DENGAN MENGGUNAKAN

Metode Naive Bayes .......................................................................................…………..

4

2.3. PENERAPAN ALGORITMA C4.5, NAÏVE BAYES DAN NEURAL NETWORK

UNTUK MEMENUHI PENILAIAN DATA KARYAWAN SERVICE LEVEL

Agreement di Bank ...................................……………………………………………

5

2.4. Algoritma Naive Bayes untuk Evaluasi Kinerja Karyawan pada PT. Pelita

Wira Sejahtera ..............................................................................................................................

6

3. PEMBAHASAN DAN HASIL .......................................................................................... 10

3.1. KLASIFIKASI PENETAPAN STATUS KARYAWAN DENGAN MENGGUNAKAN

Metode Naive Bayes .......................................................................................…………..

10

3.2. PENERAPAN ALGORITMA C4.5, NAÏVE BAYES DAN NEURAL NETWORK

UNTUK MEMENUHI PENILAIAN DATA KARYAWAN SERVICE LEVEL

Agreement di Bank ...................................……………………………………………

11

3.3. Algoritma Naive Bayes untuk Evaluasi Kinerja Karyawan pada PT. Pelita

Wira Sejahtera ..............................................................................................................................

13

Page 4: PERBANDINGAN PENERAPAN DATAMINING DALAM PENILAIAN …adrianti.staff.gunadarma.ac.id/Publications/files/... · data-data karyawan, sehingga penulis mendapatkan hardcopy data-data karyawan

4. PENUTUP 15

4.1. Kesimpulan ........... .......................................................................................………….. 15

4.2. Saran .......................................................…………………………………………… 15

DAFTAR PUSTAKA

Page 5: PERBANDINGAN PENERAPAN DATAMINING DALAM PENILAIAN …adrianti.staff.gunadarma.ac.id/Publications/files/... · data-data karyawan, sehingga penulis mendapatkan hardcopy data-data karyawan

1

BAB 1. PENDAHULUAN 1.1. Latar Belakang

Perusahaan yang sehat memiliki manajemen sumber daya yang baik di

dalamnya. Terlebih lagi pada sumber daya manusia yang membantu berjalan

lancarnya dari tingkat manajerial hingga tingkat operasional. Sumber daya manusia

yang baik pula perlu dibentuk pula pembentukan daya saing untuk meningkatkan

kinerja dari sumber daya tersebut.

Pada masa pandemik seperti sekarang ini, banyak perusahaan yang melakukan

pemutusan hubungan kerja (PHK) maupun merumahkan karyawannya untuk

menstabilkan kondisi perusahaan. Menurut Soetjipto (2001), dalam suatu

organisasi seringkali terjadi PHK, tidak cuma karyawan biasa, manajer pun banyak

yang menjadi korban. Dengan jumlah individu yang semakin sedikit, seorang atasan

kini rela untuk tidak memiliki bawahan sebanyak dulu. Pengurangan karyawan

seperti itu terkadang tidak diketahui atas dasar apa menentukan karyawan yang

akan dilakukan PHK/dirumahkan.

Selain melakukan pengurangan karyawan, perusahaan terkadang melakukan

pengangkatan karyawan kontrak atau tetap dalam jangka waktu satu tahun sekali.

Bagian SDM melakukan penilaian terhadap hal tersebut. Penilaian dilakukan untuk

menjaring karyawan yang berkompeten. Bagian SDM mengalami beberapa kendala

dalam proses penilaian penetapan status dalam segi teknis ataupun efektifitas.

Karena penilaian dinilai secara manual oleh kepala bidang. Pada proses ini

memakan waktu lama dan keputusannya sering dinilai secara subyektif.

Untuk menghindari adanya subjektifitas dalam penilaian kinerja karyawan dan

untuk mendapatkan penilaian yang kompeten maka dari beberapa penelitian

sebelumnya mencoba menerapkan datamining tepatnya menggunakan metode

klasifikasi Naive Bayes pada penilaian karyawan. Penerapan algoritma

pengklasifikasi Naïve Bayes dapat mengurangi data noise pada dataset berukuran

besar dan memiliki banyak kelas atau multi kelas sehingga akurasi klasifikasi

algoritma decision tree dapat meningkat (Khadafy & Wahono, 2015). Klasifikasi ini

merupakan klasifikasi penetapan status karyawan agar dapat mengembangkan

keputusan yang baik dan tidak subyektif lagi dalam penetapannya.

Page 6: PERBANDINGAN PENERAPAN DATAMINING DALAM PENILAIAN …adrianti.staff.gunadarma.ac.id/Publications/files/... · data-data karyawan, sehingga penulis mendapatkan hardcopy data-data karyawan

2

1.2. Rumusan masalah

Berdasarkan latar belakang permasalahan dan disesuaikan dengan pembahasan

makalah, maka dirumuskan masalah sebagai berikut:

Apa pengertian data mining?

Bagaimana penerapan metode yang digunakan dalam penilaian kinerja

pada suatu perusahaan?

1.3. Batasan Masalah

Batasan masalah dalam makalah ini yaitu bagaiaman implementasi data mining

pada perusahaan perusahaan terkait penilaian kinerja karyawan dengan

menggunakan metode klasifikasi Naive Bayes yang merujuk pada beberapa jurnal

yang berjudul Klasifikasi Penetapan Status Karyawan dengan Menggunakan Metode

Naïve Bayes, Kajian Penerapan Algoritma C4.5, Naïve Baye dan Neural Network untuk

Memenuhi Penilaian Data Karyawan Service Level Agreement di Bank, Analisis dan

Penerapan Algoritma Naive Bayes untuk Evaluasi Kinerja Karyawan pada PT. Pelita

Wira Sejahtera dan Penerapan Data Mining untuk Menentukan klasifikasi Kinerja

Pegawai pada Sistem Informasi Kepegawaian.

1.4. Tujuan penelitian

Tujuan pembahasan dalam makalah ini adalah untuk mengetahui implementasi

klasifikasi Naive Bayes yang digunakan pada perusahaan dalam penilaian kinerja

karyawan pada perusahaan.

Page 7: PERBANDINGAN PENERAPAN DATAMINING DALAM PENILAIAN …adrianti.staff.gunadarma.ac.id/Publications/files/... · data-data karyawan, sehingga penulis mendapatkan hardcopy data-data karyawan

3

BAB 2. TINJAUAN PUSTAKA 2.1. Data Mining

Data Mining merupakan kegiatan yang meliputi pengumpulan, pemakaian

data historis untuk menemukan keteraturan, pola atau hubungan dalam set data

berukuran besar. Keluaran dari data mining ini bisa dipakai untuk memperbaiki

pengambilan keputusan di masa depan Terdapat beberapa istilah lain yang memiliki

makna sama dengan data mining, yaitu Knowledge discovery in databases (KDD),

ekstraksi pengetahuan (knowledge extraction), Analisa data/pola (data/pattern

analysis), kecerdasan bisnis (business intelligence) dan data archaeology dan data

dredging (Larose, 2005).

Dalam menerapkan metode analisa data mining, terdapat beberapa tahapan

pada KDD seperti berikut :

Gambar 1 Tahapan pada KDD dalam Meotde Analisa Data Mining

1. Data Selection,

Pemilihan (seleksi) data dari sekumpulan data operasional perlu

dilakukan sebelum tahap penggalian informasi dalam KDD dimulai. Data

hasil seleksi yang akan digunakan untuk proses data mining, disimpan

dalam suatu berkas, terpisah dari basis data operasional.

2. Preprocessing/Cleaning,

Sebelum proses data mining dapat dilaksanakan, perlu dilakukan

proses cleaning pada data yang menjadi fokus KDD. Proses cleaning

mencakup antara lain membuang duplikasi data, memeriksa data yang

inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan

Page 8: PERBANDINGAN PENERAPAN DATAMINING DALAM PENILAIAN …adrianti.staff.gunadarma.ac.id/Publications/files/... · data-data karyawan, sehingga penulis mendapatkan hardcopy data-data karyawan

4

cetak.

3. Transformation,

Coding adalah proses transformasi pada data yang telah dipilih,

sehingga data tersebut sesuai untuk proses data mining. Proses coding

dalam KDD merupakan proses kreatif dan sangat tergantung pada

sejenis atau pola informasi yang akan dicari dalam basis data.

4. Data Mining,

Data mining adalah proses mencari pola atau informasi menarik dalam

data terpilih dengan menggunakan teknik atau metode tertentu.

Teknik, metode, atau algoritma dalam data mining sangat bervariasi.

Pemilihan metode atau algoritma yang tepat sangat bergantung pada

tujuan dan proses KDD secara keseluruhan.

5. Evaluation,

Pola informasi yang dihasilkan dari proses data mining perlu

ditampilkan dalam bentuk yang mudah dimengerti oleh pihak yang

berkepentingan. Tahap ini merupakan bagian dari proses KDD yang

disebut interpretation. Tahap ini mencakup pemeriksaan apakah pola

atau informasi yang ditemukan bertentangan dengan fakta atau

hipotesis yang ada sebelumnya.

2.2. Klasifikasi Penetapan Status Karyawan dengan Menggunakan Metode

Naïve Bayes

Salah satu asset yang berharga dalam sebuah perusahaan adalah sumber daya

manusia (SDM). Karyawan adalah SDM tersebut. Karyawan menjadi peran penting.

Dalam perusahaan besar pasti mempunyai banyak karyawan. Di dalam perusahaan

terdapat tiga jenis karyawan yaitu, outsourcing, karyawan kontrak dan karyawan

tetap. Untuk mendapatkan karyawan tetap dilakukan proses penyariangan melaui

penilaian yang dilakukan oleh bagian SDM. Dalam proses tersebut mengalami

kendala dalam segi teknis dan efektifias karena penilaian manual dan kadang

keputusannya dinilai secara subyektif. Oleh karena itu dilakukan penilitian untuk

klasifikasi penetapan status karyawan dengan metode Naïve Bayes dan Rapidminer.

Dalam proses metodologi penelitian, Penelitian ini dilakukan dengan beberapa

langkah :

Page 9: PERBANDINGAN PENERAPAN DATAMINING DALAM PENILAIAN …adrianti.staff.gunadarma.ac.id/Publications/files/... · data-data karyawan, sehingga penulis mendapatkan hardcopy data-data karyawan

5

1. Identifikasi Masalah yaitu menentukan pola klasifikasi penetapan

status karyawan untuk mengembangkan keputusan dalam

penentapannya.

2. Pengumpulan Data yang didapat dari perusahaan pada tahun 2016.

Yaitu data untuk penetapan status karyawan.

3. Pengolahan data manual menggunakan metode Naïve Bayes Langkah

selanjutnya adalah pengolahan data menggunakan metode Naïve

Bayes. Langkah ini melakukan perhitungan manual dengan

menggunakan rumus Naïve Bayes dari data yang telah didapat

sebelumnya.

4. Pengolahan data menggunakan rapid miner dimana data yang didapat

dimasukan kedalam aplikasi rapid miner dan di proses dengan operasi

Naïve Bayes.

5. Kesimpulan yang nantinya akan dijelaskan setelah mendapatkan hasil

dari pengolahan data bak manual dan juga penggunaan rapid miner.

2.3. Penerapan Algoritma C4.5, Naïve Bayes dan Neural Network untuk

Memenuhi Penilaian Data Karyawan Service Level Agreement di Bank

Dunia Ekonomi dan Bisnis yang semakin kompetitif mendorong setiap

Organization Level berpacu dengan waktu dalam memenuhi kebutuhan pelanggan

(Customer Needs). Dalam bahasa Management kita kenal dengan istilah Service

Level Standard dan dalam beberapa Aspek atau Kriteria juga disebut Service Level

Agreement. Bank merupakan salah satu urat jantung perekonomian sebuah negara,

tanpa Bank, bisa kita bayangkan bagaimana kita sulitnya menyimpan dan

mengirimkan uang, memperoleh tambahan modal usaha atau melakukan transaksi

perdagangan Internasional secara efektif dan aman. Suatu Bank akan dapat

memberikan pelayanan yang baik/prima, apabila Bank tersebut memiliki standar

layanan yang baik. Maka standar layanan harus dapat dilaksanakan dengan baik dan

konsisten, maka dari itu diperlukan suatu alat yang dapat mendefinisikan dan

memonitor layanan unit kerja dalam masalah pelayanan permasalahan. Dengan

diimplementasikannya modul ini, setiap karyawan dapat melakukan kegiatannya

akan selalu berorientasi kepada peningkatan layanan sehingga dapat memenuhi

SLA/KPI-nya, karena dengan demikian akan mempengaruhi kinerja di unit kerja.

Page 10: PERBANDINGAN PENERAPAN DATAMINING DALAM PENILAIAN …adrianti.staff.gunadarma.ac.id/Publications/files/... · data-data karyawan, sehingga penulis mendapatkan hardcopy data-data karyawan

6

Penilaian Kinerja dilakukan dengan menggunakan Form yang telah ditetapkan dan

diimplementasi melalui system komputerisasi secara terpusat.dalam database.

Salah satu media yang dapat digunakan untuk mendefinisikan dan memonitor

layanan adalah dengan adanya Service Level Agreement (SLA). SLA merupakan

sistem yang dirancang untuk mengukur penilaian karyawan berdasarkan kinerja.

Salah satu input yang digunakan dalam SLA adalah Penerapan KPI (Key

Performance Indicators) yang diperoleh dari penerapan SLA berupa standar

acuan, yang merupakan kesepakatan antara pihak yang membutuhkan pelayanan

yang spesifik dan penyedia layanan yang bertanggung jawab untuk memberikan

layanan tersebut. Dengan adanya SLA, penyedia layanan akan berkomitmen untuk

memberikan layanan terbaik untuk mendukung kebutuhan bisnis nasabah.

Dalam penelitian ini, peneliti mengumpulkan materi-materi kepustakaan yang

berhubungan dengan pengambilan judul untuk studi penelitiannya, dilanjutkan

survey langsung ke tempat penelitian Tata Usaha Fakultas Teknik Matematika dan

Ilmu Pengetahuan Alam serta BAAK Universitas Indraprasta PGRI. Terdapat

permasalahan di setiap bulan, triwulan dan semesternya dengan jumlah nilai

karyawan mengalami penurunan. Untuk dapat meningkatkan nilai karyawan pada

setiap periode, perlu diketahui permasalahan-permasalahan yang terjadi pada diri

karyawan terutama karyawan yang bermasalah dalam bekerja. Peneliti juga

melakukan analisis komparasi tiga algoritma klasifikasi data mining yaitu algoritma

C4.5, Neural Network, dan Naïve Bayes dengan menggunakan data dari hasil survei

yaitu dari data mahasiswa dan data lainnya yang dapat digunakan dan diolah ke

menggunakan metode data mining, yaitu pertama kali menggunakan aplikasi

microsoft office excel.

2.4. Algoritma Naive Bayes untuk Evaluasi Kinerja Karyawan pada PT. Pelita

Wira Sejahtera

PT. Pelita Wira Sejahtera yang bergerak dibidang kontraktor umum

Transportasi Darat, Penyewaan Minyak Mentah, Alat Berat & Penyewaan Kendaraan

Ringan yang dimana memiliki jumlah karyawan yang cukup banyak. Berdasarkan

hasil wawancara dengan supervisor IT, bahwa setiap tahunnya selalu melakukan

penilaian kinerja terhadap karyawan. Penilaian kinerja karyawan dilakukan dengan

Page 11: PERBANDINGAN PENERAPAN DATAMINING DALAM PENILAIAN …adrianti.staff.gunadarma.ac.id/Publications/files/... · data-data karyawan, sehingga penulis mendapatkan hardcopy data-data karyawan

7

cara, yaitu karyawan dinilai oleh kepala bagian dan atau kepala departemennya

masing- masing. Jika karyawan yang diberhentikan meningkat setiap tahunnya akan

mempengaruhi pekerjaan di setiap bidangnya. Proses yang berjalan memiliki

kekurangan yaitu: 1. Belum mengetahui grafik kinerja karyawan setiap tahunnya. 2.

Keterbatasan dalam mengontrol setiap karyawan yang bekerja. 3. Penilaian

terkadang dilakukan secara subjektif. Untuk menghindari adanya subjektifitas

dalam penilaian kinerja karyawan dan untuk mendapatkan penilaian yang

kompeten maka penulis mencoba menerapkan metode klasifikasi Naive Bayes.

Tahapan tahapan pada penelitian ini terdiri dari:

1. Studi Literatur dengan melakukan pencarian terhadap landasan-

landasan teori yang diperoleh dari berbagai sumber seperti buku,

jurnal ilmiah dan juga referensi lainnya.

2. Identifikasi Masalah yang dijadikan permasalahan data mining terkait

kinerja pada karyawan PT Pelita Wira Sejahtera dan menentukan data

apa saja yang dibutuhkan dalam penelitian ini.

3. Pengumpulan Data ini dilakukan dengan beberapa metode yaitu :

Pengamatan (Observasi) dengan mengamati bagaimana pengelolaan

data-data karyawan, sehingga penulis mendapatkan hardcopy data-

data karyawan. Data karyawan ini diberikan oleh asisten HRD

perusahaan tersebut. Adapun atribut data yang diperoleh yaitu jenis

kelamin, jabatan, pengetahuan tentang pekerjaan, kejujuran dan

integritas, inisiatif dan kreatif, kemampuan berkomunikasi, tanggung

jawab dan ketelitian, kemampuan bekerja sama, kemampuan

menganalisa, kemampuan koordinasi, orientasi pada tugas dan

koordinasi, orientasi pada efisiensi. Wawancara secara langsung

dengan asisten HRD untuk memperoleh data dan informasi akurat

mengenai data karyawan yang penulis lakukan.

4. Klasifikasi Penilaian Kinerja Karyawan dengan beberapa tahapan.

Adapun alur proses pengklasifikasian dapat dilihat pada gambar

Page 12: PERBANDINGAN PENERAPAN DATAMINING DALAM PENILAIAN …adrianti.staff.gunadarma.ac.id/Publications/files/... · data-data karyawan, sehingga penulis mendapatkan hardcopy data-data karyawan

8

Data Karyawan merupakan data-data yang dimiliki oleh karyawan

termasuk data penilaian kinerja karyawan pada tahun yang telah lalu.

Atribut data yang digunakan yaitu, masa mengabdi, jenis kelamin,

jabatan, pengetahuan tentang pekerjaan, kejujuran dan integritas,

inisiatif dan kreatif, kemampuan berkomunikasi, tanggung jawab dan

ketelitian, kemampuan bekerja sama, kemampuan menganalisa,

kemampuan koordinasi, orientasi pada tugas dan koordinasi, orientasi

pada efisiensi. Untuk Cleaning data, dilakukan pembersihan atau

pemisahan data dari noise data dan data yang tidak konsiten seperti

karyawan yang memiliki atribut tidak lengkap. Selain itu ada beberapa

hal yang penulis lakukan dalam proses cleaning data yaitu sebagai

berikut:

a. Mengklasifikasikan penilaian kinerja menjadi 4 kategori yaitu >=30

SANGAT BAIK, <=29 BAIK, <=19 CUKUP dan <=10 KURANG.

b. Kemudian hasil dari cleaning data ini disusun dalam bentuk format

arff pada tools Notepad++.

c. Format arff dengan menggunakan WEKA. AtributeRelation File

Format (ARFF) merupakan tipe file text yang berisi berbagai

instance data yang berhubungan dengan suatu set atribut datayang

kemudian disusun dengan menggunakan tanda koma (,) sebagai

pemisah data per- atributnya.

d. Training dengan menerapkan algoritma klasifikasi naïve bayes

untuk membentuk sebuah model classifier pada data karyawan

yang sudah ada Algoritma ini merupakam representasi

pengetahuan yang akan digunakan untuk prediksi kelas data baru

yang belum pernah ada

e. Naïve Bayes Klasifikasi dengan menggunakan tools WEKA untuk

melakukan klasifikasi terhadap data karyawan yang sudah ditesting

menggunakan model classifier yang sudah dibentuk.

f. Akurasi Hasil Akurasi Hasil menunjukkan kedekatan hasil

pengukuran dengan nilai sesungguhnya.

g. K-fold Cross Validation untuk menilai/memvalidasi keakuratan

sebuah model yang dibangun berdasarkan dataset tertentu. Salah

Page 13: PERBANDINGAN PENERAPAN DATAMINING DALAM PENILAIAN …adrianti.staff.gunadarma.ac.id/Publications/files/... · data-data karyawan, sehingga penulis mendapatkan hardcopy data-data karyawan

9

satu metode cross-validation yang populer adalah K-Fold Cross

Validation.

5. Hasil Analisis akan menguji keakuratan naïve bayes dengan

menggunakan teknik K-Fold Cross Validation. Dimana dataset dibagi

menjadi sejumlah K-buah partisi secara acak. Kemudian dilakukan

sejumlah K-kali eksperimen, dimana masing-masing eksperimen

menggunakan data partisi ke-K sebagai data testing dan memanfaatkan

sisa partisi lainnya sebagai data training. Hasil yang muncul dengan

nilai persentasi terbesarlah yang akan di ambil. Selain itu, bentuk

visualisasi dari setiap atribut dapat dilihat pada tools WEKA

Page 14: PERBANDINGAN PENERAPAN DATAMINING DALAM PENILAIAN …adrianti.staff.gunadarma.ac.id/Publications/files/... · data-data karyawan, sehingga penulis mendapatkan hardcopy data-data karyawan

10

BAB 3. PEMBAHASAN DAN HASIL

3.1. Klasifikasi Penetapan Status Karyawan dengan Menggunakan Metode

Naïve Bayes

Data yang digunakan ada 5 buah dan menggunakan 1 buah labelnya adalah

diangkat [ya | tidak]

1. Absensi [ bagus | cukup ]

2. Attitude [ baik | buruk ]

3. Psikotes [ tinggi | sedang | rendah ]

4. Wawancara [ baik | buruk ]

5. diangkat [ya | tidak]

Dari data yang telah ditentukan dilakukan rekap data dengan 2 percobaan

yaitu perhitungan manual dan menggunakan rapidminer. Pada perhitungan manual

menentukan atribut yang bernilai positif lalu dimasukan ke dalam rumus Naïve

Bayes sebagai berikut Perhitungannya adalah sebagai berikut :

𝑓𝑐1(𝐸) = 17 × 16 × 22 × 12 × 17 = 1220736 30 30 30 30

30

24300000

𝑓𝑐2(𝐸) = 13 × 16 × 22 × 12 × 17 = 933504 30 30 30 30

30

24300000

Page 15: PERBANDINGAN PENERAPAN DATAMINING DALAM PENILAIAN …adrianti.staff.gunadarma.ac.id/Publications/files/... · data-data karyawan, sehingga penulis mendapatkan hardcopy data-data karyawan

11

Setelah itu dimasukan ke dalam perhitungan probabilitas dimana c1 =0.567

dan c2 = 0.433 . Hasil yang didapatkan nilai c1 yang terbesar (ya diangkat) maka

yang dipilih adalah c1.

Pada proses penggunaan rapidminer tahapannya setelah memasukan data

dalam bentuk excel dalam rapidminer, menentukan design untuk melakukan proses,

melakukan oenarikan data dengan memilih modeling yaitu naive bayes dan proses

labelingnya, dilanjutkan menjalankan proses rapidminer. Rapidminer akan

menampilakn hasil berupa text view. Pada rapidminer dapat menampilkan grafik

berdasarkan atribut serta tabel distribution untuk hasilnya c1 =0.567 dan c2 = 0.433

dengan 5 distibution.

Dari kedua perhitungan manual dan yang dihasilkan rapidminer nilainya

sama. Karena nilai probalitas yang tertinggi adalah c1 atau diangkat karyawan. Maka

didapatkan pola untuk penetapan status karyawan diangkat adalah berdasarkan

atribut dan nilai, absensi: bagus, attitude: bagus, psikotes: tinggi dan wawancara :

baik.

3.2. Penerapan Algoritma C4.5, Naïve Bayes dan Neural Network untuk

Memenuhi Penilaian Data Karyawan Service Level Agreement di Bank

Hasil dari pengujian model yang telah dilakukan yaitu dengam algoritma

C4.5, Neural Network, dan Naïve Bayes, dilakukan pengujian tingkat akurasi dengan

menggunakan confussion matrix dan kurva ROC/AUC (Area Under Cover).

Confusion Matrix pada algoritma c4.5 diketahui data training terdiri dari 100

record data, 85 data diklasifikasikan baik dan 7 data diprediksi baik tetapi ternyata

Buruk, 5 data dinyatakan buruk tetapi baik, dan, 3 data secara benar diklasifikasikan

Buruk. Dan pada data testing terdiri dari 30 record data, 26 data diklasifikasikan

baik dan 5 data diprediksi baik tetapi ternyata Buruk, 2 data diprediksi buruk tapi

baik dan 1 diprediksi buruk.

Pada confusion matrix algoritma Neural Network. Diketahui data training

terdiri dari 100 record data, 84 data diklasifikasikan baik dan 8 data diprediksi baik

tetapi ternyata Buruk, 6 data diklasifikasikan buruk tetapi ternyata Baik dan 2 data

secara diklasifikasikan buruk. Dan pada data testing Diketahui dari 30 data testing,

26 diklasifikasikan baik, 4 data diprediksi baik tetapi ternyata Buruk, 2 data

diprediksi dengan buruk klasifikasi Baik, dan 2 data diprediksi Buruk.

Page 16: PERBANDINGAN PENERAPAN DATAMINING DALAM PENILAIAN …adrianti.staff.gunadarma.ac.id/Publications/files/... · data-data karyawan, sehingga penulis mendapatkan hardcopy data-data karyawan

12

Pada confusion matrix algoritma Naïve Bayes, diketahui data training terdiri

dari 100 record data, 119 data diklasifikasikan Baik dan 12 data diprediksi benar

tetapi ternyata Buruk, 6 data secara buruk diklasifikasikan Baik dan 3 data

diprediksi buruk. Dan pada data testing terdiri dari 30 record data, 26 data

diklasifikasikan baik dan 4 data diprediksi benar tetapi ternyata Buruk, 2 data

secara benar diklasifikasikan Baik dan 2 data diprediksi Buruk. confusion matrix

diatas, selanjutnya dilakukan perhitungan nilai accuracy, precision, dan recall.

Perbandingan nilai accuracy, precision, dan recall yang telah dihitung untuk

metode C4.5, naïve bayes, dan neural network. Sehingga didapatkan seperti tabel

berikut.

Hasil perhitungan divisualisasikan dengan kurva ROC (Receiver Operating

Characteristic) atau AUC (Area Under Curve). ROC memiliki tingkat nilai diagnosa

yaitu (Gorunescu, 2011): a. Akurasi bernilai 0.90 – 1.00 = excellent classification b.

Akurasi bernilai 0.80 – 0.90 = good classification, c. Akurasi bernilai 0.70 – 0.80 =

fair classification d. Akurasi bernilai 0.60 – 0.70 = poor classification e. Akurasi

bernilai 0.50 – 0.60 = failure Perbandingan hasil perhitungan nilai AUC untuk metode

C4.5, Neural Network, dan Naïve Bayes

tingkat akurasi menggunakan data training tertinggi adalah dengan algoritma C4.5

memiliki tingkat ROC paling tinggi, yaitu 0.772 dan pada testing algoritma C4.5

memiliki tingkat ROC yang paling tinggi, yaitu 0.859 termasuk dalam katagori good

classification. Berdasarkan kolom ROC pada tabel 16, pada data training algoritma

C4.5 memiliki tingkat ROC paling tinggi, yaitu 0.772 dan pada testing algoritma C4.5

memiliki tingkat ROC yang paling tinggi, yaitu 0.859 termasuk dalam katagori good

classification.

Page 17: PERBANDINGAN PENERAPAN DATAMINING DALAM PENILAIAN …adrianti.staff.gunadarma.ac.id/Publications/files/... · data-data karyawan, sehingga penulis mendapatkan hardcopy data-data karyawan

13

Dengan mengunakan perbandingan data training dengan data testing, yaitu

100 berbanding 30, maka perbandingan komparasinya untuk akurasi dapat dilihat

Algoritma C4.5 memiliki tingkat akurasi, sehingga bisa digunakan untuk klasifikasi

data karyawan yang bermasalah dalam penilaian dengan persentase 88.00%.

3.3. Algoritma Naive Bayes untuk Evaluasi Kinerja Karyawan pada PT. Pelita

Wira Sejahtera

Hasil wawancara dan observasi yang sudah dilakukan, peneliti memperoleh

data-data karyawan sebanyak 154. Lalu dilakukan cleaning data dengan hasil data-

data karyawan ini ada beberapa yang mengalami noise sehingga data yang dapat

digunakan adalah 149 data. Data karyawan masing- masing dibagi menjadi 4 kelas

yaitu sebanyak 24 kelas SANGAT BAIK, 102 kelas BAIK, 23 kelas CUKUP dan 0 kelas

KURANG. Atribut yang digunakan pada seluruh data karyawan yaitu, masa

mengabdi, jenis kelamin, jabatan, pengetahuan tentang pekerjaan, kejujuran dan

integritas, inisiatif dan kreatif, kemampuan berkomunikasi, tanggung jawab dan

ketelitian, kemampuan bekerja sama, kemampuan menganalisa, kemampuan

koordinasi, orientasi pada tugas dan koordinasi, orientasi pada efisiensi dan Kelas

Penilaian. data yang kemudian disusun sesuai kebutuhan dalam format excel,

Cleaning data merupakan preproses dimana pada tahap ini dilakukan pembersihan

atau pemisahan data dari noise data dan data yang tidak konsiten seperti karyawan

yang memiliki atribut tidak lengkap maka akan dihapus setelah itu data karyawan

disusun dalam format arff.

Klasifikasi menggunakan algoritma naive bayes, pada WEKA dilakukan

dengan 3 set yaitu menggunakan Use Data Training, 5-cross validation dan 10- cross

validation. Dari hasil menggunakan data training menunjukkan hasil 142 prediksi

benar dengan akurasi sebesar 95.302 % dan 7 prediksi salah dengan persentasi

4.698 % dengan waktu klasifikasi selama 0 detik. pada pengujian 5- cross validation

menunjukkan hasil 140 prediksi benar dengan akurasi sebesar 93.9597 % dan 9

prediksi salah dengan persentasi 6.0403 % dengan waktu klasifikasi selama 0 detik.

Page 18: PERBANDINGAN PENERAPAN DATAMINING DALAM PENILAIAN …adrianti.staff.gunadarma.ac.id/Publications/files/... · data-data karyawan, sehingga penulis mendapatkan hardcopy data-data karyawan

14

Sedangkan dalam pengujian menggunakan 10-cross validation menunjukkan hasil

140 prediksi benar dengan akurasi sebesar 93.9597 % dan 9 prediksi salah dengan

persentasi 6.0403 % dengan waktu klasifikasi selama 0 detik.

Page 19: PERBANDINGAN PENERAPAN DATAMINING DALAM PENILAIAN …adrianti.staff.gunadarma.ac.id/Publications/files/... · data-data karyawan, sehingga penulis mendapatkan hardcopy data-data karyawan

15

BAB 4. PENUTUP 4.1. Kesimpulan

Penerapan data mining untuk melakukan penilaian kinerja karyawan pada

perusahaan. Dengan menetapkan pola klasifikasi yang tepat dan mudah digunakan,

naive bayes C4.5 dan neural network dapat digunakan untuk mendapatkan

informasi dari hasil klasifikasi penilaian karyawan. rata rata dari hasil beberapa

penilitian yang menggunakan naive bayes memiliki akurasi diatas 93%. Hanya saja

ketika membandingkan ketiga algoritma tersebut diketahui bahwa algoritma C4.5

memiliki nilai accuracy dan AUC paling tinggi. Dengan demikian algoritma C4.5

merupakan algoritma terbaik dan dapat memberikan pemecahan dalam

permasalahan penilaian karyawan.

4.2. Saran

Hasil dari makalah ini diharapkan bisa digunakan pada pihak perusahaan,

untuk lebih meningkatkan akurasi analisa data karyawan yang bermasalah dalam

penilaian. penelitian ini kedepannya juga dapat menggunakan data karyawan lebih

banyak lagi serta mencakup atribut lainnya agar memiliki persentasi kurasi yang

lebih baik. Dan data ini diujikan menggunakan algoritma klasifikasi lainnya. Model

klasifikasi karyawan diharapkan dapat dijadikan pendukung pengambilan kebijakan

pihak manajemen untuk membantu mengurangi kesalahan pada pekerjaan.

Page 20: PERBANDINGAN PENERAPAN DATAMINING DALAM PENILAIAN …adrianti.staff.gunadarma.ac.id/Publications/files/... · data-data karyawan, sehingga penulis mendapatkan hardcopy data-data karyawan

16

DAFTAR PUSTAKA Ariani, Fattya, Amir, Nur Ala,, Khairul Rizal. 2018. Klasifikasi Penetapan Status

Karyawan Dengan Menggunakan Metode Naïve Bayes. Paradigma

Faisal, Achmad. 2017. Kajian Penerapan Algoritma C4.5, Naïve Baye Dan Neural

Network Untuk Memenuhi Penilaian Data Karyawan Service Level Agreement Di

Bank. Jakarta Selatan. Universitas Indraprasta PGRI

Firdaus, Rafly Dikhi. 2017. Penerapan Data Mining Untuk MenentukanKlasifikasi

Kinerja Pegawai Pada Sistem Informasi Kepegawaian. Tasikmalaya. Universitas

Siliwangi

Hernawati, Fajar Astuti. 2013 Data Mining” CV. Andi OFFSET.

Khadafy, A. R., & Wahono, R. S. (2015). Penerapan Naïve Bayes Untuk Mengurangi

Data Noise Pada Klasifikasi Multi Kelas Dengan Decision Tree. Journal of Intelligent

Systems, 1(2), 136–142.

Larose, Daniel T. 2005. Discovering Knowledge in Data : An Introduction to Data

Mining. John Willey & Sons, Inc.

Sari, Viny Novika , Lola Yorita Astri, Errissya Rasywir. 2020. Analisis dan Penerapan

Algoritma Naive Bayes untuk Evaluasi Kinerja Karyawan pada PT. Pelita Wira

Sejahtera. Jambi. STIKOM Dinamika Bangsa