tesis implementasi data mining untuk klasifikasi dan
Post on 13-Feb-2022
4 Views
Preview:
TRANSCRIPT
TESIS
IMPLEMENTASI DATA MINING UNTUK KLASIFIKASI DAN PEMERATAAN GURU PADA SEKOLAH DI DAERAH
SITTI SUHADA P2700211411
PROGRAM PASCASARJANA TEKNIK ELEKTRO KONSENTRASI TEKNIK INFORMATIKA
FAKULTAS TEKNIK UNIVERSITAS HASANUDDIN MAKASSAR
2013
IMPLEMENTASI DATA MINING UNTUK KLASIFIKASI DAN PEMERATAAN GURU PADA SEKOLAH DI DAERAH
Tesis
Sebagai Salah Satu Syarat untuk Mencapai Gelar Magister
Program Studi
Teknik Elektro
Disusun dan Diajukan Oleh
SITTI SUHADA
Kepada
PROGRAM PASCASARJANA
UNIVERSITAS HASANUDDIN
MAKASSAR
2013
PERNYATAAN KEASLIAN TESIS
Yang bertanda tangan di bawah ini :
Nama : Sitti Suhada
Nomor Pokok : P2700211411
Program Studi : Teknik Elektro
Konsentrasi : Teknik Informatika
Menyatakan dengan sebenarnya bahwa tesis yang saya tulis ini benar-benar
merupakan hasil karya sendiri, bukan merupakan pengambilalihan tulisan atau
pemikiran orang lain. Apabila dikemudian hari terbukti atau dapat dibuktikan bahwa
sebagian atau keseluruhan tesis ini hasil karya orang lain, saya bersedia menerima
sanksi atas perbuatan tersebut.
Makassar, Juli 2013
Yang menyatakan,
Sitti Suhada
PRAKATA
Puji dan syukur penulis panjatkan kehadirat Allah SWT atas segala
rahmat dan hidayah-Nya, sehingga penyusunan tesis ini dapat penulis
selesaikan untuk memenuhi sebagian syarat memperoleh gelar magister
pada program studi teknik elektro konsentrasi teknik informatika universitas
Hasanuddin Makassar.
Banyak kendala yang dihadapi oleh penulis dalam penyusunan tesis
ini, namun berkat bantuan berbagai pihak, maka tesis ini dapat terselesaikan.
Pada kesempatan ini penulis dengan tulus menyampaikan terima kasih dan
penghargaan kepada semua pihak yang telah banyak membantu dan
mendukung demi rampungnya tesis ini, terutama kepada :
1. Suamiku Resmi Nur yang senantiasa sabar memberikan perhatian,
dorongan dan motivasi kepada penulis, Anakku Muh. Fakhri Nur Pratama,
orang tuaku sebagai motivator bagi penulis dalam menyelesaikan tesis ini,
atas semua doa kebaikan dan kasih sayang yang selalu menyertai penulis.
2. Bapak Prof. Dr. Ir. H. Salama Manjang, MT selaku Ketua Program Studi
Teknik Elektro Program Pascasarjana yang telah memberikan segala
motivasi sejak awal perkuliahan hingga terselesaikannya penelitian ini.
3. Bapak Prof. Dr. Ir. H. Muhammad Tola, M.Eng selaku Ketua Komisi
Penasihat atas bantuan, kesabaran dan kebaikan hati dalam mendampingi
penulis selama proses pembimbingan.
4. Bapak Muhammad Niswar, ST., MIT., Ph.D selaku Anggota Komisi
Penasihat atas bantuan, kesabaran dan kebaikan hati dalam
mendampingi penulis selama proses pembimbingan.
5. Bapak Prof. Dr. Ir. H. Muhammad Arief, Dipl. Ing, Bapak Dr. Armin Lawi,
M.Eng dan Bapak Dr. Eng. Wardi, ST., M.Eng selaku tim penguji atas
saran-saran yang diberikan untuk perbaikan tesis ini ke arah yang lebih
baik.
6. Bapak Drs. H. Mahmud. BM. M.Pd selaku Kepala Dinas Pendidikan Kota
Makassar yang telah memberikan izin kepada penulis untuk mengadakan
penelitian di dinas pendidikan kota Makassar.
7. Bapak Supriadi, SE., MM selaku Kasubag Program Dinas Pendidikan
kabupaten Maros yang telah memberikan izin kepada penulis dan
membantu dalam penelitian di dinas pendidikan kabupaten Maros.
8. Teman-teman mahasiswa pascasarjana Program Studi Teknik Elektro
Konsentrasi Teknik Informatika Angkatan 2011.
Akhirnya penulis menyadari bahwa isi tulisan ini masih jauh dari
kesempurnaan, oleh karena itu penulis mengharapkan kritik dan saran yang
sifatnya membangun. Semoga tulisan ini dapat memberikan manfaat bagi
semua pihak yang membutuhkan dan terutama bagi penulis.
Makassar, Juli 2013
Sitti Suhada
vii
ABSTRAK
Sitti Suhada, Implementasi data mining untuk klasifikasi dan pemerataan guru pada sekolah di daerah (dibimbing oleh Muhammad Tola dan Muhammad Niswar)
Permasalahan dalam dunia pendidikan yaitu kurangnya tenaga guru, guru yang mengajar tidak sesuai dengan latar belakang pendidikan (mismatch), kualifikasi rendah, disparitas kompetensi, dan penyaluran guru tidak merata.
Penelitian ini bertujuan untuk (1) merancang model algoritma klasifikasi pemerataan kebutuhan guru dengan menggunakan algoritma nearest neighbor (2) Untuk merancang model algoritma klasifikasi pemerataan kebutuhan guru dengan menggunakan algoritma C4.5 (3) membandingkan akurasi model algoritma nearest neighbor dan algoritma C4.5 untuk pemerataan kebutuhan guru.
Penelitian ini merupakan penelitian historis dengan menggunakan metode eksperimental yaitu dengan melakukan perancangan dan pembuatan model sistem. Pengumpulan data dilakukan dengan metode studi pustaka (library research) dan metode pengumpulan data lapangan (field research) dan pembuatan aplikasi berdasarkan analisis hasil dari metode data mining yakni algoritma nearest neighbor dan algoritma C4.5.
Adapun hasil dari penelitian ini adalah informasi klasifikasi keadaan kebutuhan guru mata pelajaran apakah lebih, cukup atau kurang pada tiap sekolah. Tingkat akurasi algoritma nearest neighbor mencapai 72% dan tingkat akurasi algoritma C4.5 mencapai 83%.
Kata kunci : data mining, algoritma nearest neighbor, algoritma C4.5
viii
ABSTRACT
Sitti Suhada, Implementation of data mining for the classification and distribution of teachers in rural schools (led by Muhammad Tola and Muhammad Niswar) Problems in education is the lack of teachers, the teachers are not in accordance with the educational background (mismatch), low qualifications, competence disparities and uneven distribution of teachers. This study aims to (1) design a model of classification algorithms equity needs of teachers by using nearest neighbor algorithm (2) To design a classification algorithm model distribution needs of teachers by using algorithm C4.5 (3) compare the accuracy of the model and algorithm nearest neighbor algorithm C4.5 equity requirement for teachers. This study aims to (1) design a model of classification algorithms of equity needs of teachers by using nearest neighbor algorithm (2) To design a classification algorithm models the distribution needs of teachers by using algorithm C4.5 (3) compare the accuracy of the models and nearest neighbor algorithm C4.5 algorithm equity requirement for teachers. The results of this study is the information in the form of pattern classification state whether teachers need more, or less enough of nearest neighbor algorithm and C4.5 algorithms. Nearest neighbor algorithm accuracy rate reaches 72% and the accuracy rate reaches 83% C4.5 algorithms. Keywords: data mining, nearest neighbor algorithm, the algorithm C4.5
ix
DAFTAR ISI
Halaman
HALAMAN JUDUL ............................................................................ i
HALAMAN PENGAJUAN TESIS ...................................................... ii
HALAMAN PENGESAHAN............................................................... iii
PERNYATAAN KEASLIAN TESIS ................................................... iv
PRAKATA ......................................................................................... v
ABSTRAK ......................................................................................... vii
ABSTRACT ....................................................................................... viii
DAFTAR ISI ....................................................................................... ix
DAFTAR GAMBAR ........................................................................... xii
DAFTAR TABEL ............................................................................... xiv
Bab I PENDAHULUAN
A. Latar Belakang Masalah ......................................................... 1
B. Rumusan Masalah ................................................................. 3
C. Tujuan Penelitian .................................................................... 3
D. Manfaat Penelitian ................................................................... 4
E. Ruang Lingkup Penelitian ........................................................ 4
BAB II. TINJAUAN PUSTAKA
A. Landasan Teori dan Konsep ................................................... 5
1. Konsep Dasar Data Mining ............................................... 5
x
1.1 Data Mining ................................................................ 5
1.2. Algoritma Nearest Neighbor ....................................... 6
1.3 Algoritma C4.5 ........................................................... 7
2. Konsep Guru .................................................................... 8
2.1 Defenisi Guru .............................................................. 8
2.2 Guru Mata Pelajaran ................................................... 8
2.3 Penataan Guru Pegawai Negeri Sipil .......................... 9
2.4 Komposisi Guru ........................................................... 9
2.5 Defenisi Rombongan Belajar ...................................... 9
2.6 Rumus Perhitungan Kebutuhan Guru SMA ................ 10
3. Unified Modelling Language (UML) ................................... 10
B. Tinjauan Hasil Penelitian Terkait ............................................ 11
C. Kerangka Konseptual .............................................................. 15
BAB III. METODE PENELITIAN
A. . Tahapan Rancangan Penelitian .............................................. 16
B. . Jenis Penelitian ....................................................................... 23
C. . Arsitektur Sistem ..................................................................... 24
D. . Alat dan Bahan ........................................................................ 24
E. . Lokasi dan Waktu Penelitian ................................................... 25
BAB IV. HASIL PENELITIAN DAN PEMBAHASAN
A. Gambaran Umum Sistem ........................................................ 26
B. Hasil Analisis dan Pembahasan .............................................. 28
xi
C. User Interface .......................................................................... 36
D. Pengujian Sistem .................................................................... 40
BAB V. PENUTUP
A. Kesimpulan .............................................................................. 48
B. Saran ....................................................................................... 49
Daftar Pustaka
Lampiran
xii
DAFTAR GAMBAR
1. Gambar 2.1 Ilustrasi kedekatan kasus ...………..……………..…….. 6
2. Gambar 2.2 Bagan Kerangka Konseptual…………………………… 15
3. Gambar 3.1 Tahapan Rancangan Penelitian ………..……...……… 16
4. Gambar 3.2 Use Case Diagram……...……………….……............... 17
5. Gambar 3.3 Activity Diagram ………..……………………………….. 18
6. Gambar 3.4 Class Diagram …….…..………………………………… 19
7. Gambar 3.5 Flowchart klasifikasi metode Nearest Neighbor……… 20
8. Gambar 3.6 Flowchart klasifikasi algoritma C4.5……………………. 22
9. Gambar 3.7 Arsitektur sistem………………………………………….. 24
10. Gambar 4.1 Gambaran Umum Sistem ………..……………………… 25
11. Gambar 4.2 Proses klasifikasi data…………….……….…..………… 26
12. Gambar 4.3 Pohon Keputusan Level 0 ……..………………………. 33
13. Gambar 4.4 Pohon Keputusan Level 1……………………………. 34
14. Gambar 4.5 Form Input Data Sekolah ….……................……………. 35
15. Gambar 4.6 Form Input Data Mata Pelajaran…...........……………... 36
16. Gambar 4.7 Form Input Pilihan Algoritma……………………………. 36
Halaman
xiii
17. Gambar 4.8 Form Proses Algoritma C4.5…………………………. 37
18. Gambar 4.9 Output Sistem Algoritma C4.5 ................……………. 37
19. Gambar 4.10 Form Proses Algoritma Nearest Neighbor……………. 38
20. Gambar 4.11 Output Sistem Algoritma Nearest Neighbor ............. … 38
xiv
DAFTAR TABEL
Halaman
1. Tabel 4.1. Kasus…………….......……………………………… .......... 27
2. Tabel 4.2. Hasil Perhitungan Alokasi Waktu dan Output.. ............... 29
3. Tabel 4.3. Kasus Kebutuhan Guru ….……….…………………… ..... 31
4. Tabel 4.4. Perhitungan Level 0 ….…………… ................................ 32
5. Tabel 4.5. Perhitungan Node 1.1………….............. ......................... 33
6. Tabel 4.6. Pengujian Black Box…………………………………. ....... 39
7. Tabel 4.7 Pengujian Akurasi Algoritma Nearest Neighbor………… 43
8. Tabel 4.6. Pengujian Akurasi Algoritma C4.5 …… ............................ 44
1
BAB I
PENDAHULUAN
A. Latar Belakang Masalah
Pembangunan pendidikan saat ini telah menunjukkan hasil yang
cukup signifikan bagi pembangunan nasional. Pendidikan dipandang
sebagai salah satu dari berbagai investasi yang dianggap sangat
menentukan dalam upaya peningkatan kualitas sumber daya manusia.
Dalam dunia pendidikan, peran dan fungsi guru merupakan salah
satu faktor yang sangat signifikan. Guru merupakan bagian terpenting
dalam proses pembelajaran, sesuai dengan Undang-undang Republik
Indonesia Nomor 14 Tahun 2005 tentang Guru dan Dosen. Oleh sebab
itu, dalam setiap upaya peningkatan kualitas pendidikan di tanah air tidak
dapat dilepaskan dari berbagai hal yang berkaitan dengan eksistensi guru
itu sendiri[1].
Guru mata pelajaran merupakan salah satu faktor penting dalam
implementasi kurikulum. Bagaimanapun idealnya suatu kurikulum tanpa
ditunjang oleh kemampuan guru untuk mengimplementasikannya, maka
kurikulum itu tidak akan bermakna sebagai suatu alat pendidikan, dan
sebaliknya pembelajaran tanpa kurikulum sebagai pedoman tidak akan
efektif[2].
Di lain pihak, kondisi dunia pendidikan sekarang ini dihadapkan
pada masalah yang kompleks diantaranya persoalan klasik, yakni
2
kurangnya tenaga guru, guru yang mengajar tidak sesuai dengan latar
belakang pendidikan (mismatch), kualifikasi rendah, disparitas
kompetensi, dan pendistribusian guru yang tidak efektif. Hal ini dapat
dibuktikan oleh kondisi Indonesia saat ini yang masih kekurangan 200.000
tenaga guru (Ditjen PMPTK, 2010).
Pemerataan kebutuhan guru yang tidak merata dapat dibuktikan
pada SMA Negeri 1 Makassar untuk guru matematika terdapat 8 (delapan)
jumlah guru, sedangkan guru yang diperlukan untuk mata pelajaran
matematika hanya 7 (tujuh) guru, jadi jumlah guru lebih dari kebutuhan
guru. Di sisi lain pada SMA Negeri 3 Lau Maros terdapat 5 (lima) jumlah
guru sedangkan guru yang diperlukan untuk mata pelajaran matematika
harusnya 6 (enam) guru, jadi jumlah guru kurang dari kebutuhan guru.
Berkaitan dengan kondisi tersebut maka diperlukan ilmu data
mining untuk mengklasifikasi kebutuhan guru. Model klasifikasi yang
digunakan adalah dengan menggunakan metode algoritma Nearest
Neighbor (NN) dan Algoritma C4.5 untuk memperoleh akurasi yang tepat.
Dengan demikian diharapkan hasil penelitian ini nantinya dapat
menjadi salah satu bahan acuan pemerintah daerah dalam pengambilan
keputusan untuk memberikan kebijakan dalam penyaluran tenaga guru
sesuai dengan kebutuhan guru di masing-masing sekolah sehingga dapat
meningkatkan kualitas pendidikan.
3
B. Rumusan Masalah
Berdasarkan latar belakang yang telah dipaparkan pada bagian
sebelumnya, maka dapat dirumuskan rumusan masalah yaitu:
1. Bagaimana model klasifikasi pemerataan kebutuhan guru dengan
menggunakan algoritma nearest neighbor.
2. Bagaimana model klasifikasi pemerataan kebutuhan guru dengan
menggunakan algoritma C4.5.
3. Bagaimana akurasi algoritma nearest neighbor dan algoritma C4.5
untuk pemerataan kebutuhan guru.
C. Tujuan Penelitian
Memperhatikan latar belakang dan rumusan masalah yang telah
diuraikan, maka tujuan dari penelitian ini adalah:
1. Untuk merancang model algoritma klasifikasi pemerataan kebutuhan
guru dengan menggunakan algoritma nearest neighbor
2. Untuk merancang model algoritma klasifikasi pemerataan kebutuhan
guru dengan menggunakan algoritma C4.5
3. Membandingkan akurasi algoritma nearest neighbor dan algoritma
C4.5 untuk pemerataan kebutuhan guru
4
D. Manfaat Penelitian
Adapun manfaat dari penelitian ini adalah:
1. Dapat mengetahui keadaan kebutuhan guru pada sekolah-sekolah.
2. Dapat membantu pemerintah daerah untuk mendapatkan informasi
dalam penyaluran tenaga guru ke sekolah-sekolah.
3. Sebagai referensi bagi peneliti lain untuk pengembangan sistem
selanjutnya.
E. Ruang Lingkup Penelitian
Memperhatikan semua pemaparan sebelumnya dan untuk memberi
batasan jelas dalam penelitian ini, maka ruang lingkup penelitian ini
hanya meliputi:
1. Pengambilan data dilakukan pada Dinas Pendididikan Nasional Kota
Makassar dan Dinas Pendidikan Nasional pada Kabupaten Maros.
2. Data guru yang akan dijadikan input adalah guru dengan status
Pegawai Negeri Sipil.
3. Klasifikasi data guru menggunakan algoritma nearest neighbor dan
algoritma C4.5.
4. Aplikasi dibuat menggunakan bahasa pemrograman berbasis web
menggunakan PHP.
5
BAB II
TINJAUAN PUSTAKA
A. Landasan Teori dan Konsep
1. Konsep Dasar Data Mining
1.1 Data Mining
Data mining adalah suatu istilah yang digunakan untuk menguraikan
penemuan pengetahuan di dalam database. Data mining adalah proses
yang menggunakan teknik statistik, matematika, kecerdasan buatan dan
machine learning untuk mengekstraksi dan mengindentifikasi informasi
yang bermanfaat dan pengetahuan yang terkait dari berbagai database
besar [3].
Data mining merupakan analisis dari peninjauan kumpulan data
untuk menemukan hubungan yang tidak terduga dan meringkas data
dengan cara yang berbeda dengan sebelumnya, yang dapat dipahami dan
bermanfaat bagi pemilik data [3].
Secara umum pengukuran model data mining mengacu kepada tiga
kriteria: Akurasi (Accuracy), Kehandalan (Reliability) dan Kegunaan
(Usefulness). Keseimbangan diantaranya ketiganya diperlukan karena
belum tentu model yang akurat adalah handal, dan yang handal atau
akurat belum tentu berguna [3].
Metode yang digunakan dalam data mining berupa metode
pembelajaran (supervised learning) dan metode tanpa pembelajaran
6
(UnSupervised learning). Metode pembelajaran meliputi peran estimasi,
prediksi, klasifikasi dan asosiasi sedangkan metode tanpa pembelajaran
meliputi klasterisasi [4].
1.2 Algoritma Nearest Neighbor
Algoritma nearest neighbor adalah pendekatan untuk mencari kasus
dengan menghitung kedekatan antara kasus baru dengan kasus lama,
yaitu berdasarkan pada pencocokan bobot dari sejumlah fitur yang ada
[3].
Gambar 2.1 Ilustrasi Kedekatan Kasus (Kusrini, 2009)
Rumus yang digunakan untuk menghitung kedekatan antara dua
kasus yaitu
….……………...(2.1)
Keterangan:
T : Kasus Baru S : Kasus yang ada dalam penyimpanan n : Jumlah atribut dalam setiap kasus
7
i : Atribut individu antara 1 sampai dengan n f : Fungsi similarity atribut i antara kasus T dan kasus S w : Bobot yang diberikan pada atribut ke-i
1.3 Algoritma C4.5
Algoritma C4.5 merupakan algoritma yang digunakan untuk
membentuk pohon keputusan. Algoritma ini merupakan metode klasifikasi
dan prediksi yang sangat kuat dan terkenal. Pohon keputusan berguna
untuk mengeksplorasi data, menemukan hubungan tersembunyi antara
sejumlah calon variabel input dengan variabel target. Ada 2 variabel yang
dipakai dalam menentukan akar dari pohon keputusan yaitu nilai entropy
dan nilai gain [3].
Secara umum algoritma C4.5 untuk membangun pohon keputusan
adalah sebagai berikut[3]:
a. Pilih atribut sebagai akar
b. Buat cabang untuk tiap-tiap nilai
c. Bagi kasus dalam cabang
d. Ulangi proses untuk setiap cabang sampai semua kasus pada
cabang memiliki kelas yang sama
Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi
dari atribut-atribut yang ada.
Nilai Entropy diperoleh dari rumus :
……………………(2.2)
8
Nilai Gain diperoleh dari rumus :
………….(2.3)
2. Konsep Guru
2.1 Defenisi Guru
Guru adalah pendidik profesional dengan tugas utama mendidik,
mengajar, membimbing, mengarahkan, melatih, menilai, dan
mengevaluasi peserta didik pada pendidikan anak usia dini jalur
pendidikan formal, pendidikan dasar, dan pendidikan menengah
(Peraturan Pemerintah Nomor 74, Tahun 2008, tentang Guru, Pasal 1,
ayat 1) [1].
2.2 Guru Mata Pelajaran
Guru mata pelajaran adalah guru yang mempunyai tugas, tanggung
jawab, wewenang, dan hak secara penuh dalam proses pembelajaran
Keterangan : S = Himpunan Kasus n = Jumlah partisi S pi = Proporsi dari Si terhadap S
Keterangan : S = Himpunan Kasus A = Atribut n = Jumlah partisi atribut A |Si| = Jumlah kasus pada partisi ke-i |S| = Jumlah kasus dalam S
9
pada 1 (satu) mata pelajaran tertentu pada satuan pendidikan formal pada
jenjang pendidikan dasar (SD/SDLB, SMP/SMPLB) termasuk guru mata
pelajaran pendidikan jasmani dan kesehatan, dan guru pendidikan agama
serta pendidikan menengah (SMA/SMALB/SMK)[1].
Peraturan Pemerintah Nomor 74 Tahun 2008 tentang Guru
menyebutkan bahwa guru memiliki beban kerja paling sedikit 24 (dua
puluh empat) jam tatap muka dan sebanyak-banyaknya 40 (empat puluh)
jam tatap muka perminggu[1].
2.3 Penataan Guru Pegawai Negeri Sipil
Penataan guru PNS adalah proses menata ulang agar rasio,
kualifikasi akademik, distribusi, dan komposisi guru PNS sesuai dengan
kebutuhan riil masing-masing satuan pendidikan [1].
2.4 Komposisi Guru
Komposisi guru adalah perbandingan jumlah guru dalam satuan
pendidikan sesuai dengan rombongan belajar atau mata pelajaran yang
diampu sesuai dengan kebutuhan riil masing-masing satuan pendidikan.
Suatu satuan pendidikan harus memiliki guru kelas, guru mata pelajaran,
guru bimbingan dan konseling atau konselor sesuai dengan kurikulum
tingkat satuan pendidikan [1].
2.5 Defenisi Rombongan Belajar
Rombongan belajar adalah kelompok peserta didik yang terdaftar
pada satu satuan kelas (Peraturan Menteri Pendidikan Nasional Nomor 24
Tahun 2007).
10
2.6 Rumus Perhitungan Kebutuhan Guru SMA
Adapun formula perhitungan kebutuhan guru SMA berdasarkan
petunjuk teknis surat keputusan bersama lima menteri, yaitu:
…………………(2.4)
Keterangan :
KG = Kebutuhan Guru
JTM = Jumlah tatap muka per jenis guru per minggu
MP = Alokasi jam mata pelajaran per minggu pada mata
pelajaran tertentu di satu tingkat
∑K = Jumlah kelas pada suatu tingkat yang mengikuti mata
pelajaran tertentu
24 = Wajib mengajar per minggu, digunakan angka 24
1,2,3 = Tingkat/kelas 1, 2 dan 3
3. Unified Modelling Language (UML)
Pemodelan (modelling) adalah suatu tahapan dalam proses
perancangan sebuah perangkat lunak sebelum melakukan proses
pengkodean (coding). Model bisa dianalogikan dengan pembuatan
blueprint pada pembangunan sebuah gedung. Dengan menggunakan
model, diharapkan pengembangan perangkat lunak dapat memenuhi
semua kebutuhan pengguna dengan lengkap dan tepat.
Unified Modelling Language (UML) adalah sebuah “bahasa” yang
telah menjadi standard untuk visualisasi, merancang dan
11
mendokumentasikan sistem piranti lunak. Dengan UML dapat dibuat
model untuk semua jenis aplikasi perangkat lunak yang nantinya aplikasi
tersebut mampu berjalan pada perangkat keras, sistem operasi dan
jaringan apapun (multi platform) serta dapat ditulis dalam bahasa program
apapun.
B. Tinjauan Hasil Penelitian Terkait
Ada beberapa penelitian terdahulu yang meneliti tentang guru
menggunakan data mining antara lain :
1. Klasterisasi kompetensi guru menggunakan hasil penilaian portofolio
sertifikasi guru dengan metode data mining. Ari Kurniawan,
Mochamad Hariadi [5], S2 Teknik Elektro (Telematika) , Institut
Teknologi Sepuluh Nopember Surabaya. Penelitian ini menerapkan
proses data mining untuk pengolahan nilai portofolio guru dengan
metode K-mean clustering untuk mengelompokan kompetensi guru
yang relatif homogeny.
2. Pemetaan Pendidikan (Education Mapping) Sebagai Dasar
Meningkatkan Layanan Pendidikan. Oleh Priadi Surya [6] Universitas
Negeri Yogyakarta dimuat dalam Makalah ICEMAL (International
Conference Educational Management, Administration and
Leadership), 4-5 Juli 2012 di Malang. Jawa Timur. Indonesia.
Penelitian ini difokuskan pada Penulis mengembangkan konsep
pemetaan pendidikan dari konsep pemetaan sekolah. Berbagai aspek
pendidikan dalam ruang lingkup sekolah dibawa ke ranah yang lebih
12
luas. Baik dalam hal ruang lingkup kajian maupun luasan wilayah yang
dibahas. Pemetaan pendidikan ini mengadopsi dan mengadaptasi
konsep pemetaan dari ilmu geografi.
3. Pemetaan mutu pendidik dan tenaga kependidikan berbasis spasial.
Oleh Hukmiah Arif [7], S2 Teknik Elektro (Teknik Informatika)
Penelitian ini bertujuan mengetahui peta kondisi pendidik dan tenaga
kependidikan berbasis spasial berdasarkan kualitas dan kuantitas.
Penelitian ini dilaksanakan di satu kecamatan Rappocini Kota
Makassar, dengan mengambil sekolah tingkat TK, SD, SMP dan SMA.
Adapun hasil penelitian menunjukkan bahwa dengan sistem database
geografis dapat memuat lokasi sekolah di dalam peta, identitas
sekolah, identitas pendidik dan tenaga kependidikan secara detail.
4. Sistem pendukung keputusan berbasis sms untuk menentukan status
gizi dengan metode k-nearest neighbor oleh Ninki Hermaduanti, Sri
Kusumadewi [8]. Jurusan Teknik Informatika, Fakultas Teknologi
Industri Universitas Islam Indonesia. Metode K-nearest neighbor
merupakan metode klasifikasi yang dapat digunakan untuk
menentukan status gizi seseorang berdasarkan data-data yang telah
diperoleh sebelumnya. Teknologi sms dapat dimanfaatkan untuk
mengembangkan sistem sesuai yang dibutuhkan dengan
memperhatikan aspek kecepatan dan biaya dengan kinerja sistem
mencapai 90,41%.
13
5. Perbandingan metode nearest neighbor dan algoritma C45 untuk
menganalisis kemungkinan pengunduran diri calon mahasiswa di
STMIK AMIKOM Yogyakarta, oleh Kusrini, Sri Hartati, Retantyo
Wardoyo, Agus Harjoko [9] dari STMIK AMIKOM Yogyakarta,
dipublikasikan pada Jurnal DASI Vol. 10 No. 1 Maret 2009, ISSN:
1411-3201. Penelitian ini menitikberatkan perbandingan klasifikasi dan
tingkat akurasi dari algoritma Nearest Neighbor dan algoritma C4.5
untuk pengambilan keputusan dalam proses kemungkinan calon
mahasiswa mengundurkan diri pada STMIK AMIKOM Yogyakarta.
6. Klasifikasi Data Nasabah sebuah Asuransi menggunakan Algoritma
C4.5, oleh Sunjana [10], Universitas Widyatama, dipublikasikan pada
Seminar Nasional Aplikasi Teknologi Informasi 2010 (SNATI 2010),
Yogyakarta, 19 Juni 2010. Penelitian ini difokuskan pada
pengelompokan nasabah ke kelas lancer dan kelas tidak lancer
menggunakan algoritma C4.5. Hasilnya digunakan oleh asuransi
untuk memprediksi nasabah baru yang mau bergabung.
7. Data Mining untuk klasifikasi pelanggan dengan Ant Colony
Optmization oleh Maulani Kapiudin [11] Jurusan Teknik Informatika
Fakultas Teknologi Industri Universitas Kristen Petra, yang dimuat
pada paper informatika Petra. Penelitian difokuskan pada sistem
klasifikasi potensial customer di desain dengan melakukan ekstrak
rule berdasarkan klasifikasi dari data mentah dengan criteria tertentu.
14
Proses pencarian menggunakan database pelanggan dari suatu Bank
dengan teknik data mining dengan ant colony optimization. Dilakukan
percobaan dengan min_case_per_rule variety dan phenomone
updating pada periode waktu tertentu. Hasilnya adalah sekelompok
class pelanggan yang didasarkan dari rules yang dibangun dengan
ant dan di modifikasi dengan phenomone updating, area
permasalahan menjadi melebar. Memberikan informasi mengenai
potensi pelanggan dari Bank sehingga dapat diklasifikasikan dengan
protoptype dari software.
Penelitian-penelitian diatas memang belum mencakup keseluruhan
penelitian yang mungkin pernah dilakukan sebelumnya dikarenakan
keterbatasan penulis dalam mencari literatur.
15
C. Kerangka Konseptual
Untuk lebih memperjelas kerangka pikir yang akan disajikan, maka
digambarkan dalam bentuk diagram sebagai berikut:
Gambar 2.2 Bagan Kerangka Konseptual
Permasalahan dalam dunia pendidikan yaitu kurangnya tenaga guru, guru yang mengajar tidak sesuai dengan latar belakang pendidikan (mismatch), kualifikasi rendah, disparitas kompetensi, dan penyaluran guru tidak merata
Solusi yang ditawarkan yaitu membangun aplikasi sistem data mining yang dapat menganalisa kebutuhan guru pada suatu sekolah sehingga dapat diketahui apakah kebutuhan guru lebih, cukup atau kurang pada suatu sekolah
Cara untuk mendapatkan solusi yaitu mengolah data set guru menggunakan model klasifikasi dengan menggunakan algoritma metode nearest neighbor dan algoritma C4.5. Adapun untuk pengujian menggunakan pengujian black box dan pengujian akurasi
Dengan demikian diharapkan hasil penelitian ini nantinya dapat menjadi salah satu bahan acuan pemerintah daerah dalam pengambilan keputusan untuk memberikan kebijakan dalam penyaluran tenaga guru sesuai dengan kebutuhan guru di masing-masing sekolah sehingga dapat meningkatkan kualitas pendidikan.
16
BAB III
METODE PENELITIAN
A. Tahapan Rancangan Penelitian
Gambar 3.1 Tahapan Rancangan Penelitian
Adapun gambar 3.1 merupakan tahapan rancangan penelitian yang
dilakukan dimulai dari tahapan analisis kebutuhan, perancangan,
implementasi sistem dan pengujian sistem.
1. Tahap Analisis Kebutuhan
Pada tahap ini akan dilakukan analisis kebutuhan dan spesifikasi
(Requirement Analysis and Spesification) atas masalah yang akan
diselesaikan. Dimulai dengan mengindentifikasi data set guru yang
meliputi data sekolah, data guru, data mata pelajaran, data rombongan
belajar pada masing-masing sekolah.
Data set guru Analisis data set guru dan
perancangan menggunakan algoritma nearest neighbor
& C4.5
Pengujian sistem
Implementasi sistem
Kebutuhan guru
17
2. Tahap perancangan sistem
2.1 Pada tahap ini dilakukan perancangan perangkat lunak umumnya
dalam melakukan perancangan sistem digunakan diagram Unified
Modelling Language (UML) untuk menggambarkan desain sistem
yang akan dirancang. Berikut ini beberapa diagram yang akan
menjelaskan tentang sistem yang akan dirancang. Pada penelitian
ini, Unified Modelling Language (UML) terdiri dari diagram use
case, activity diagram dan class diagram.
A. Use case diagram
Use case diagram menggambarkan fungsionalitas yang diharapkan
dari sebuah sistem. Sebuah use case mempresentasikan sebuah
interaksi antara aktor dengan sistem. Diagram use case dari sistem
terdapat pada gambar 3.2 di bawah ini :
Admin
Input data training
Proses Nearest Neighbor
Input data testing
Proses C4.5
Informasi data testing
User
Gambar 3.2 Use case diagram
18
Pada gambar 3.2 diagram use case ada dua aktor utama yaitu admin
dan user. Kedua actor dapat melakukan Input data training, yaitu
menginput, menambah, merubah dan menghapus data training yang
selanjutnya akan di training. Input data testing, yaitu proses menginput
data testing yang akan di proses dengan algoritma nearest neighbor dan
algoritma c4.5.
B. Activity diagram
Activity diagram menggambarkan berbagai alur aktivitas dalam sistem
yang sedang dirancang, bagaimana masing-masing alur berawal, decision
yang mungkin terjadi dan bagimana mereka berakhir. Diagram Activity dari
sistem terdapat pada gambar 3.3 dibawah ini :
Tampil Halaman Utama
Pilih Menu Data Training
Tampil From Input Data Training
Masukkan Data
Gambar 3.3 Activity diagram
19
C. Class diagram
Class diagram menggambarkan keadaan (atribut/properti) suatu sistem
sekaligus menawarkan layanan untuk memanipulasi keadaan
metode/fungsi. Class diagram menggambarkan struktur dan deskripsi
class, package dan objek beserta hubungan satu sama lain. Diagram
Activity dari sistem terdapat pada gambar 3.4 dibawah ini :
survei
+id+kode sekolah+tipe sekolah+kode mata pelajaran+jumlah guru+kebutuhan guru
+setID()+inputdatasurvei()
matapelajaran
+id+kode mata pelajaran+nama mata pelajaran
+setID()+inputdata()
sekolah
+id+kode sekolah+nama sekolah+alamat
+get sekolah()
guru
+id+nip+nama+alamat
+setID()+inputdataguru()
nearest neighbor
+kode sekolah+tipe sekolah+kebutuhan guru
+get kode sekolah()+hitung nilai kedekatan()+function_nn()
algoritma c4.5
+kode sekolah+tipe sekolah+kebutuhan guru
+get kode sekolah()+hitung entropi()+hitung gain()+function_c45()
Gambar 3.4 Class Diagram
20
2.2 Perancangan flowchart Algoritma
a. Proses klasifikasi algoritma nearest neighbor
Langkah-langkah dalam proses klasifikasi metode nearest neighbor
1. Dimulai dengan menginput data set guru
2. Melakukan proses perhitungan similarity atau nilai kedekatan kedua
kasus sesuai pada persamaan 2.1
3. Menampilkan output kebutuhan guru
4. Proses selesai
Untuk lebih jelasnya dapat dilihat pada gambar 3.5 Flowchart klasifikasi
metode nearest neighbor
Gambar 3.5 Flowchart klasifikasi metode nearest neighbor
Mulai
Dataset set guru
Hitung similarity
Output kebutuhan guru
Selesai
21
b. Proses Klasifikasi Algoritma C4.5
Adapun langkah-langkah proses pembentukan pohon keputusan
dengan Algoritmma C4.5 antara lain, yaitu :
1. Dimulai menginput data training
2. Menentukan Entropy seusai dengan persamaan 2.2, dari semua
kasus
3. Setelah itu, lakukan perhitungan Gain sesuai persamaan 2.3 untuk
setiap atribut.
4. Dari hasil perhitungan dapat diketahui bahwa atribut dengan Gain
tertinggi yang kemudian akan menjadi node akar yang akan
membentuk pohon.
5. Atribut yang sudah mengklasifikasikan kasus menjadi 1 kelas yaitu
dilakukan perhitungan lebih lanjut, tetapi untuk nilai atribut yang
terklasifikasi 2 kelas maka masih perlu dilakukan perhitungan lagi.
6. Dari hasil tersebut dapat digambarkann pohon keputusan sementara.
7. Kemudian dilakukan perhitungan lagi seperti pada langkah 1 sampai
dengan 5, hingga diketahui bahwa semua kasus sudah masuk dalam
satu salah satu kelas dan akan terbentuk pohon keputusan yang
terakhir. Untuk lebih jelasnya dapat dilihat pada gambar 3.6 Flowchart
klasifikasi algoritma C4.5.
22
Gambar 3.6 Flowchart Klasifikasi Algoritma C4.5.
Mulai
Input Data Training
Hitung Entropy dan Gain dari tiap atribut
Buat simpul Akar Pohon berdasarkan Informasi Gain
terbesar
Hitung Entropy dan information Gain dari tiap Atribut dengan
menghilangkan Atribut yang telah dipilih sebelumnya
Buat simpul Internal Pohon Berdasarkan Information Gain
Semua Atribut sudah Masuk pada Pohon ?
Generate aturan keputusan
Selesai
Lakukan pemangkasan pohon
Y
T
23
3. Tahap Implementasi Sistem
Tahap implementasi sistem atau proses coding merupakan proses
penerjemahan dari perancangan sistem.
4. Tahap Pengujian Sistem
Tahap pengujian sistem atau evaluasi menggunakan metode
pengujian yang digunakan pada penelitian ini terdiri dari pengujian black
box dan pengujian akurasi. Pada pengujian fungsional akan
menggunakan metode pengujian black box, metode pengujian black box
memfokuskan pada keperluan fungsional dari perangkat lunak. Oleh
karena itu, pengujian dengan metode black box memungkinkan untuk
membuat himpunan kondisi input yang akan melatih seluruh syarat-syarat
fungsional suatu program.
B. Jenis Penelitian
Penelitian ini merupakan penelitian historis dengan menggunakan
metode eksperimental yaitu dengan melakukan perancangan dan
pembuatan model sistem. Pengumpulan data dilakukan dengan metode
studi pustaka (library research) dan metode pengumpulan data lapangan
(field research) dan pembuatan aplikasi berdasarkan analisis hasil dari
metode data mining yakni algoritma nearest neighbor dan algoritma C4.5.
24
C. Arsitektur Sistem
Client
Gambar 3.7 Arsitektur Sistem
Arsitektur perangkat lunak terdiri dari Data base yang berfungsi
untuk menampung data berupa file data set guru dengan menggunakan
MySQL. Selanjutnya terdapat Aplikasi Web dimana aplikasi web yang
digunakan disini yaitu bahasa pemrograman PHP, Javascript, HTML,
jquery dan CSS serta Macromedia Dreamweaver sebagai editor untuk
membangun listing. Serta terdapat Server Web yang merupakan sebuah
program yang dijalankan pada Komputer server, yang bertugas
menjalankan jasa layanan web kepada komputer-komputer client yang
terhubung kepadanya. Penelitian ini menggunakan Appserv sebagai web
server.
D. Alat dan Bahan
Spesifikasi kebutuhan yang digunakan dalam mengimplementasikan
sistem ini adalah sebagai berikut :
1. Spesifikasi Hardware
a. PC / Notebook : Processor Core i3, RAM 4 Gb, Harddisk 500 GB.
b. Mouse
c. Keyboard
Response
Request
25
2. Spesifikasi Software
a. Microsoft Windows 7
b. PHP
c. Macromedia dreaweaver
d. Microsoft SQL Server
e. Web browser
f. Star UML
E. Lokasi dan Waktu Penelitian
Penelitian ini dilakukan di laboratorium Teknik Informatika Universitas
Hasanuddin dengan mengambil data guru di kantor Pendidikan Nasional
Kota Makassar dan kantor Pendidikan Nasional Kabupaten Maros
Propinsi Sulawesi Selatan. Penelitian dilakukan selama 4 bulan, dimulai
sejak di setujui proposal penelitian.
26
BAB IV
HASIL PENELITIAN DAN PEMBAHASAN
A. Gambaran Umum Sistem
Gambaran umum sistem yang akan dikembangkan pada penelitian ini
dapat dilihat pada gambar 4.1 di bawah ini :
Gambar 4.1 Gambaran umum sistem
Data set guru ini nantinya akan diinput ke dalam suatu sistem
perangkat lunak database. Data guru yang sudah diinput akan menjadi data
training dan disimpan dalam database. Selanjutnya data tersebut diolah
menggunakan sistem perangkat lunak pendukung keputusan dengan
teknologi data mining menggunakan algoritma nearest neighbor yaitu
menentukan kedekatan kasus atau tetangga terdekat dan algoritma C4.5
dengan pohon keputusan.
Data set Guru
Sistem
perangkat lunak
database
Sistem perangkat
lunak pendukung keputusan
dengan teknologi
data mining
Kebutuhan guru
Input Output
Proses
27
Dari hasil pengolahan tersebut didapatkan informasi kebutuhan guru
pada setiap sekolah seperti pada gambar 4.2 di bawah ini :
Gambar 4.2 Proses Klasifikasi Data
Pada gambar 4.2 proses klasifikasi data terlihat bahwa data training
diproses menggunakan dua algoritma yang berbeda, yaitu algoritma Nearest
Neighbor dengan menentukan kedekatan kasus atau tetangga terdekat dan
algoritma C4.5 menggunakan pohon keputusan. Dari kedua metode ini akan
menghasilkan kaidah kebutuhan guru pada tiap sekolah. Melakukan
perbandingan metode nearest neighbor dan c4.5 dengan membandingkan
hasil prediksi algoritma nearest neighbor dan algoritma C4.5 untuk
pemerataan kebutuhan guru dengan data asli yang bersumber pada dinas
pendidikan nasional.
Kebutuhan Guru
Data Training (Data set
guru)
Metode Nearest Neigbor
Algoritma C4.5 Kebutuhan Guru
28
B. Hasil Analisis dan Pembahasan
1. Penerapan algoritma nearest neighbor
Algoritma nearest neighbor adalah pendekatan untuk mencari kasus
dengan menghitung kedekatan antara kasus baru dengan kasus lama.
Tabel 4.1 Kasus
Keterangan :
a : Alokasi Jam b : Guru Mapel c1 : Jumlah Rombel 1 c2 : Jumlah Rombel 2 c3 : Jumlah Rombel 3
NO SEKOLAH MAPEL ALOKASI JAM (a)
GURU MAPEL
(b)
JUMLAH ROMBEL
1 (c1)
2 (c2)
3 (c3)
1 SMA NEG 1 AGAMA ISLAM 2 2 6 6 6
PPKN 2 3 6 6 6
BAHASA INDONESIA 4 2 6 6 6
BAHASA INGGRIS 4 5 6 6 6
MATEMATIKA 4 3 6 6 6 2 SMA NEG 2 AGAMA ISLAM 2 2 6 6 6
PPKN 2 3 6 6 6
BAHASA INDONESIA 4 2 6 6 6
BAHASA INGGRIS 4 2 6 6 6
MATEMATIKA 4 4 6 6 6
29
Untuk memprediksi apakah alokasi waktu cukup, kurang atau lebih
untuk setiap sekolah dan masing-masing mata pelajaran pada tabel kasus,
tabel 3.1 maka dilakukan langkah-langkah berikut :
Untuk mata pelajaran agama Gunakan rumus similarity pada
similarity =
=
= 1.5
Dari Perhitungan similarity didapatkan nilai alokasi waktu untuk mata
pelajaran agama adalah 1.5, untuk nilai alokasi waktu 1.5 perhatikan nilai
atribut untuk guru mata pelajaran agama pada tabel 4.1, nilai atribut tersebut
adalah 2.
Lakukan perhitungan similarity selanjutnya untuk mata pelajaran
PPKN, Bahasa Indonesia, Bahasa Inggris dan Matematika pada masing-
masing sekolah sesuai dengan kasus pada tabel 4.1. Hasil perhitungan
tersebut dapat ditunjukkan pada tabel 4.2.
30
Tabel 4.2 Hasil perhitungan Similarity dan Output
NO SEKOLAH MAPEL ALOKASI JAM
GURU MAPEL
JUMLAH ROMBEL SIMI
LARITY OUTPUT 1 2 3
1 SMA NEG 1 AGAMA ISLAM 2 2 6 6 6 1.5 Lebih
PPKN 2 3 6 6 6 1.5 Lebih
BAHASA INDONESIA 4 2 6 6 6 3 Kurang
BAHASA INGGRIS 4 5 6 6 6 3 Lebih
MATEMATIKA 4 3 6 6 6 3 Cukup 2 SMA NEG 2 AGAMA ISLAM 2 2 6 6 6 1.5 Lebih
PPKN 2 3 6 6 6 1.5 Lebih
BAHASA INDONESIA 4 2 6 6 6 3 Kurang
BAHASA INGGRIS 4 2 6 6 6 3 Kurang
MATEMATIKA 4 4 6 6 6 3 Lebih
Hasil output pada tabel 4.2 dihasilkan menggunakan aturan sebagai berikut :
a. Jika Nilai atribut pada guru mata pelajaran lebih besar daripada hasil
perhitungan alokasi waktu maka nilai output adalah Lebih
b. Jika Nilai atribut pada guru mata pelajaran lebih kecil daripada hasil
perhitungan alokasi waktu maka nilai output adalah kurang.
c. Jika nilai atribut guru mata pelajaran sama dengan hasil perhitungan
alokasi waktu maka nilai output adalah cukup.
Pada tabel 4.2 juga merupakan tabel informasi mengenai alokasi
waktu untuk sekolah pada tiap mata pelajaran sehingga memperoleh input
apakah alokasi lebih, kurang atau cukup berdasarkan perhitungan Nilai
31
similarity atau jarak terdekat, kemudian membandingkan nilai similarity
dengan guru mata pelajaran. Jika nilai similarity besar dibandingkan nilai guru
mata pelajaran maka kurang, dan jika nilai similarity kecil dibandingkan nilai
guru mata pelajaran maka lebih dan jika nilai similarity sama dengan nilai
guru mata pelajaran maka cukup.
Jadi untuk contoh kasus SMU Negeri 3 dengan inputannya :
Sekolah : SMU Negeri 3
Mapel : Agama Islam
Alokasi Jam : 2
Guru Mapel : 4
Jumlah Rombel 1, 2 dan 3 masing-masing : 3, 4, 3
Setelah dilakukan perhitungan similarity maka diperoleh nilai alokasi waktu
adalah 2.5 dengan output lebih.
2. Penerapan Algoritma C4.5
Secara umum algoritma C4.5 untuk membangun pohon keputusan
memilih atribut sebagai akar dan membuat cabang-cabang untuk tiap-tiap
nilai. Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi
dari atribut-atribut yang ada. Untuk menghitung gain digunakan rumus seperti
tertera dalam persamaan 1 dan perhitungan nilai entropy. Berikut contoh
kasus pada tabel 4.3. untuk menentukan output kebutuhan guru.
32
Tabel. 4.3 Kasus Kebutuhan Guru (sumber: Dinas Pendidikan
Nasional Kota Makassar)
Sekolah No Mata Pelajaran Kebutuhan Guru
Jumlah Guru Output
SMU Negeri 2 1 Agama Islam Lebih lebih kurang
2 Bahasa Indonesia Cukup Kurang Kurang
3 PPKN Cukup kurang cukup
4 Bahasa Inggris Lebih kurang kurang
5 Matematika cukup lebih lebih
6 Biologi cukup lebih lebih
Dalam kasus yang tertera pada Tabel 4.3. akan dibuat pohon keputusan
untuk menentukan apakah kebutuhan guru bernilai lebih, cukup atau kurang
dengan langkah-langkahnya adalah sebagai berikut :
Langkah 1. Memilih atribut sebagai akar
Untuk memilih atribut sebagai akar, didasarkan pada gain tertinggi dari
tertinggi dari atribut-atribut yang ada. Untuk menghitung gain digunakan
rumus seperti tertera pada persamaan 2.3 sebelumnya dan perhitungan nilai
entropy seperti tertera dalam persamaan 2.2.
33
Langkah 2. Perhitungan level 0
Menghitung Jumlah kasus untuk kebutuhan guru yang kurang, cukup
dan lebih dan entropy untuk semua kasus dan kasus yang dibagi
berdasarkan atribut kebutuhan guru dan jumlah guru. Setelah itu lakukan
perhitungan Gain untuk setiap atribut. Hasil Perhitungan ditunjukkan pada
tabel 4.4 perhitungan level 0.
Tabel 4.4. Perhitungan level 0
Atribut Nilai atribut
Jumlah kasus
Jumlah lebih
Jumlah cukup
Jumlah kurang Entropy Gain
6 2 1 3 0.187635764
Kebutuhan Guru 0.520969097
lebih 2 0 0 2 0
cukup 4 2 1 1 0.5
kurang 0 0 0 0 0
Jumlah Guru 0.187635764
kurang 3 0 1 2 0
lebih 3 2 0 1 0
Dari tabel 4.4. dapat diketahui bahwa atribut dengan gain tertinggi
adalah Kebutuhan Guru dengan demikian maka kebutuhan guru dapat
menjad level akar. Ada tiga nilai atribut dari kebutuhan guru yaitu lebih,
kurang dan cukup. Nilai atribut dari kurang tidak terdapat pada kasus dan
bernilai 0. Jadi hanya dilakukan perhitungan lebih lanjut untuk nilai atrbut
lebih dan cukup, nilai atribut lebih sudah mengklasifikasikan menjadi 1 kelas
sehingga tidak dilakukan peritungan lebih lanjut dan atribut cukup akan
34
dilakukan perhitungan. Dari hasil tersebut digambarkan pohon keputusan
sementara seperti pada gambar 4.3.
Gambar 4.3. Pohon keputusan Level 0
Menghitung jumlah kasus untuk menetukan kebutuhan guru kurang, lebih
dan cukup dan entropy dari semua kasus dan kasus yang dibagi
berdasarkan atribut jumlah guru yang dapat menjadi nilai akar dari nilai
atribut cukup. Hasil perhitungan terdapat pada tabel 4.5
Tabel 4.5. Perhitungan Level 1.1
Atribut Nilai atribut
Jumlah kasus
Jumlah lebih
Jumlah cukup
Jumlah kurang Entropy Gain
Kebutuhan Guru –cukup 4 2 1 1 0.125
Jumlah Guru
kurang 2 0 1 1 0
lebih 2 2 0 0 0
Kebutuhan Guru
Lebih Cukup
1.2 ?
kurang
35
Dari hasil tabel 4.5 perhitungan level 1.1 dapat dibuatkan gambar
pohon keputusannya. Adapun gambar pohon keputusan dapat dilihat pada
gambar 4.4 pohon keputusan level 1.
Gambar 4.4 Pohon keputusan level 1
Gambar 4.4 merupakan pohon keputusan yang terakhir karena masing
masing nilai atribut sudah mengklasifikasikan kelasnya dan kasus menjadi
satu. Aturan yang dibentuk dari algoritma C4.5 adalah :
1. Jika kebutuhan guru ebih maka output adalah kurang.
2. Jika kebutuhan guru cukup dan jumlah guru lebih maka output adalah
lebih.
3. Jika kebutuhan guru cukup dan jumlah guru kurang maka output adalah
cukup.
Lebih Cukup
Kebutuhan Guru
Jumlah Guru
kurang
Lebih Kurang
lebih Cukup
36
C. User Interface
Sistem yang dirancang terdiri dari beberapa interface yang digunakan
untuk melakukan proses penginputan data yang dibutuhkan dalam proses
sistem pendukung keputusan sehingga menghasilkan informasi yang optimal.
Adapun user interface dari sistem yang dirancang adalah :
1. Form input data
a. Input Data Sekolah
Gambar 4.5 Form input data sekolah
Form input data sekolah untuk menginput kode, nama sekolah, alamat dan
nomor telepon sekolah. Data sekolah yang telah di input kemudian akan di
simpan pada database.
37
b. Input Data Mata Pelajaran
Gambar 4.6 Form Input Data Mata Pelajaran
Form input data mata pelajaran untuk menginput kode mata pelajaran, nama
mata pelajaran, alokasi waktu belajar, semester dan tahun. Data mata
pelajaran yang telah di input kemudian akan di simpan pada database.
c. Input pilihan algoritma
Gambar 4.7 Form Input Pilihan Algoritma
38
Form input pilihan algoritma untuk memilih algoritma nearest neighbor
atau algoritma c4.5. Jika dipilih algoritma C4.5, maka akan muncul pilihan
nama sekolah yang akan dihitung kebutuhan gurunya tiap mata pelajaran
seperti pada gambar 4.9 dan akan menghasilkan output sistem seperti pada
gambar 4.10 :
Gambar 4.8 Form Proses Algoritma C4.5
Gambar 4.9 Output Sistem Algoritma C4.5
39
Form input pilihan algoritma untuk memilih algoritma nearest neighbor atau
algoritma c4.5. Jika dipilih algoritma nearest neighbor, maka akan muncul
pilihan nama sekolah yang akan dihitung kebutuhan gurunya tiap mata
pelajaran seperti pada gambar 4.11 dan akan menghasilkan output sistem
seperti pada gambar 4.10 :
Gambar 4.10 Form Proses Algoritma Nearest Neighbor
Gambar 4.11 Output Sistem Nearest Neighbor
40
D. Pengujian Sistem
Metode pengujian sistem yang digunakan adalah pengujian black box
dan pengujian akurasi. Pengujian black box digunakan untuk pengujian
fungsional sedangkan pengujian akurasi menguji keakuratan dari sistem dan
hasil prediksi dan hasil prediksi yang dihasilkan dengan data yang
sesungguhnya.
1. Pengujian Black Box
Metode pengujian black box memfokuskan pada keperluan
fungsional dari perangkat lunak. Uji coba black box memungkinkan
pengembangan perangkat lunak untuk membuat himpunan kondisi input
yang akan melatih seluruh syarat-syarat fungsional program. Adapun hasil
dari pengujian digambarkan seperti tabel 4.6 dibawah ini
Tabel 4.6. Pengujian Penginputan Mata Pelajaran
No Nama Form
yang diuji Skenario Pengujian
Hasil yang diharapkan
Hasil pengujian
1. Form Mata
Pelajaran
Tombol simpan
Ketika memasukkan data kode mata pelajaran, dan
nama pada textbox kemudian menekan
tombol simpan, maka data tersebut
akan tersimpan dalam database.
[ ] Diterima [ ] Ditolak
41
Screen Shoot
Setelah menekan tombol simpan
2. Form Mata
Pelajaran Tombol edit
Ketika tombol edit diklik maka akan ditampilkan form
mata pelajaran yang akan diedit,
sehingga data yang sudah ada
seelumnya atau sudah tersimpan
sebelumnya dapat diedit, atau diubah kemudian diproses dan simpan kembali kedalam database.
[ ] Diterima [ ] Ditolak
42
Screen Shoot
Setelah menekan tombol edit
Setelah menekan tombol simpan
3. Form Mata
Pelajaran
Tombol hapus
Ketika menekan tombol hapus, maka
akan muncul pernyataan bahwa data akan dihapus. Ketika menekan OK
yang tersimpan dalam database
langsung terhapus
[ ] Diterima [ ] Ditolak
43
Screen Shoot
Sebelum menekan tombol hapus
Sebelum menekan tombol hapus
Setelah menekan Ya untuk di hapus
2. Pengujian akurasi
Pengujian akurasi merupakan pengujian keakuratan dari sistem dan hasil
prediksi yang dihasilkan dengan data yang sesungguhnya. Pengujian
44
akurasi dilakukan pada enam sekolah dengan dengan tiga mata pelajaran,
seperti yang tertera dalam tabel 4.7 pengujian akurasi.
Tabel 4.7 Pengujian Akurasi Algoritma Nearest Neighbor
No Nama Sekolah Mata Pelajaran Data Prediksi
Data Asli Prediksi Benar
1. SMA Negeri 1 Makassar
Agama Islam Lebih Lebih Benar Bahasa Indonesia Lebih Lebih Benar PPKn Lebih Lebih Benar
2. SMA Negeri 6 Makassar
Agama Islam Cukup Cukup Benar Bahasa Indonesia Cukup Lebih Salah PPKn Cukup Cukup Benar
3. SMA Negeri 20 Makassar
Agama Islam Lebih Lebih Benar Bahasa Indonesia Cukup Cukup Benar PPKn Kurang Cukup Salah
4. SMA Negeri 1 Maros
Agama Islam Kurang Cukup Salah Bahasa Indonesia Cukup Cukup Benar PPKn Cukup Cukup Benar
5. SMA Negeri 4 Bantimurung
Agama Islam Cukup Cukup Benar Bahasa Indonesia Lebih Lebih Benar PPKn Lebih Kurang Salah
6. SMA Negeri 7 Mallawa
Agama Islam Cukup Cukup Benar Bahasa Indonesia Kurang Kurang Benar PPKn Kurang Cukup Salah
Dari tabel 4.7 pengujian akurasi menggunakan algoritma nearest
neighbor yang terdiri inputan nama sekolah dan mata pelajaran, data
prediksi, data asli dan prediksi benar. Dari tabel 4.7 dapat dilihat bahwa
jumlah prediksi benar adalah 13 dari 18 data testing yang di uji dengan
inputan mata pelajaran. Jika data prediksi sesuai dengan data asli maka
bernilai benar, tetapi jika data prediksi tidak sesuai dengan data asli maka
bernilai salah. Dapat dihitung tingkat akurasi dari algoritma nearest neighbor
45
sehingga dapat digunakan sebagai acuan untuk memprediksi kebutuhan guru
pada setiap sekolah. Adapun hasil perhitungan akurasi :
Keakuratan = …………………..…..(4.1)
= 0.72 x 100%
= 72 %
Jumlah data yang akan di uji adalah 18 dengan jumlah kesalahan
adalah 5, maka hasil akurasi yang diperoleh adalah 72% sehingga dapat di
prediksi bahwa algoritma nearest neighbor yang digunakan untuk
memprediksi kebutuhan guru adalah akurat.
Tabel 4.8 Pengujian Akurasi Algoritma C4.5
No Nama Sekolah Mata Pelajaran Output/ Prediksi
Data Sebenarnya
Prediksi Benar
1. SMA Negeri 1 Makassar
Agama Islam Lebih Lebih Benar Bahasa Indonesia Lebih Lebih Benar PPKn Lebih Lebih Benar
2. SMA Negeri 6 Makassar
Agama Islam Cukup Cukup Benar Bahasa Indonesia Lebih Lebih Benar PPKn Cukup Cukup Benar
3. SMA Negeri 20 Makassar
Agama Islam Cukup Lebih Salah Bahasa Indonesia Cukup Cukup Benar PPKn Cukup Cukup Benar
4. SMA Negeri 1 Maros
Agama Islam Cukup Cukup Benar Bahasa Indonesia Kurang Cukup Salah PPKn Cukup Cukup Benar
5. SMA Negeri 4 Bantimurung
Agama Islam Cukup Cukup Benar Bahasa Indonesia Kurang Lebih Salah PPKn Kurang Kurang Benar
46
6. SMA Negeri 7 Mallawa
Agama Islam Cukup Cukup Benar Bahasa Indonesia Kurang Kurang Benar PPKn Cukup Cukup Benar
Dari tabel 4.8 pengujian akurasi menggunakan algoritma nearest neighbor
yang terdiri inputan nama sekolah dan mata pelajaran, data prediksi, data asli
dan prediksi benar. Dari tabel 4.8 dapat dilihat bahwa jumlah prediksi benar
adalah 15 dari 18 data testing yang di uji dengan inputan mata pelajaran.
Jika data prediksi sesuai dengan data asli maka bernilai benar, tetapi jika
data prediksi tidak sesuai dengan data asli maka bernilai salah. Dapat
dihitung tingkat akurasi dari algoritma C4.5 sehingga dapat digunakan
sebagai acuan untuk memprediksi kebutuhan guru pada setiap sekolah.
Adapun hasil perhitungan akurasi :
Keakuratan = …………………..…..(4.1)
= 0.83 x 100%
= 83 %
Jumlah data yang akan di uji adalah 18 dengan jumlah kesalahan adalah 3,
maka hasil akurasi yang diperoleh adalah 83% sehingga dapat di prediksi
bahwa algoritma C4.5 yang digunakan untuk memprediksi kebutuhan guru
adalah akurat.
47
Dari hasil perbandingan algoritma nearest neighbor dan algoritma
C4.5, dengan masing-masing nilai keakuratan 72% dan 83%, maka nilai
keakuratan C4.5 lebih besar sehingga hasil prediksi dari algoritma C4.5 lebih
akurat dibandingkan dengan algoritma nearest neighbor.
48
BAB V
PENUTUP
A. KESIMPULAN
Berdasarkan hasil penelitian yang telah dilakukan, maka dapat ditarik
beberapa kesimpulan sebagai berikut :
1. Model klasifikasi dari aloritma nearest neighbor dan C4.5 diperoleh
bahwa kebutuhan guru pada kota Makassar dan kabupaten Maros tidak
merata penyebarannya.
2. Dari hasil perbandingan algoritma nearest neighbor dan algoritma C4.5,
dengan masing-masing nilai keakuratan 72% dan 83%, maka nilai
keakuratan algoritma C4.5 lebih besar sehingga hasil prediksi dari
algoritma C4.5 lebih akurat dibandingkan dengan algoritma nearest
neighbor.
B. SARAN
Berdasarkan hasil penelitian yang telah dilakukan, maka dapat
disarankan beberapa hal sebagai berikut:
1. Pada penelitian ini peneliti menggunakan dua algoritma klasifikasi yaitu
metode nearest neighbor dan algoritma C4.5, untuk selanjutnya bisa
49
dilanjutkan dengan menggunakan jenis algoritma data mining yang
berbeda agar lebih bervariasi.
2. Dalam penelitian ini dibatasi data hanya untuk SMA Negeri, untuk
penelitian selanjutnya bisa dikembangkan penelitian ke SMA Swasta dan
SMK baik Negeri maupun Swasta.
3. Perlu dilakukan penelitian lebih lanjut tentang keadaan sekolah secara
keseluruhan meliputi keadaan siswa, sarana dan prasarana
menggunakan data mining.
DAFTAR PUSTAKA
[1] Petunjuk Teknis (Juknis) Pelaksanaan Peraturan Bersama Lima Menteri
tentang penataan dan Pemerataan Guru PNS, November 2011.
[2] Sanjaya, Wina. DR.M.Pd.2006. Pembelajaran Dalam Implementasi
Kurikulum Berbasis Kompetensi. Jakarta: Kencana.
[3] Kusrini, Emha T. Luthfi. “Algoritma Data Mining”. Penerbit ANDI, 2009
[4] Budi Santosa, “Data Mining Teknik Pemanfaatan Data untuk Keperluan
Bisnis”. Penerbit 2007.
[5] Ari Kurniawan, Mochamad Hariadi. “Klasterisasi kompetensi guru
menggunakan hasil penilaian portofolio sertifikasi guru dengan metode
data mining”. Jurnal Teknik Elektro (Telematika) , Institut Teknologi
Sepuluh Nopember Surabaya. [6] Priadi Surya. “Pemetaan Pendidikan (Education Mapping) Sebagai
Dasar Meningkatkan Layanan Pendidikan”. Universitas Negeri
Yogyakarta dimuat dalam Makalah ICEMAL (International Conference
Educational Management, Administration and Leadership), 4-5 Juli
2012.
[7] Hukmiah Arif. “Pemetaan Mutu Pendidik dan Tenaga Kependidikan
Berbasis Spasial”. Tesis Program Pasca Sarjana Universitas
Hasanuddin Makassar. 2011.
[8] Ninki Hermaduanti, Sri Kusumadewi. “Sistem Pendukung Keputusan
berbasis SMS untuk menentukan status gizi dengan metode k-nearest
neighbor”. Fakultas Teknologi Industri Universitas Islam Indonesia.
[9] Kusrini, Sri Hartati, Retantyo Wardoyo, Agus Harjoko “Perbandingan
metode Nearest Neighbor dan algoritma C45 untuk menganalisis
kemungkinan pengunduran diri calon mahasiswa di STMIK AMIKOM
Yogyakarta”, Yogyakarta, Jurnal DASI Vol. 10 No. 1 Maret 2009, ISSN:
1411-3201.
[10] Sunjana. “Klasifikasi Data Nasabah sebuah Asuransi menggunakan
Algoritma C4.5”. SNATI 2010 Yogyakarta, 19 Juni 2010.
[11] Maulani Kapiudin. “Data mining untuk klasifikasi pelanggan dengan Ant
Colony Optimization”. Jurusan Teknik Informatika Fakultas Teknologi
Industri Universitas Kristen Petra, yang dimuat pada paper informatika
Petra.
[12] Roger S. Pressman. “Rekayasa Perangkat Lunak Pendekatan Praktisi
(buku satu)”. Penerbit Andi Yogyakarta. 2002.
[13] Yuni Sugiarti. “Analisis dan Perancangan UML (Unified Modelling
Language) Generated VB.6”. Penerbit Graha Ilmu Yogyakarta. 2013.
top related