bab ii tinjauan pustakan 2.1.data mining

21
7 BAB II TINJAUAN PUSTAKAN 2.1.Data Mining Data mining merupakan metode yang digunakan untuk pengolahan data guna menemukan pola yang tersembunyi dari data yang diolah. Data yang diolah dengan teknik data mining ini kemudian menghasilkan suatu pengetahuan baru yang bersumber dari data lama dan hasil dari pengolahan data tersebut dapat digunakan dalam menentukan sebuah keputusan di masa depan. Data mining juga merupakan rangkaian kegiatan untuk menemukan pola yang menarik dari data dalam jumlah besar, kemudian data data tersebut dapat disimpan dalam database, data warehouse atau penyimpanan informasi (Sadewo, Windarto, & Andani, 2017). 2.1.1. Tahapan Data Mining Menurut (Fatmawati & Windarto, 2018) tahapan yang dilakukan pada proses data mining diawali dari seleksi data dari data sumber ke data target, tahap pre-processing untuk memperbaiki kualitas data, transformasi, data mining serta tahap interpretasi dan evaluasi yang menghasilkan output berupa pengetahuan baru yang diharapkan memberikan kontribusi yang lebih baik. Secara detail dijelaskan sebagai berikut:

Upload: others

Post on 03-Oct-2021

6 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: BAB II TINJAUAN PUSTAKAN 2.1.Data Mining

7

BAB II

TINJAUAN PUSTAKAN

2.1.Data Mining

Data mining merupakan metode yang digunakan untuk pengolahan data

guna menemukan pola yang tersembunyi dari data yang diolah. Data yang diolah

dengan teknik data mining ini kemudian menghasilkan suatu pengetahuan baru

yang bersumber dari data lama dan hasil dari pengolahan data tersebut dapat

digunakan dalam menentukan sebuah keputusan di masa depan. Data mining juga

merupakan rangkaian kegiatan untuk menemukan pola yang menarik dari data

dalam jumlah besar, kemudian data – data tersebut dapat disimpan dalam

database, data warehouse atau penyimpanan informasi (Sadewo, Windarto, &

Andani, 2017).

2.1.1. Tahapan Data Mining

Menurut (Fatmawati & Windarto, 2018) tahapan yang dilakukan pada

proses data mining diawali dari seleksi data dari data sumber ke data target, tahap

pre-processing untuk memperbaiki kualitas data, transformasi, data mining serta

tahap interpretasi dan evaluasi yang menghasilkan output berupa pengetahuan

baru yang diharapkan memberikan kontribusi yang lebih baik. Secara detail

dijelaskan sebagai berikut:

Page 2: BAB II TINJAUAN PUSTAKAN 2.1.Data Mining

8

Gambar 2.1.Tahapan Data Mining

(Sumber : Fatmawati & Windarto, 2018)

Berikut ini adalah penjelasan dari tahapan data mining berdasarkan gambar 2.1 :

1) DataSelection

Pemilihan atau seleksi data dari sekumpulan data operasional perlu

dilakukan sebelum tahap penggalian informasi dalam KDD atau Knowledge

Discovery from Data dimulai. Data hasil seleksi yang digunakan untuk proses

data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional.

2) Pre - Processing / Cleaning

Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses

cleaning pada data yang menjadi fokus KDD. Proses cleaning mencakup antara

lain membuang duplikasi data, memeriksa data yang inkonsisten, dan

memperbaiki kesalahan pada data.

3) Transformation

Coding adalah proses transformasi pada data yang telah dipilih, sehingga

data tersebut sesuai untuk proses data mining. Proses coding dalam KDD

Page 3: BAB II TINJAUAN PUSTAKAN 2.1.Data Mining

9

merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi

yang akan dicari dalam basis data.

4) Data Mining

Data mining adalah proses mencari pola atau informasi menarik dalam

data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode,

atau algoritma dalam data mining sangat bervariasi. Pemilihan metode atau

algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara

keseluruhan.

5) Interpretation / Evalution

Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan

dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini

mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan

dengan fakta atau hipotesis yang ada sebelumnya.

2.1.2. Aktivitas Data Mining

Menurut (Waworuntu & Amin, 2018) aktivitas data mining dapat dibagi

menjadi 6 yang berdasarkan tujuan dari analisis yaitu:

a) Estimasi

Estimasi mirip dengan klasifikasi, kecuali bahwa variabel target bersifat

numerik, bukan kategorikal.Model dibangun menggunakan "lengkap" catatan,

yang memberikan nilai dari variabel target serta prediktor.Kemudian, untuk

pengamatan baru, perkiraan nilai variabel target dibuat berdasarkan nilai- nilai

prediktor.

Page 4: BAB II TINJAUAN PUSTAKAN 2.1.Data Mining

10

b) Deskripsi

Terkadang, para peneliti dan analis hanya mencoba menemukan cara untuk

mendeskripsikan pola dan tren yang ada dalam data. Sebagai contoh, seorang

jajak pendapat dapat mengungkap bukti bahwa mereka yang diberhentikan

cenderung tidak mendukung calon petahana saat ini dalam pemilihan

presiden.Deskripsi pola dan tren sering menyarankan penjelasan yang mungkin

untuk pola dan tren tersebut.

c) Prediksi

Prediksi serupa dengan klasifikasi dan estimasi, kecuali untuk prediksi,

hasil dari kesalahan ini. Contoh dari laporan kinerja dalam bisnis dan penelitian

yaitu:

1) Memprediksi harga saham tiga bulan ke depan.

2) Memprediksi persentase peningkatan trafik kematian tahun depan jika

batas kecepatan dinaikkan.

3) Memprediksikan yang lebih baik dari yang terbaik adalah bola

WorldSeries, berdasarkan perbandingan statistik tim.

d) Klasifikasi

Dalam klasifikasi, ada target variabel kategori, seperti braket pendapatan,

misalnya dapat dipartisi menjadi tiga kelas atau kategori: pendapatan tinggi,

pendapatan menengah, dan pendapatan rendah. Model penambangan data

memeriksa sejumlah besar catatan, setiap catatan yang berisi informasi tentang

variabel target serta aset variabel input atau prediktor.

Page 5: BAB II TINJAUAN PUSTAKAN 2.1.Data Mining

11

e) Clustering

Pengelompokan mengacu pada pengelompokan catatan, pengamatan, atau

kasus ke dalam kelas - kelas objek yang serupa. Pernyataan interaktif untuk

merekam apa yang cocok untuk orang lain, dan tidak sama dengan catatan dalam

kelompok lain. Clustering berbeda dari klasifikasi dimana tidak ada variabel

target untuk pengelompokan.Tugas pengelompokan tidak mencoba

mengklasifikasikan, memperkirakan, atau memprediksi nilai variabel

target.Algoritma pengelompokan berusaha mengelompokkan seluruh kumpulan

data ke dalam sub kelompok atau gugus yang relatif homogen, dimana kesamaan

catatan dalam cluster dimaksimalkan dan kemiripan dengan rekaman di luar

cluster diminimalkan.

f) Asosiasi

Tugas asosiasi untuk penggalian data adalah pekerjaan menemukan atribut

yang “go together”. Paling umum dalam dunia bisnis, dimana ia dikenal sebagai

affinity analysis or market basket analysis, tugas asosiasi berusaha untuk

mengungkap aturan untuk mengukur hubungan antara dua atau lebih atribut.

2.2.Clustering

Clustering atau pengelompokan merupakan suatu metode yang digunakan

untuk mengelompokkan data ke dalam beberapa cluster sehingga data dalam satu

cluster memiliki tingkat kemiripan yang maksimum dan data antar cluster

memiliki kemiripan yang minimum (Fatmawati & Windarto, 2018).

Page 6: BAB II TINJAUAN PUSTAKAN 2.1.Data Mining

12

2.2.1. Algoritma K-Medoids

Menurut Listiyanti, Youanda Alim Syahbana & Henim (2016) ”Algoritma

K-Medoidsadalah algoritma pengelompokkan yang berkaitan dengan algoritma K-

Medoids dan algoritma medoidshift”.

Algoritma K-Medoids dikembangkan oleh Leonard Kaufman dan Peter J.

Rousseeuw pada tahun 1987. Algoritma K-Medoids sering disebut juga algoritma

Partitoning Around Medoids (PAM). Algoritma K-Medoids memiliki kesamaan

dengan algoritma K-Medoids yaitu sama-sama termasuk algoritma partitioning.

Algoritma partitioning merupakan algoritma pengelompokan data ke dalam

sejumlah cluster tanpa adanya struktur hirarki antara satu dengan yang lainnya.

Algoritma K-Medoids memiliki keunggulan dibandingkan dengan algoritma K-

Medoids. K-Medoids memiliki kinerja yang lebih optimal jika jumlah data yang

digunakan berjumlah sedikit. Algoritma ini menggunakan objek pada kumpulan

objek untuk mewakili sebuah cluster. Objek yang terpilih untuk mewakili sebuah

cluster disebut medoids(Rofiqi 2017).

2.2.2. Perhitungan Algoritma K-Medoids

Beberapa langkah-langkah dalam perhitungan algoritma K-Medoidsadalah:

1. Inisialisasi pusat clustersebanyak k (jumlah cluster)

2. Alokasikan setiap data (objek) ke cluster terdekat menggunakan

persamaan ukuran jarak Euclidian Distance dengan persamaan:

𝑑𝑖𝑗 = √∑(

𝑝

𝑎=1

𝑥𝑖𝑎 − 𝑥𝑗𝑎 )2 = √(x𝑖 − x𝑗)′(x𝑖 − x𝑗)

(2.1)

Page 7: BAB II TINJAUAN PUSTAKAN 2.1.Data Mining

13

dimana i=1,…..,n; j=1,…..,n dan p adalah banyak variable, serta V

adalah matrik varian kovarian.

3. Pilih secara acak objek pada masing-masing clustersebagai kandidat

medoids baru.

4. Hitung jarak setiap objek yang berada pada masing-masing

clusterdengan kandidat medoids baru.

5. Hitung total simpangan (S) dengan menghitung nilai total distance

baru – total distance lama. Jika S < 0, maka tukar objek dengan data

cluster untuk membentuk sekumpulan k objek baru sebagai medoids.

Ulangi langkah 3 sampai 5 hingga tidak terjadi perubahan medoids,

sehingga didapatkan clusterbeserta anggota cluster masing-masing.

2.3.Unified Modeling Language (UML)

Unified Modeling Language (UML) adalah bahasa spesifikasi standar yang

dipergunakan untuk mendokumentasikan, menspesifikasikan dan membanngun

perangkat lunak.UML merupakan metodologi dalam mengembangkan sistem

berorientasi objek dan juga merupakan alat untuk mendukung pengembangan

sistem.Unified Modeling Language (UML) adalah sebuah bahasa yang

berdasarkan grafik atau gambar untuk memvisualisasi, menspesifikasikan,

membangun, dan pendokumentasian dari sebuah sistem pengembangan software

berbasis OO (Object-Oriented). UML sendiri juga memberikan standar penulisan

sebuah sistem blue print, yang meliputi konsep bisnis proses, penulisan kelas-

kelas dalam bahasa program yang spesifik, skema database, dan komponen-

komponen yang diperlukan dalam sistem software (Suendri, 2018).Alat bantu

Page 8: BAB II TINJAUAN PUSTAKAN 2.1.Data Mining

14

yang digunakan dalam perancangan berorientasi objek berbasiskan UML adalah

sebagai berikut (Hendini, 2016):

2.3.1. Use Case Diagram

Use case diagram merupakan pemodelan untuk kelakuan (behavior)

sistem informasi yang akan dibuat. Use case digunakan untuk mengetahui fungsi

apa saja yang ada di dalam sistem informasi dan siapa saja yang berhak

menggunakan fungsi – fungsi tersebut. Simbol-simbol yang digunakan dalam Use

Case Diagram dapat dilihat pada tabel berikut ini:

Tabel 2.1. Simbol – Simbol Use Case Diagram

No. Simbol Keterangan

1

Use Casemenggambarkan fungsionalitasyang disediakan sistem sebagai unit-unityang bertukar pesan

antarunitdengan aktir, yang dinyatakan dengan

menggunakan kata kerja.

2

ActoratauAktor adalah Abstraction dari orang atau

sistem yang lainyangmengaktifkan fungsi dari target

sistem. Untuk mengidentifikasikan aktor, harus ditentukan pembagian tenaga kerja dan tugas-tugas

yang berkaitan dengan peran pada konteks target

sistem. Orang atau sistem bisa muncul dalam beberapa

peran. Perlu dicatat bahwa aktor berinteraksi dengan Use Case,tetapi tidak memilik kontrol terhadap use

case.

3

Asosiasi antara aktor dan use case, digambarkan

dengan garis tanpa panah yang mengindikasikan siapa

atau apayangmeminta interaksi secara langsung dan

bukannya mengindikasikan data.

4

Asosiasi antara aktor dan use caseyangmenggunakan

panah terbuka untuk mengindikasikan bila aktor

berinteraksi secara pasif dengan sistem.

5 << include >>

Include, merupakan di dalam use case lain (required) atau pemanggilan use case oleh use case lain,

contohnya adalah pemanggilan sebuah fungsi program.

6 << Extend >>

Extend, merupakan perluasan dari use case lain jika

kondisi atau syarat terpenuhi.

(Sumber : (Hendini, 2016)

Page 9: BAB II TINJAUAN PUSTAKAN 2.1.Data Mining

15

2.3.2. Diagram Aktivitas (Activity Diagram)

Activity Diagram menggambarkan workflow (aliran kerja) atau aktivitas

dari sebuah sistem atau proses bisnis. Simbol – simbol yang digunakan dalam

activity diagram dapat dilihat pada tabel berikut ini:

Tabel 2.2.Simbol – SimbolActivity Diagram

No. Simbol Keterangan

1 Start Point, diletakkan pada pojok kiri atas dan

merupakan awal aktivitas.

2

End Point, akhir aktivitas.

3

Activities, menggambarkan suatuproses / bisnis.

4

Fork/percabangan, digunakan untuk menunjukkan kegiatan yang dilakukan secara paralel atau untuk

menggabungkan dua kegiatan paralel menjadi satu.

5

Join (penggabungan) atau rake, digunakan untuk

menunjukkan adanya dekomposisi.

6

Decision Points, menggambarkan pilihan untuk

pengambilan keputusan, true atau false.

7

Swimlane, pembagian activitydiagram untuk

menunjukkan siapa melakukan apa.

(Sumber : Hendini, 2016)

2.3.3. Diagram Urutan (Sequence Diagram)

Sequence Diagram menggambarkan kelakuan objek pada use case dengan

mendeskripsikan waktu hidup objek dan pesan yang dikirimkan dan diterima antar

objek. Simbol – simbol yang digunakan dalam sequence diagram dapat dilihat

pada tabel berikut ini:

Page 10: BAB II TINJAUAN PUSTAKAN 2.1.Data Mining

16

Tabel 2.3.Simbol – SimbolSequence Diagram

No. Simbol Keterangan

1

Message, spesifikasi dari komunikasi antar objek yang

memuat informasi-informasi tentang aktifitas yang terjadi.

2

Object Live Time,simbol ini digunakan sebagai tanda masa

hidup suatu objek.

3 Aktivation, simbol ini digunakan sebagai aktivasi sebuah

data.

4 Message (Return), simbol ini digunakan sebagai sebuah

alasan pesan atas pengiriman message.

5

Boundary,menggambarkan interaksi antara satu atau lebih actor dengan sistem, memodelkan bagian darisistem yang

bergantung pada pihak lain disekitarnya dan merupakan

pembatas sistem dengan dunia luar.

6

Entity, menggambarkan informasi yang harus disimpan oleh sistem (struktur data dari sebuah sistem).

(Sumber : Marbun & Sinaga, 2018)

2.3.4. Diagram Kelas (Class Diagram)

Merupakan hubungan antar kelas dan penjelasan detail tiap-tiap kelas di

dalam model desain dari suatu sistem, juga memperlihatkan aturan-aturan dan

tanggung jawab entitas yang menentukan perilaku sistem. Class Diagram juga

menunjukkan atribut-atribut dan operasi-operasi dari sebuah kelas dan constraint

yang berhubungan dengan objek yang dikoneksikan.Hubungan antar kelas

mempunyai keterangan yang disebut dengan Multiplicity atau Cardinality. Simbol

– simbol yang digunakan dalam class diagram dapat dilihat pada tabel berikut ini:

Page 11: BAB II TINJAUAN PUSTAKAN 2.1.Data Mining

17

Tabel 2.4.Simbol – SimbolClass Diagram

No. Simbol Keterangan

1

Generalization, hubungan dimana objek anak (descendent) berbagi perilaku dan struktur data dari objek yang ada di atasnya objek induk (ancestor).

2 Class, himpunan dari objek-objek yang berbagi atribut

serta operasi yang sama.

3

Collaboration, deskripsi dari urutan aksi-aksi yang ditampilkan sistem yang menghasilkan suatu hasil yang terukur bagi suatu aktor.

4 Realization, operasi yang benar-benar dilakukan oleh

suatu objek.

5

Dependency, hubungan dimana perubahan yang terjadi pada suatu elemen mandiri (independent) akan

mempegaruhi elemen yang bergantung padanya elemen yang tidak mandiri.

6 Association, yang menghubungkan antara objek satu

dengan objek lainnya.

(Sumber : Marbun & Sinaga, 2018)

Class Diagram memiliki tiga area pokok yaitu (Suendri, 2018):

a. Nama, kelas harus mempunyai sebuah nama.

b. Atribut, adalah kelengkapan yang melekat pada kelas. Nilai dari suatu kelas

hanya bisa diproses sebatas atribut yang dimiliki.

c. Operasi, adalah proses yang dapat dilakukan oleh sebuah kelas, baik pada

kelas itu sendiri ataupun kepada kelas lainnya.

2.3.5. Deployment Diagram

Deployment Diagram digunakan untuk menggambarkan detail bagaimana

komponen disusun di infrastruktur sistem.

Page 12: BAB II TINJAUAN PUSTAKAN 2.1.Data Mining

18

2.4.Flowchart

Flowchart adalah representasi secara simbolik dari suatu algoritma atau

prosedur untuk menyelesaikan suatu masalah, dengan menggunakan

flowchartakan memudahkan pengguna melakukan pengecekan bagian-bagian

yang terlupakan dalam analisis masalah, disamping itu flowchart juga berguna

sebagai fasilitas untuk berkomunikasi antara pemrogram yang bekerja dalam tim

suatu proyek. Flowchart membantu memahami urutan-urutan logika yang rumit

dan panjang serta membantu mengkomunikasikan jalannya program ke orang lain

(bukan pemrogram) akan lebih mudah (Nurmalina, 2017).

Flowchart akan menggambarkan bagaimana cara kerja sistem informasi

yang dibangun dengan menggunakan simbol-simbol yang mewakili keadaan

sebenarnya pada sistem (Yamasari, 2017). Simbol-simbol yang digunakan untuk

menggambarkan flowchart dapat dilihat pada tabel berikut:

Tabel 2.5. Simbol-simbol Flowchart

No. Simbol Fungsi

1

Permulaan sub program.

2

Perbandingan, pernyataan, penyeleksian data yang

memberikan pilihan untuk langkah selanjutnya.

3

Penghubung bagian- bagian flowchart yang berada

pada satu halaman.

4

Penghubung bagian- bagian flowchart yang berada

pada halaman berbeda.

5

Permulaan/akhir program

6 Arah aliran program Proses

7

Proses inisialisasi/pemberian harga awal proses

8

Proses penghitung/ proses pengolahan data

9

Proses input/output data.

(Sumber: Nurmalina, 2017)

Page 13: BAB II TINJAUAN PUSTAKAN 2.1.Data Mining

19

2.5. Rapidminer

Rapidminer merupakan perangkat lunak yang dibuat oleh Dr. Markus

Hofmann dari Institute of Technologi Blanchardstown dan Ralf Klinkenberg dari

rapid-i.com dengan tampilan GUI (Graphical User Interface) sehingga

memudahkan pengguna dalam menggunakan perangkat lunak ini.Rapidminer

dikhususkan untuk penggunaan data mining.Model yang disediakan juga cukup

banyak dan lengkap, seperti Model Bayesian, Modelling, Tree Induction, Neural

Network dan lain-lain (Yudi Prayoga, 2019).Penelitian yang dilakukan penulis

menggunakan tools RapidMiner Studio versi 5.3, tampilan RapidMiner Studio

versi 5.3 terdapat pada gambar 2.2:

(Sumber : Yudi Prayoga, 2019)

Gambar 2.2. Tampilan RapidMiner Studio versi 5.3

Keterangan untuk gambar 2.2.adalah sebagai berikut :

a. Menu Bar, merupakan menu utama yang terletak dibawah Title Bar yang

berfungsi sebagai menu perintah untuk mengoperasikan tools RapidMiner

Studio versi 5.3.

Page 14: BAB II TINJAUAN PUSTAKAN 2.1.Data Mining

20

b. Repository View, merupakan komponen penting dalam Design Perspective

untuk mengolah dan menata proses serta dapat digunakan sebagai sumber

data.

c. Operator View, merupakan komponen yang digunakan untuk operator

dalam RapidMiner yang terdiri dari Data Access, Blending, Cleansing, dan

lainnya untuk dalam hal proses analisis.

d. Process View, merupakan langkah-langkah dalam proses analisis, sebagai

penghubung langkah-langkah proses dan sebagai media desain proses

langkah-langkah analisis.

e. Parameters View, merupakan komponen dalam hal menentukan parameter

dari operator yang digunakan, beberapa operator membutuhkan satu atau

lebih parameter agar dapat diindikasikan sebagai fungsionalitas yang baik

dan benar.

f. Help dan Comment View, merupakan komponen yang menunjukkan

penjelasan setiap operator yang digunakan.

g. Toolbox, merupakan komponen yang digunakan untuk proses penyimpanan,

membuat proses baru, proses eksekusi analisis, dan untuk mencari data,

operator dan membuka proses yang sudah ada.

2.6. Riset – Riset Terkait

Beberapa penelitian terdahulu yang digunakan penulis menggunakan

algoritma K-Medoidsadalah sebagai berikut :

Page 15: BAB II TINJAUAN PUSTAKAN 2.1.Data Mining

21

Tabel 2.6. Penelitian Terdahulu

No. Nama

Author Judul Kesimpulan

1. (Triyanto 2015)

Algoritma K-Medoids Untuk

Penentuan Strategi Pemasaran Produk

Hasil dari penelitian ini menghasilkan 5 cluster dengan cluster pertama terdiri dari

909 record transaksi, cluster kedua terdiri

dari 166 record transaksi, cluster ketiga terdiri dari 66 record transaksi, cluster

keempat terdiri dari 132 record transaksi,

cluster kelima terdiri dari 87 record

transaksi. Strategi pemasaran produk dapat dilakukan dengan melakukan promosi

pada cluster kelima yang memiliki

kombinasi jumlah barang dibeli yang paling tinggi

2. (Mustofa &

Suasana 2018)

Algoritma

ClusteringK-Medoids Pada E-

Government

Bidang Information And

Communication Technology Dalam

Dalam penelitian ini dilakukan pengujian

model dengan menggunakan K-Medoids Chebyshev dalam pengelompokan data

EDGI E-government Surve 2014 kedalam

4 status EDGI. Model yang dihasilkan diuji untuk mendapatkan nilai Bouldin

Index dari setiap algoritma sehingga

didapat pengujian dengan menggunakan data dan setelah dilakukan pengujian

dengan tools rapidminer didapat nilai

Bouldin Index adalah 0.593 pada algoritma

K-Medoids Chebyshev. suatu cluster akan dianggap memiliki skema clustering yang

optimal adalah yang memiliki Index

Davies Bouldin minimal maka dapat disimpulkan pengujian data EDGI E-

goverment Surve 2014 tersebut lebih

optomal dalam penentuan pengelompokan

EDI E-govermnet Surve 2014 ke dalam 4 status EDGI di bandingkan menggunakan mahattan atau ecludian.

3 (Pramesti,

Furqon & Dewi 2017)

Implementasi

Algoritma K-

MedoidsClustering Untuk

Pengelompokan

Data Potensi

Kebakaran Hutan / Lahan

Berdasarkan

Persebaran Titik Panas ( Hotspot )

Hasil analisis terhadap hasil clustering

menunjukkan bahwa dengan penggunaan 2

cluster menghasilkan kelompok data dengan potensi yang dimiliki yaitu cluster

1 termasuk dalam potensi tinggi dengan

hasil rata-rata brightness sebesar 344.470K

dengan rata-rata confidence 87.08% dan cluster 2 masuk dalam potensi sedang

dengan hasil rata-rata brightness sebesar

318.800K dengan rata-rata confidence sebesar 58,73%.

Page 16: BAB II TINJAUAN PUSTAKAN 2.1.Data Mining

22

2.7.Kerangka Pemikiran

Peran dari data mining pada dasarnya dirancang sedemikian rupa sehingga

bersifat interaktif dengan pemakaiannya. Maksud dan tujuan adanya data mining

yaitu untuk membantu pihak Badan Pusat Statistik dalam menganalisa produksi

jagung menurut provinsi di Indonesia dengan menggunakan metode K-Medoids

clustering. Hal ini merupakan suatu pemrograman yang akan didukung dalam

menganalisa produksi jagung menurut provinsi di Indonesia dengan bahasa

pemrogaman matlab.

Kerangka pemikiran dari penelitian ini dilakukan dengan beberapa tahapan

antara lain:

1. Pendefinisian rumusan masalah.

2. Kemudian pada tahapan yang kedua melakukan analisis dengan penerapan

teknik data mining untuk membantu memecahkan rumusan masalah yang

ada.

3. Tahap ketiga adalah metode pengumpulan data dimana diambil sebagai

kepentingan penelitian dengan menggunakan sampel.

4. Di tahap ke empat merupakan pencarian subjek penelitian, dimana peneliti

mendapatkan data yang dibutuhkan dalam pencapaian tujuannya.

5. Sedangkan tahap terakhir adalah implementasi.

Hasil yang diperoleh dari penelitian ini adalah sistem data mining untuk

menganalisa produksi jagung menurut provinsi di Indonesia dengan menggunakan

metode K-Medoids clustering.

Page 17: BAB II TINJAUAN PUSTAKAN 2.1.Data Mining

23

2.8.Tinjauan Umum Instansi

2.8.1. Sejarah Badan Pusat Statistik Indonesia

Kegiatan statistik di Indonesia sudah dilaksanakan sejak masa

pemerintahan Hindia Belanda oleh suatu lembaga yang didirikan oleh direktur

pertanian, kerajinan dan perdagangan (DPKP) di Bogor. Pada Februari 1920

lembaga tersebut bertugas mengolah dan mempublikasikan data statistic. Pada 24

September 1924 kegiatan statistik pindah ke Jakarta dengan nama Centraal

Kantoor Voor De Statistiek (CKS) dan melaksanakan sensus penduduk pertama di

Indonesia pada tahun 1930. Pada masa pemerintahan Jepang di Indonesia

pada tahun 1942-1945, CKS berubah nama menjadi Shomubu Chosasitsu

Gunseikanbu(SCG) dengan kegiatan memenuhi kebutuhan perang/militer.

Setelah Kemerdekaan Republik Indonesia (RI) diproklamasikan pada

tanggal 17 Agustus 1945, lembaga tersebut dinasionalisasikan dengan nama

Kantor Penyelidikan Perangkaan Umum Republik Indonesia (KAPPURI) dan

dipimpin oleh Mr. Abdul Karim Pringgodigdo. Setelah adanya surat edaran

kementerian kemakmuran tanggal 12 Juni 1950 Nomor 219/S.C., lembaga

KAPPURI dan CKS dilebur menjadi Kantor Pusat Statistik (KPS) dibawah

tanggung jawab Menteri Kemakmuran.

Berdasarkan surat keputusan Menteri Perekonomian Nomor P/44, KPS

bertanggung jawab kepada Menteri Perekonomian. Selanjutnya, melalui SK

Menteri Perekonomian tanggal 24 Desember 1953 Nomor IB.099/M kegiatan

KPS dibagi dalam dua bagian yaitu Afdeling A (Bagian Riset) dan Afdeling B

(Bagian penyelenggaraan dan Tata Usaha). Berdasarkan Keppres X nomor 172

Page 18: BAB II TINJAUAN PUSTAKAN 2.1.Data Mining

24

tanggal 1 Juni 1957, KPS berubah menjadi Biro Pusat Statistik dan

bertanggungjawab langsung kepada Perdana Menteri.

Sesuai dengan UU No.6/1960 tentang sensus, BPS menyelenggarakan

sensus penduduk serentak di pada tahun 1961. Sensus penduduk tersebut

merupakan sensus penduduk pertama setelah Indonesia merdeka. Sensus

penduduk di tingkat provinsi dilaksanakan oleh kantor Gubernur, dan di tingkat

Kabupaten/Kotamadya dilaksanakan oleh kantor Bupati/Walikota, sedangkan

pada tingkat Kecamatan dibentuk bagian yang melaksanakan sensus penduduk.

Selanjutnya penyelenggara sensus di kantor Gubernur dan kantor

Bupati/Walikotaditetapkan menjadi kantor sensus dan statistik daerah berdasarkan

Keputusan Presidium Kabinet Nomor Aa/C/9 Tahun 1965.

Berdasarkan peraturan pemerintah No.16/1968 yang mengatur tentang

organisasi dan tata kerja BPS di pusat dan daerah serta perubahannya menjadi PP

No.6/1980, menyebutkan bahwa perwakilan BPS di daerah adalah kantor satistik

provinsi dan kantor statistik Kabupaten atau Kotamadya. Tentang organisasi BPS

ditetapkan kembali pada PP No. 2 Tahun 1992 yang disahkan pada 9 Januari

1992. Selanjutnya, kedudukan, fungsi, tugas, susunan organisasi dan tata kerja

BPS diatur dengan keputusan Presiden Nomor 6 Tahun 1992.

Pada tanggal 19 Mei 1997 ditetapkan UU Nomor 16 Tahun 1997 tentang

statistik, dimana Biro Pusat Statistik diubah namanya menjadi “Badan Pusat

Statistik”. Pada keputusan Presiden No.86 Tahun 1998 tentang Badan Pusat

Statistik, menetapkan bahwa perwakilan BPS di daerah merupakan instansi

vertikal dengan nama BPS Provinsi, BPS Kabupaten, dan BPS Kotamadya. Serta

Page 19: BAB II TINJAUAN PUSTAKAN 2.1.Data Mining

25

pada tanggal 26 Mei 1999, ditetapkan PP Nomor 51 tahun 1999 tentang

penyelenggaraan statistik di Indonesia.

Visi Badan Pusat Statistik Indonesia

Adapun visi Badan Pusat Statistik Indonesia adalah “Pelopor Data

Statistik Terpercaya Untuk Semua”.

Misi Badan Pusat Statistik Indonesia

Adapun misi Badan Pusat Statistik Indonesia adalah sebagai berikut:

1. Menyediakan data statistik berkualitas melalui kegiatan statistik yang

terintegrasi dan berstandar nasional maupun internasional.

2. Memperkuat Sistem Statistik Nasional yang berkesinambungan melalui

pembinaan dan koordinasi di bidang statistik.

3. Membangun insan statistik yang profesional, berintegritas dan amanah

untuk kemajuan perstatistikan.

2.8.2. Struktur Organisasi Badan Pusat Statistik Indonesia

Organisasi berasal dari bahasa Yunani “orgonom” dan istilah latin

“orgonum” yang berarti alat bagian, anggota atau badan. Sehingga dapat di

defenisikan sebagai suatu wadah atau tempat sekelompok orang bekerja sama

dengan menggunakan dana, alat-alat dan teknologi serta mau terikat dengan

peraturan dan hubungan tertentu sehingga dapat mengarah kepada pencapaian

tujuan yang diinginkan.

Adapun struktur organisasi di Badan Pusat Statistik Indonesia adalah

sebagai berikut:

Page 20: BAB II TINJAUAN PUSTAKAN 2.1.Data Mining

26

Gambar 2.3. Struktur Organisasi BPS Indonesia

2.8.3. Tugas dan Wewenang Badan Pusat Statistik

Tugas, fungsi dan kewenangan BPS telah ditetapkan berdasarkan

peraturan Presiden Nomor 86 Tahun 2007 tentang Badan Pusat Statistik dan

Peraturan Kepala Badan Pusat Statistik Nomor 7 Tahun 2008 tentang Organisasi

dan Tata Kerja Badan Pusat Statistik.

1. Tugas

Melaksanakan tugas pemerintahan di bidang kegiatan statistik sesuai

dengan ketentuan peraturan perundang-undangan yang berlaku.

2. Fungsi

a. Pengkajian, penyusunan dan perumusan kebijakan dibidang statistik;

b. Pengkoordinasian kegiatan statistik nasional dan regional;

c. Penetapan dan penyelenggaraan statistik dasar;

d. Penetapan dan penyelenggaraan statistik dasar;

Seksi Sosial

Seksi Produksi

Seksi Distribusi

Seksi IPDS Seksi Nerwilis

Fungsional

Kepala BPS

Bagian Tata Usaha

Page 21: BAB II TINJAUAN PUSTAKAN 2.1.Data Mining

27

e. Pembinaan dan fasilitasi terhadap kegiatan instansi pemerintah dibidang

kegiatan statistik; dan

f. Penyelenggaraan pembinaan dan pelayanan administrasi umum dibidang

perencanaan umum, ketatausahaan, organisasi dan tatalaksana,

kepegawaian, keuangan, kearsipan, kehumasan, hukum, perlengkapan dan

rumah tangga.

3. Wewenang

a. Penyusunan rencana nasional secara makro di bidangnya;

b. Perumusan kebijakan di bidangnya untuk mendukung pembangunan

secara makro;

c. Penetapan sistem informasi di bidangnya;

d. Penetapan dan penyelenggaraan statistik nasional;

e. Kewenangan lain sesuai dengan ketentuan peraturan perundang-undangan

yang berlaku, yaitu;

f. Perumusan dan pelaksanaan kebijakan tertentu di bidang kegiatan

statistik;

2.9. Hipotesis

Berdasarkan pada rumusan masalah, tinjauan pustaka, kerangka pemikiran

di atas, maka hipotesis penelitian ini dapat penulis sampaikan bahwa dengan

adanya data mining metode K-Medoids clustering analisa produksi jagung

menurut provinsi di Indonesia akan memudahkan pihak Badan Pusat Statistik

untuk menganalisa produksi jagung menurut provinsi di Indonesia.