bab ii tinjauan pustakan 2.1.data mining
TRANSCRIPT
7
BAB II
TINJAUAN PUSTAKAN
2.1.Data Mining
Data mining merupakan metode yang digunakan untuk pengolahan data
guna menemukan pola yang tersembunyi dari data yang diolah. Data yang diolah
dengan teknik data mining ini kemudian menghasilkan suatu pengetahuan baru
yang bersumber dari data lama dan hasil dari pengolahan data tersebut dapat
digunakan dalam menentukan sebuah keputusan di masa depan. Data mining juga
merupakan rangkaian kegiatan untuk menemukan pola yang menarik dari data
dalam jumlah besar, kemudian data – data tersebut dapat disimpan dalam
database, data warehouse atau penyimpanan informasi (Sadewo, Windarto, &
Andani, 2017).
2.1.1. Tahapan Data Mining
Menurut (Fatmawati & Windarto, 2018) tahapan yang dilakukan pada
proses data mining diawali dari seleksi data dari data sumber ke data target, tahap
pre-processing untuk memperbaiki kualitas data, transformasi, data mining serta
tahap interpretasi dan evaluasi yang menghasilkan output berupa pengetahuan
baru yang diharapkan memberikan kontribusi yang lebih baik. Secara detail
dijelaskan sebagai berikut:
8
Gambar 2.1.Tahapan Data Mining
(Sumber : Fatmawati & Windarto, 2018)
Berikut ini adalah penjelasan dari tahapan data mining berdasarkan gambar 2.1 :
1) DataSelection
Pemilihan atau seleksi data dari sekumpulan data operasional perlu
dilakukan sebelum tahap penggalian informasi dalam KDD atau Knowledge
Discovery from Data dimulai. Data hasil seleksi yang digunakan untuk proses
data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional.
2) Pre - Processing / Cleaning
Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses
cleaning pada data yang menjadi fokus KDD. Proses cleaning mencakup antara
lain membuang duplikasi data, memeriksa data yang inkonsisten, dan
memperbaiki kesalahan pada data.
3) Transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga
data tersebut sesuai untuk proses data mining. Proses coding dalam KDD
9
merupakan proses kreatif dan sangat tergantung pada jenis atau pola informasi
yang akan dicari dalam basis data.
4) Data Mining
Data mining adalah proses mencari pola atau informasi menarik dalam
data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode,
atau algoritma dalam data mining sangat bervariasi. Pemilihan metode atau
algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara
keseluruhan.
5) Interpretation / Evalution
Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan
dalam bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini
mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan
dengan fakta atau hipotesis yang ada sebelumnya.
2.1.2. Aktivitas Data Mining
Menurut (Waworuntu & Amin, 2018) aktivitas data mining dapat dibagi
menjadi 6 yang berdasarkan tujuan dari analisis yaitu:
a) Estimasi
Estimasi mirip dengan klasifikasi, kecuali bahwa variabel target bersifat
numerik, bukan kategorikal.Model dibangun menggunakan "lengkap" catatan,
yang memberikan nilai dari variabel target serta prediktor.Kemudian, untuk
pengamatan baru, perkiraan nilai variabel target dibuat berdasarkan nilai- nilai
prediktor.
10
b) Deskripsi
Terkadang, para peneliti dan analis hanya mencoba menemukan cara untuk
mendeskripsikan pola dan tren yang ada dalam data. Sebagai contoh, seorang
jajak pendapat dapat mengungkap bukti bahwa mereka yang diberhentikan
cenderung tidak mendukung calon petahana saat ini dalam pemilihan
presiden.Deskripsi pola dan tren sering menyarankan penjelasan yang mungkin
untuk pola dan tren tersebut.
c) Prediksi
Prediksi serupa dengan klasifikasi dan estimasi, kecuali untuk prediksi,
hasil dari kesalahan ini. Contoh dari laporan kinerja dalam bisnis dan penelitian
yaitu:
1) Memprediksi harga saham tiga bulan ke depan.
2) Memprediksi persentase peningkatan trafik kematian tahun depan jika
batas kecepatan dinaikkan.
3) Memprediksikan yang lebih baik dari yang terbaik adalah bola
WorldSeries, berdasarkan perbandingan statistik tim.
d) Klasifikasi
Dalam klasifikasi, ada target variabel kategori, seperti braket pendapatan,
misalnya dapat dipartisi menjadi tiga kelas atau kategori: pendapatan tinggi,
pendapatan menengah, dan pendapatan rendah. Model penambangan data
memeriksa sejumlah besar catatan, setiap catatan yang berisi informasi tentang
variabel target serta aset variabel input atau prediktor.
11
e) Clustering
Pengelompokan mengacu pada pengelompokan catatan, pengamatan, atau
kasus ke dalam kelas - kelas objek yang serupa. Pernyataan interaktif untuk
merekam apa yang cocok untuk orang lain, dan tidak sama dengan catatan dalam
kelompok lain. Clustering berbeda dari klasifikasi dimana tidak ada variabel
target untuk pengelompokan.Tugas pengelompokan tidak mencoba
mengklasifikasikan, memperkirakan, atau memprediksi nilai variabel
target.Algoritma pengelompokan berusaha mengelompokkan seluruh kumpulan
data ke dalam sub kelompok atau gugus yang relatif homogen, dimana kesamaan
catatan dalam cluster dimaksimalkan dan kemiripan dengan rekaman di luar
cluster diminimalkan.
f) Asosiasi
Tugas asosiasi untuk penggalian data adalah pekerjaan menemukan atribut
yang “go together”. Paling umum dalam dunia bisnis, dimana ia dikenal sebagai
affinity analysis or market basket analysis, tugas asosiasi berusaha untuk
mengungkap aturan untuk mengukur hubungan antara dua atau lebih atribut.
2.2.Clustering
Clustering atau pengelompokan merupakan suatu metode yang digunakan
untuk mengelompokkan data ke dalam beberapa cluster sehingga data dalam satu
cluster memiliki tingkat kemiripan yang maksimum dan data antar cluster
memiliki kemiripan yang minimum (Fatmawati & Windarto, 2018).
12
2.2.1. Algoritma K-Medoids
Menurut Listiyanti, Youanda Alim Syahbana & Henim (2016) ”Algoritma
K-Medoidsadalah algoritma pengelompokkan yang berkaitan dengan algoritma K-
Medoids dan algoritma medoidshift”.
Algoritma K-Medoids dikembangkan oleh Leonard Kaufman dan Peter J.
Rousseeuw pada tahun 1987. Algoritma K-Medoids sering disebut juga algoritma
Partitoning Around Medoids (PAM). Algoritma K-Medoids memiliki kesamaan
dengan algoritma K-Medoids yaitu sama-sama termasuk algoritma partitioning.
Algoritma partitioning merupakan algoritma pengelompokan data ke dalam
sejumlah cluster tanpa adanya struktur hirarki antara satu dengan yang lainnya.
Algoritma K-Medoids memiliki keunggulan dibandingkan dengan algoritma K-
Medoids. K-Medoids memiliki kinerja yang lebih optimal jika jumlah data yang
digunakan berjumlah sedikit. Algoritma ini menggunakan objek pada kumpulan
objek untuk mewakili sebuah cluster. Objek yang terpilih untuk mewakili sebuah
cluster disebut medoids(Rofiqi 2017).
2.2.2. Perhitungan Algoritma K-Medoids
Beberapa langkah-langkah dalam perhitungan algoritma K-Medoidsadalah:
1. Inisialisasi pusat clustersebanyak k (jumlah cluster)
2. Alokasikan setiap data (objek) ke cluster terdekat menggunakan
persamaan ukuran jarak Euclidian Distance dengan persamaan:
𝑑𝑖𝑗 = √∑(
𝑝
𝑎=1
𝑥𝑖𝑎 − 𝑥𝑗𝑎 )2 = √(x𝑖 − x𝑗)′(x𝑖 − x𝑗)
(2.1)
13
dimana i=1,…..,n; j=1,…..,n dan p adalah banyak variable, serta V
adalah matrik varian kovarian.
3. Pilih secara acak objek pada masing-masing clustersebagai kandidat
medoids baru.
4. Hitung jarak setiap objek yang berada pada masing-masing
clusterdengan kandidat medoids baru.
5. Hitung total simpangan (S) dengan menghitung nilai total distance
baru – total distance lama. Jika S < 0, maka tukar objek dengan data
cluster untuk membentuk sekumpulan k objek baru sebagai medoids.
Ulangi langkah 3 sampai 5 hingga tidak terjadi perubahan medoids,
sehingga didapatkan clusterbeserta anggota cluster masing-masing.
2.3.Unified Modeling Language (UML)
Unified Modeling Language (UML) adalah bahasa spesifikasi standar yang
dipergunakan untuk mendokumentasikan, menspesifikasikan dan membanngun
perangkat lunak.UML merupakan metodologi dalam mengembangkan sistem
berorientasi objek dan juga merupakan alat untuk mendukung pengembangan
sistem.Unified Modeling Language (UML) adalah sebuah bahasa yang
berdasarkan grafik atau gambar untuk memvisualisasi, menspesifikasikan,
membangun, dan pendokumentasian dari sebuah sistem pengembangan software
berbasis OO (Object-Oriented). UML sendiri juga memberikan standar penulisan
sebuah sistem blue print, yang meliputi konsep bisnis proses, penulisan kelas-
kelas dalam bahasa program yang spesifik, skema database, dan komponen-
komponen yang diperlukan dalam sistem software (Suendri, 2018).Alat bantu
14
yang digunakan dalam perancangan berorientasi objek berbasiskan UML adalah
sebagai berikut (Hendini, 2016):
2.3.1. Use Case Diagram
Use case diagram merupakan pemodelan untuk kelakuan (behavior)
sistem informasi yang akan dibuat. Use case digunakan untuk mengetahui fungsi
apa saja yang ada di dalam sistem informasi dan siapa saja yang berhak
menggunakan fungsi – fungsi tersebut. Simbol-simbol yang digunakan dalam Use
Case Diagram dapat dilihat pada tabel berikut ini:
Tabel 2.1. Simbol – Simbol Use Case Diagram
No. Simbol Keterangan
1
Use Casemenggambarkan fungsionalitasyang disediakan sistem sebagai unit-unityang bertukar pesan
antarunitdengan aktir, yang dinyatakan dengan
menggunakan kata kerja.
2
ActoratauAktor adalah Abstraction dari orang atau
sistem yang lainyangmengaktifkan fungsi dari target
sistem. Untuk mengidentifikasikan aktor, harus ditentukan pembagian tenaga kerja dan tugas-tugas
yang berkaitan dengan peran pada konteks target
sistem. Orang atau sistem bisa muncul dalam beberapa
peran. Perlu dicatat bahwa aktor berinteraksi dengan Use Case,tetapi tidak memilik kontrol terhadap use
case.
3
Asosiasi antara aktor dan use case, digambarkan
dengan garis tanpa panah yang mengindikasikan siapa
atau apayangmeminta interaksi secara langsung dan
bukannya mengindikasikan data.
4
Asosiasi antara aktor dan use caseyangmenggunakan
panah terbuka untuk mengindikasikan bila aktor
berinteraksi secara pasif dengan sistem.
5 << include >>
Include, merupakan di dalam use case lain (required) atau pemanggilan use case oleh use case lain,
contohnya adalah pemanggilan sebuah fungsi program.
6 << Extend >>
Extend, merupakan perluasan dari use case lain jika
kondisi atau syarat terpenuhi.
(Sumber : (Hendini, 2016)
15
2.3.2. Diagram Aktivitas (Activity Diagram)
Activity Diagram menggambarkan workflow (aliran kerja) atau aktivitas
dari sebuah sistem atau proses bisnis. Simbol – simbol yang digunakan dalam
activity diagram dapat dilihat pada tabel berikut ini:
Tabel 2.2.Simbol – SimbolActivity Diagram
No. Simbol Keterangan
1 Start Point, diletakkan pada pojok kiri atas dan
merupakan awal aktivitas.
2
End Point, akhir aktivitas.
3
Activities, menggambarkan suatuproses / bisnis.
4
Fork/percabangan, digunakan untuk menunjukkan kegiatan yang dilakukan secara paralel atau untuk
menggabungkan dua kegiatan paralel menjadi satu.
5
Join (penggabungan) atau rake, digunakan untuk
menunjukkan adanya dekomposisi.
6
Decision Points, menggambarkan pilihan untuk
pengambilan keputusan, true atau false.
7
Swimlane, pembagian activitydiagram untuk
menunjukkan siapa melakukan apa.
(Sumber : Hendini, 2016)
2.3.3. Diagram Urutan (Sequence Diagram)
Sequence Diagram menggambarkan kelakuan objek pada use case dengan
mendeskripsikan waktu hidup objek dan pesan yang dikirimkan dan diterima antar
objek. Simbol – simbol yang digunakan dalam sequence diagram dapat dilihat
pada tabel berikut ini:
16
Tabel 2.3.Simbol – SimbolSequence Diagram
No. Simbol Keterangan
1
Message, spesifikasi dari komunikasi antar objek yang
memuat informasi-informasi tentang aktifitas yang terjadi.
2
Object Live Time,simbol ini digunakan sebagai tanda masa
hidup suatu objek.
3 Aktivation, simbol ini digunakan sebagai aktivasi sebuah
data.
4 Message (Return), simbol ini digunakan sebagai sebuah
alasan pesan atas pengiriman message.
5
Boundary,menggambarkan interaksi antara satu atau lebih actor dengan sistem, memodelkan bagian darisistem yang
bergantung pada pihak lain disekitarnya dan merupakan
pembatas sistem dengan dunia luar.
6
Entity, menggambarkan informasi yang harus disimpan oleh sistem (struktur data dari sebuah sistem).
(Sumber : Marbun & Sinaga, 2018)
2.3.4. Diagram Kelas (Class Diagram)
Merupakan hubungan antar kelas dan penjelasan detail tiap-tiap kelas di
dalam model desain dari suatu sistem, juga memperlihatkan aturan-aturan dan
tanggung jawab entitas yang menentukan perilaku sistem. Class Diagram juga
menunjukkan atribut-atribut dan operasi-operasi dari sebuah kelas dan constraint
yang berhubungan dengan objek yang dikoneksikan.Hubungan antar kelas
mempunyai keterangan yang disebut dengan Multiplicity atau Cardinality. Simbol
– simbol yang digunakan dalam class diagram dapat dilihat pada tabel berikut ini:
17
Tabel 2.4.Simbol – SimbolClass Diagram
No. Simbol Keterangan
1
Generalization, hubungan dimana objek anak (descendent) berbagi perilaku dan struktur data dari objek yang ada di atasnya objek induk (ancestor).
2 Class, himpunan dari objek-objek yang berbagi atribut
serta operasi yang sama.
3
Collaboration, deskripsi dari urutan aksi-aksi yang ditampilkan sistem yang menghasilkan suatu hasil yang terukur bagi suatu aktor.
4 Realization, operasi yang benar-benar dilakukan oleh
suatu objek.
5
Dependency, hubungan dimana perubahan yang terjadi pada suatu elemen mandiri (independent) akan
mempegaruhi elemen yang bergantung padanya elemen yang tidak mandiri.
6 Association, yang menghubungkan antara objek satu
dengan objek lainnya.
(Sumber : Marbun & Sinaga, 2018)
Class Diagram memiliki tiga area pokok yaitu (Suendri, 2018):
a. Nama, kelas harus mempunyai sebuah nama.
b. Atribut, adalah kelengkapan yang melekat pada kelas. Nilai dari suatu kelas
hanya bisa diproses sebatas atribut yang dimiliki.
c. Operasi, adalah proses yang dapat dilakukan oleh sebuah kelas, baik pada
kelas itu sendiri ataupun kepada kelas lainnya.
2.3.5. Deployment Diagram
Deployment Diagram digunakan untuk menggambarkan detail bagaimana
komponen disusun di infrastruktur sistem.
18
2.4.Flowchart
Flowchart adalah representasi secara simbolik dari suatu algoritma atau
prosedur untuk menyelesaikan suatu masalah, dengan menggunakan
flowchartakan memudahkan pengguna melakukan pengecekan bagian-bagian
yang terlupakan dalam analisis masalah, disamping itu flowchart juga berguna
sebagai fasilitas untuk berkomunikasi antara pemrogram yang bekerja dalam tim
suatu proyek. Flowchart membantu memahami urutan-urutan logika yang rumit
dan panjang serta membantu mengkomunikasikan jalannya program ke orang lain
(bukan pemrogram) akan lebih mudah (Nurmalina, 2017).
Flowchart akan menggambarkan bagaimana cara kerja sistem informasi
yang dibangun dengan menggunakan simbol-simbol yang mewakili keadaan
sebenarnya pada sistem (Yamasari, 2017). Simbol-simbol yang digunakan untuk
menggambarkan flowchart dapat dilihat pada tabel berikut:
Tabel 2.5. Simbol-simbol Flowchart
No. Simbol Fungsi
1
Permulaan sub program.
2
Perbandingan, pernyataan, penyeleksian data yang
memberikan pilihan untuk langkah selanjutnya.
3
Penghubung bagian- bagian flowchart yang berada
pada satu halaman.
4
Penghubung bagian- bagian flowchart yang berada
pada halaman berbeda.
5
Permulaan/akhir program
6 Arah aliran program Proses
7
Proses inisialisasi/pemberian harga awal proses
8
Proses penghitung/ proses pengolahan data
9
Proses input/output data.
(Sumber: Nurmalina, 2017)
19
2.5. Rapidminer
Rapidminer merupakan perangkat lunak yang dibuat oleh Dr. Markus
Hofmann dari Institute of Technologi Blanchardstown dan Ralf Klinkenberg dari
rapid-i.com dengan tampilan GUI (Graphical User Interface) sehingga
memudahkan pengguna dalam menggunakan perangkat lunak ini.Rapidminer
dikhususkan untuk penggunaan data mining.Model yang disediakan juga cukup
banyak dan lengkap, seperti Model Bayesian, Modelling, Tree Induction, Neural
Network dan lain-lain (Yudi Prayoga, 2019).Penelitian yang dilakukan penulis
menggunakan tools RapidMiner Studio versi 5.3, tampilan RapidMiner Studio
versi 5.3 terdapat pada gambar 2.2:
(Sumber : Yudi Prayoga, 2019)
Gambar 2.2. Tampilan RapidMiner Studio versi 5.3
Keterangan untuk gambar 2.2.adalah sebagai berikut :
a. Menu Bar, merupakan menu utama yang terletak dibawah Title Bar yang
berfungsi sebagai menu perintah untuk mengoperasikan tools RapidMiner
Studio versi 5.3.
20
b. Repository View, merupakan komponen penting dalam Design Perspective
untuk mengolah dan menata proses serta dapat digunakan sebagai sumber
data.
c. Operator View, merupakan komponen yang digunakan untuk operator
dalam RapidMiner yang terdiri dari Data Access, Blending, Cleansing, dan
lainnya untuk dalam hal proses analisis.
d. Process View, merupakan langkah-langkah dalam proses analisis, sebagai
penghubung langkah-langkah proses dan sebagai media desain proses
langkah-langkah analisis.
e. Parameters View, merupakan komponen dalam hal menentukan parameter
dari operator yang digunakan, beberapa operator membutuhkan satu atau
lebih parameter agar dapat diindikasikan sebagai fungsionalitas yang baik
dan benar.
f. Help dan Comment View, merupakan komponen yang menunjukkan
penjelasan setiap operator yang digunakan.
g. Toolbox, merupakan komponen yang digunakan untuk proses penyimpanan,
membuat proses baru, proses eksekusi analisis, dan untuk mencari data,
operator dan membuka proses yang sudah ada.
2.6. Riset – Riset Terkait
Beberapa penelitian terdahulu yang digunakan penulis menggunakan
algoritma K-Medoidsadalah sebagai berikut :
21
Tabel 2.6. Penelitian Terdahulu
No. Nama
Author Judul Kesimpulan
1. (Triyanto 2015)
Algoritma K-Medoids Untuk
Penentuan Strategi Pemasaran Produk
Hasil dari penelitian ini menghasilkan 5 cluster dengan cluster pertama terdiri dari
909 record transaksi, cluster kedua terdiri
dari 166 record transaksi, cluster ketiga terdiri dari 66 record transaksi, cluster
keempat terdiri dari 132 record transaksi,
cluster kelima terdiri dari 87 record
transaksi. Strategi pemasaran produk dapat dilakukan dengan melakukan promosi
pada cluster kelima yang memiliki
kombinasi jumlah barang dibeli yang paling tinggi
2. (Mustofa &
Suasana 2018)
Algoritma
ClusteringK-Medoids Pada E-
Government
Bidang Information And
Communication Technology Dalam
Dalam penelitian ini dilakukan pengujian
model dengan menggunakan K-Medoids Chebyshev dalam pengelompokan data
EDGI E-government Surve 2014 kedalam
4 status EDGI. Model yang dihasilkan diuji untuk mendapatkan nilai Bouldin
Index dari setiap algoritma sehingga
didapat pengujian dengan menggunakan data dan setelah dilakukan pengujian
dengan tools rapidminer didapat nilai
Bouldin Index adalah 0.593 pada algoritma
K-Medoids Chebyshev. suatu cluster akan dianggap memiliki skema clustering yang
optimal adalah yang memiliki Index
Davies Bouldin minimal maka dapat disimpulkan pengujian data EDGI E-
goverment Surve 2014 tersebut lebih
optomal dalam penentuan pengelompokan
EDI E-govermnet Surve 2014 ke dalam 4 status EDGI di bandingkan menggunakan mahattan atau ecludian.
3 (Pramesti,
Furqon & Dewi 2017)
Implementasi
Algoritma K-
MedoidsClustering Untuk
Pengelompokan
Data Potensi
Kebakaran Hutan / Lahan
Berdasarkan
Persebaran Titik Panas ( Hotspot )
Hasil analisis terhadap hasil clustering
menunjukkan bahwa dengan penggunaan 2
cluster menghasilkan kelompok data dengan potensi yang dimiliki yaitu cluster
1 termasuk dalam potensi tinggi dengan
hasil rata-rata brightness sebesar 344.470K
dengan rata-rata confidence 87.08% dan cluster 2 masuk dalam potensi sedang
dengan hasil rata-rata brightness sebesar
318.800K dengan rata-rata confidence sebesar 58,73%.
22
2.7.Kerangka Pemikiran
Peran dari data mining pada dasarnya dirancang sedemikian rupa sehingga
bersifat interaktif dengan pemakaiannya. Maksud dan tujuan adanya data mining
yaitu untuk membantu pihak Badan Pusat Statistik dalam menganalisa produksi
jagung menurut provinsi di Indonesia dengan menggunakan metode K-Medoids
clustering. Hal ini merupakan suatu pemrograman yang akan didukung dalam
menganalisa produksi jagung menurut provinsi di Indonesia dengan bahasa
pemrogaman matlab.
Kerangka pemikiran dari penelitian ini dilakukan dengan beberapa tahapan
antara lain:
1. Pendefinisian rumusan masalah.
2. Kemudian pada tahapan yang kedua melakukan analisis dengan penerapan
teknik data mining untuk membantu memecahkan rumusan masalah yang
ada.
3. Tahap ketiga adalah metode pengumpulan data dimana diambil sebagai
kepentingan penelitian dengan menggunakan sampel.
4. Di tahap ke empat merupakan pencarian subjek penelitian, dimana peneliti
mendapatkan data yang dibutuhkan dalam pencapaian tujuannya.
5. Sedangkan tahap terakhir adalah implementasi.
Hasil yang diperoleh dari penelitian ini adalah sistem data mining untuk
menganalisa produksi jagung menurut provinsi di Indonesia dengan menggunakan
metode K-Medoids clustering.
23
2.8.Tinjauan Umum Instansi
2.8.1. Sejarah Badan Pusat Statistik Indonesia
Kegiatan statistik di Indonesia sudah dilaksanakan sejak masa
pemerintahan Hindia Belanda oleh suatu lembaga yang didirikan oleh direktur
pertanian, kerajinan dan perdagangan (DPKP) di Bogor. Pada Februari 1920
lembaga tersebut bertugas mengolah dan mempublikasikan data statistic. Pada 24
September 1924 kegiatan statistik pindah ke Jakarta dengan nama Centraal
Kantoor Voor De Statistiek (CKS) dan melaksanakan sensus penduduk pertama di
Indonesia pada tahun 1930. Pada masa pemerintahan Jepang di Indonesia
pada tahun 1942-1945, CKS berubah nama menjadi Shomubu Chosasitsu
Gunseikanbu(SCG) dengan kegiatan memenuhi kebutuhan perang/militer.
Setelah Kemerdekaan Republik Indonesia (RI) diproklamasikan pada
tanggal 17 Agustus 1945, lembaga tersebut dinasionalisasikan dengan nama
Kantor Penyelidikan Perangkaan Umum Republik Indonesia (KAPPURI) dan
dipimpin oleh Mr. Abdul Karim Pringgodigdo. Setelah adanya surat edaran
kementerian kemakmuran tanggal 12 Juni 1950 Nomor 219/S.C., lembaga
KAPPURI dan CKS dilebur menjadi Kantor Pusat Statistik (KPS) dibawah
tanggung jawab Menteri Kemakmuran.
Berdasarkan surat keputusan Menteri Perekonomian Nomor P/44, KPS
bertanggung jawab kepada Menteri Perekonomian. Selanjutnya, melalui SK
Menteri Perekonomian tanggal 24 Desember 1953 Nomor IB.099/M kegiatan
KPS dibagi dalam dua bagian yaitu Afdeling A (Bagian Riset) dan Afdeling B
(Bagian penyelenggaraan dan Tata Usaha). Berdasarkan Keppres X nomor 172
24
tanggal 1 Juni 1957, KPS berubah menjadi Biro Pusat Statistik dan
bertanggungjawab langsung kepada Perdana Menteri.
Sesuai dengan UU No.6/1960 tentang sensus, BPS menyelenggarakan
sensus penduduk serentak di pada tahun 1961. Sensus penduduk tersebut
merupakan sensus penduduk pertama setelah Indonesia merdeka. Sensus
penduduk di tingkat provinsi dilaksanakan oleh kantor Gubernur, dan di tingkat
Kabupaten/Kotamadya dilaksanakan oleh kantor Bupati/Walikota, sedangkan
pada tingkat Kecamatan dibentuk bagian yang melaksanakan sensus penduduk.
Selanjutnya penyelenggara sensus di kantor Gubernur dan kantor
Bupati/Walikotaditetapkan menjadi kantor sensus dan statistik daerah berdasarkan
Keputusan Presidium Kabinet Nomor Aa/C/9 Tahun 1965.
Berdasarkan peraturan pemerintah No.16/1968 yang mengatur tentang
organisasi dan tata kerja BPS di pusat dan daerah serta perubahannya menjadi PP
No.6/1980, menyebutkan bahwa perwakilan BPS di daerah adalah kantor satistik
provinsi dan kantor statistik Kabupaten atau Kotamadya. Tentang organisasi BPS
ditetapkan kembali pada PP No. 2 Tahun 1992 yang disahkan pada 9 Januari
1992. Selanjutnya, kedudukan, fungsi, tugas, susunan organisasi dan tata kerja
BPS diatur dengan keputusan Presiden Nomor 6 Tahun 1992.
Pada tanggal 19 Mei 1997 ditetapkan UU Nomor 16 Tahun 1997 tentang
statistik, dimana Biro Pusat Statistik diubah namanya menjadi “Badan Pusat
Statistik”. Pada keputusan Presiden No.86 Tahun 1998 tentang Badan Pusat
Statistik, menetapkan bahwa perwakilan BPS di daerah merupakan instansi
vertikal dengan nama BPS Provinsi, BPS Kabupaten, dan BPS Kotamadya. Serta
25
pada tanggal 26 Mei 1999, ditetapkan PP Nomor 51 tahun 1999 tentang
penyelenggaraan statistik di Indonesia.
Visi Badan Pusat Statistik Indonesia
Adapun visi Badan Pusat Statistik Indonesia adalah “Pelopor Data
Statistik Terpercaya Untuk Semua”.
Misi Badan Pusat Statistik Indonesia
Adapun misi Badan Pusat Statistik Indonesia adalah sebagai berikut:
1. Menyediakan data statistik berkualitas melalui kegiatan statistik yang
terintegrasi dan berstandar nasional maupun internasional.
2. Memperkuat Sistem Statistik Nasional yang berkesinambungan melalui
pembinaan dan koordinasi di bidang statistik.
3. Membangun insan statistik yang profesional, berintegritas dan amanah
untuk kemajuan perstatistikan.
2.8.2. Struktur Organisasi Badan Pusat Statistik Indonesia
Organisasi berasal dari bahasa Yunani “orgonom” dan istilah latin
“orgonum” yang berarti alat bagian, anggota atau badan. Sehingga dapat di
defenisikan sebagai suatu wadah atau tempat sekelompok orang bekerja sama
dengan menggunakan dana, alat-alat dan teknologi serta mau terikat dengan
peraturan dan hubungan tertentu sehingga dapat mengarah kepada pencapaian
tujuan yang diinginkan.
Adapun struktur organisasi di Badan Pusat Statistik Indonesia adalah
sebagai berikut:
26
Gambar 2.3. Struktur Organisasi BPS Indonesia
2.8.3. Tugas dan Wewenang Badan Pusat Statistik
Tugas, fungsi dan kewenangan BPS telah ditetapkan berdasarkan
peraturan Presiden Nomor 86 Tahun 2007 tentang Badan Pusat Statistik dan
Peraturan Kepala Badan Pusat Statistik Nomor 7 Tahun 2008 tentang Organisasi
dan Tata Kerja Badan Pusat Statistik.
1. Tugas
Melaksanakan tugas pemerintahan di bidang kegiatan statistik sesuai
dengan ketentuan peraturan perundang-undangan yang berlaku.
2. Fungsi
a. Pengkajian, penyusunan dan perumusan kebijakan dibidang statistik;
b. Pengkoordinasian kegiatan statistik nasional dan regional;
c. Penetapan dan penyelenggaraan statistik dasar;
d. Penetapan dan penyelenggaraan statistik dasar;
Seksi Sosial
Seksi Produksi
Seksi Distribusi
Seksi IPDS Seksi Nerwilis
Fungsional
Kepala BPS
Bagian Tata Usaha
27
e. Pembinaan dan fasilitasi terhadap kegiatan instansi pemerintah dibidang
kegiatan statistik; dan
f. Penyelenggaraan pembinaan dan pelayanan administrasi umum dibidang
perencanaan umum, ketatausahaan, organisasi dan tatalaksana,
kepegawaian, keuangan, kearsipan, kehumasan, hukum, perlengkapan dan
rumah tangga.
3. Wewenang
a. Penyusunan rencana nasional secara makro di bidangnya;
b. Perumusan kebijakan di bidangnya untuk mendukung pembangunan
secara makro;
c. Penetapan sistem informasi di bidangnya;
d. Penetapan dan penyelenggaraan statistik nasional;
e. Kewenangan lain sesuai dengan ketentuan peraturan perundang-undangan
yang berlaku, yaitu;
f. Perumusan dan pelaksanaan kebijakan tertentu di bidang kegiatan
statistik;
2.9. Hipotesis
Berdasarkan pada rumusan masalah, tinjauan pustaka, kerangka pemikiran
di atas, maka hipotesis penelitian ini dapat penulis sampaikan bahwa dengan
adanya data mining metode K-Medoids clustering analisa produksi jagung
menurut provinsi di Indonesia akan memudahkan pihak Badan Pusat Statistik
untuk menganalisa produksi jagung menurut provinsi di Indonesia.