uas manajemen data
DESCRIPTION
UAS Manajemen DataMKOM Budi LuhurTRANSCRIPT
5/10/2018 UAS Manajemen Data - slidepdf.com
http://slidepdf.com/reader/full/uas-manajemen-data 1/13
DIT TI / DJHKI SKPL-DJHKI-01.04.2011.xx Halaman 0 dari 33
Dokumen ini dan informasi yang dimilikinya adalah milik Direktorat TI untuk DJHKI dan bersifat rahasia. Dilarang me-reproduksi dokumen ini tanpa diketahui Direktorat TI DJHKI. Sebagian data pada dokumen ini merupakan asumsi.
Manajemen Data
Dosen : Dr. Yan RiantoRini Wijayanti, M.Kom
Nama : Yoga PrihastomoNIM : 1011601026
MM A A GGIISSTTEER R IILLMMUU K K OOMMPPUUTTEER R
UUNNII V V EER R SSIITT A A SS BBUUDDII LLUUHHUUR R 22001111
5/10/2018 UAS Manajemen Data - slidepdf.com
http://slidepdf.com/reader/full/uas-manajemen-data 2/13
1
1. Apa yang dimaksud dengan data mining dan jelaskan peran data mining dalam
proses pengambilan keputusan?
Jawab:
Data mining didefinisikan sebagai satu set teknik yang digunakan secara
otomatis untuk mengeksplorasi secara menyeluruh dan membawa ke permukaan
relasi-relasi yang kompleks pada set data yang sangat besar. Set data yang
dimaksud di sini adalah set data yang berbentuk tabulasi, seperti yang banyak
diimplementasi-kan dalam teknologi manajemen basis data relasional. Akan
tetapi, teknik-teknik data mining dapat juga diaplikasikan pada representasi data
yang lain, seperti domain data spatial, berbasis teks, dan multimedia (citra). Data
mining menggunakan pendekatan discovery-based dimana pencocokan pola
( pattern-matching) dan algoritma-algoritma yang lain digunakan untuk menentu-
kan relasi-relasi kunci di dalam data yang diekplorasi. Data mining merupakan
komponen baru pada arsitektur sistem pendukung keputusan (DSS- Decision
Support System) di perusahaan. Data mining (penambangan data), sesuai dengan
namanya, berkonotasi sebagai pencarian informasi bisnis yang berharga dari basis
data yang sangat besar. Usaha pencarian yang dilakukan dapat dianalogikan
dengan penambangan logam mulia dari lahan sumbernya.
Pada dasarnya penggalian data dibedakan menjadi dua fungsionalitas, yaitu
deskripsi dan prediksi. Berikut ini beberapa fungsionalitas penggalian data
yang sering digunakan:
Karakterisasi dan Diskriminasi
Penggalian pola berulang
Klasifikasi
Prediksi
Penggugusan/Cluster analysis Analisis outlier
Analisis trend dan evolusi
Jika ditinjau dari fungsionalitas di atas, maka data mining dapat membantu
penggunanya dalam proses pengambilan keputusan. Jika dua saja digunakan
fungsionalitas di atas yakni prediksi dan analisis trend, maka data mining dengan
teknik tertentu akan mengolah berbagai informasi menjadi sebuah hasil yang
signifikan untuk membantu proses pengambilan keputusan.
5/10/2018 UAS Manajemen Data - slidepdf.com
http://slidepdf.com/reader/full/uas-manajemen-data 3/13
2
2. Proses data mining umumnya didahului dengan preprocessing. Jelaskan minimal
3 tahapan dalam preprocessing tersebut?
Jawab:
Tahapan tersebut nampak pada gambar berikut:
Ekstraksi. Data-data yang dikumpulkan dalam proses transaksi sering kali
ditempatkan pada lokasi yang berbeda-beda. Maka dari itu dibutuhkan
kemampuan dari sistem utuk dapat mengumpulkan data dengan cepat. Jika
data tersebut disimpan dalam kantor regional, sering kali data tersebut
diupload ke sebuah server yang lebih terpusat. Hal ini dapat dilakukan secara
harian, mingguan, atau bulanan tergantung jumlah data, keamanan dan biaya.
Data dapat diringkas dulu sebelum dikirimkan ke tempat penyimpanan pusat.
Seleksi & Pembersihan. Proses pembersihan data, dimana informasi yg
tidak dibutuhkan dibuang. Data dikonfigurasi ulang untuk memastikan format
yg konsisten krn berasal dari berbagai sumber. Data-data yang telah terkumpul
selanjutnya akan mengalami proses pembersihan. Proses pembersihan data
dilakukan untuk membuang record yang keliru, menstandarkan attribut-
attribut, merasionalisasi struktur data, dan mengendalikan data yang hilang.
Data yang tidak konsisten dan banyak kekeliruan membuat hasil data mining
tidak akurat. Adalah sangat penting untuk membuat data konsisten dan
seiagam. Pembersihan data juga dapat membantu perusahaan untuk
mengkonsolidasikan record . Hal ini sangat berguna ketika sebuah perusahaan
mempunyai banyak record untuk seorang pelanggan. Setiap record atau file
5/10/2018 UAS Manajemen Data - slidepdf.com
http://slidepdf.com/reader/full/uas-manajemen-data 4/13
3
pelanggan mempunyai nomor pelanggan yang sama, tetapi informasi dalam
tiap filenya berbeda.
Transformasi. Transformasi data adalah melakukan peringkasan data dengan
mengasumsikan bahwa data telah tersimpan dalam tempat penyimpanan
tunggal. Pada langkah terakhir, data telah diekstrak dari banyak basis data ke
dalam basis data tunggal. Tipe peringkasan yang dikerjakan dalam langkah ini
mirip dengan peringkasan yang dikerjakan selama tahap ekstraksi. Beberapa
perusahaan memilih untuk menngkas data dalam sebuah tempat penyimpanan
tunggal. Fungsi-fungsi agregate yang sering digunakan antara lain: summari-
zations, averages, minimum, maximum, dan count .
3. Dalam transaksi pembelian tercatat beberapa transaksi berikut ini:
Trans_ID Customer_ID Date Item
111 201 05/01/2002 Ink
111 201 05/01/2002 Milk
111 201 05/01/2002 Juice
112 105 06/03/2002 Pen
112 105 06/03/2002 Ink
112 105 06/03/2002 Water
113 106 05/10/2002 Pen
113 106 05/10/2002 Water
113 106 05/10/2002 Milk
114 201 06/01/2002 Pen
114 201 06/01/2002 Ink
114 201 06/01/2002 Juice
114 201 06/01/2002 Water
114 201 06/01/2002 Milk
Berdasarkan data tersebut, carilah aturan asosiasi yang terbentuk jika diberikan
minimum support 60% dan minimum confidence 90%
Jawab:
Rumus confidence adalah sebagai berikut:
Confidence = Support (X U Y)Support (X)
5/10/2018 UAS Manajemen Data - slidepdf.com
http://slidepdf.com/reader/full/uas-manajemen-data 5/13
4
Trans_ID Customer_ID Date Item
111 201 05/01/2002 Ink, Milk, Juice
112 105 06/03/2002 Pen, Ink, Water
113 106 05/10/2002 Pen, Water, Milk
114 201 06/01/2002 Pen, Ink, Juice, Water, Milk
L-1Candidate -1
Item Jumlah Support Keterangan
Ink 3 3/4 Memenuhi
Milk 3 3/4 Memenuhi
Juice 1 1/4 Tdk Memenuhi
Pen 3 3/4 Memenuhi
Water 3 3/4 Memenuhi
L-2 {Ink, Milk, Pen, Water}
Candidate -2
Item Jumlah Support Keterangan
{Ink, Milk} 2 2/4 Tdk Memenuhi
{Ink, Pen} 2 2/4 Tdk Memenuhi
{Ink, Water} 2 2/4 Tdk Memenuhi
{Milk, Pen} 2 2/4 Tdk Memenuhi
{Milk, Water} 2 2/4 Tdk Memenuhi{Pen, Water} 3 3/4 Memenuhi
L-3Candidate - 3 Item = L-3 = Ǿ
ITEM PERSENTASE Keterangan
L = {Pen, Water} (3/4) : (3/4) = 1 = 100 % Memenuhi
L = {Water, Pen} (3/4) : (3/4) = 1 = 100% Memenuhi
Kesimpulan Confidence >= 90 %Pen Water
Water Pen
5/10/2018 UAS Manajemen Data - slidepdf.com
http://slidepdf.com/reader/full/uas-manajemen-data 6/13
5
4. Dengan menggunakan rapidminer, buatlah 3 cluster untuk data dibawah ini dan
jelaskan hasilnya (setiap cluster ada berapa item dan item-item tersebut masuk ke
cluster mana)
X1 X2
10 5
20 20
30 10
30 15
5 10
15 20
10 20
30 20
20 5
Jawab:
Spesifikasi:
Rapidminer : 5.1
External data : Excel
Clustering : k-Means
Cluster (k) : 3
Hasil yang didapatkan setelah me-run rapid miner adalah:
5/10/2018 UAS Manajemen Data - slidepdf.com
http://slidepdf.com/reader/full/uas-manajemen-data 7/13
6
Cluster Model: Cluster 0: 3 items
Cluster 1: 3 items
Cluster 2: 3 items
Total number of items: 9
5/10/2018 UAS Manajemen Data - slidepdf.com
http://slidepdf.com/reader/full/uas-manajemen-data 8/13
7
5. Buatlah tree untuk mendeteksi penyakit jantung berdasarkan data dibawah ini:
Usia Jenis Kelamin Merokok Olah Raga Jantung
Tua Pria Tidak Ya Tidak
Tua Pria Ya Ya Tidak Muda Pria Ya Tidak Tidak
Tua Pria Tidak Tidak Tidak
Muda Wanita Tidak Tidak Ya
Muda Pria Tidak Ya Tidak
Tua Wanita Tidak Tidak Ya
Muda Pria Ya Tidak Tidak
Tua Pria Ya Tidak Tidak
Muda Pria Ya Ya Ya
Tua Pria Ya Tidak Tidak
Muda Pria Tidak Tidak Tidak Tua Pria Tidak Ya Tidak
Muda Pria Ya Tidak Tidak
Jawab:
Usia Jantung Jumlah
Tua Ya 1
Tua Tidak 6
Muda Ya 2Muda Tidak 5
Total 14
Usia = Tua
Q1= –1/7 Log2(1/7) – 6/7 Log2(6/7) = 0.59
Usia = Muda
Q2= –2/7 Log2(2/7) – 5/7 Log2(5/7) = 0.86
Entropy untuk Usia E= 7/14(0.59) + 7/14(0.86) = 0.73
Jenis Kelamin Jantung Jumlah
Pria Ya 1
Pria Tidak 11
Wanita Ya 2
Wanita Tidak 0
Total 14
5/10/2018 UAS Manajemen Data - slidepdf.com
http://slidepdf.com/reader/full/uas-manajemen-data 9/13
8
Jenis Kelamin = Pria
Q1= –1/12 Log2(1/12) – 11/12 Log2(11/12) = 0.41
Jenis Kelamin = Wanita
Q2= –2/2 Log2(2/2) – 0/2 Log2(0/2) = 0
Entropy untuk Jenis Kelamin
E= 12/14(0.41) + 2/14(0) = 0.50
Merokok Jantung Jumlah
Ya Ya 1
Ya Tidak 6
Tidak Ya 2
Tidak Tidak 5Total 14
Merokok = YA
Q1= –1/7 Log2(1/7) – 6/7 Log2(6/7) = 0.59
Merokok = TIDAK
Q2= –2/7 Log2(2/7) – 5/7 Log2(5/7) = 0.86
Entropy untuk Merokok
E= 7/14(0.59) + 7/14(0.86) = 0.73
Olah Raga Jantung Jumlah
Ya Ya 1
Ya Tidak 4
Tidak Ya 2
Tidak Tidak 7
Total 14
Olah Raga = YA
Q1= –1/5 Log2(1/5) – 4/5 Log2(4/5) = 0.72
Olah Raga = TIDAK
Q2= –2/9 Log2(2/9) – 7/9 Log2(7/9) = 0.76
Entropy untuk Olah Raga
E= 5/14(0.72) + 9/14(0.76) = 0.75
5/10/2018 UAS Manajemen Data - slidepdf.com
http://slidepdf.com/reader/full/uas-manajemen-data 10/13
9
Penentuan leaf node untuk jenis kelamin Pria
Usia Jenis Kelamin Merokok Olah Raga Jantung
Tua Pria Tidak Ya Tidak
Tua Pria Ya Ya Tidak Muda Pria Ya Tidak Tidak
Tua Pria Tidak Tidak Tidak
Muda Pria Tidak Ya Tidak
Muda Pria Ya Tidak Tidak
Tua Pria Ya Tidak Tidak
Muda Pria Ya Ya Ya
Tua Pria Ya Tidak Tidak
Muda Pria Tidak Tidak Tidak
Tua Pria Tidak Ya Tidak
Muda Pria Ya Tidak Tidak
Usia Jantung Jumlah
Tua Ya 1
Tua Tidak 6
Muda Ya 0
Muda Tidak 5
Total 12
Usia = Tua
Q1= –1/7 Log2(1/7) – 6/7 Log2(6/7) = 0.59
Usia = Muda
Q2= –0/5 Log2(0/5) – 5/5 Log2(5/5) = 0
Entropy untuk Usia
E= 7/12(0.59) + 5/12(0) = 0.35
Merokok Jantung Jumlah
Ya Ya 1
Ya Tidak 6
Tidak Ya 0
Tidak Tidak 5
Total 12
Merokok = YA
Q1= –1/7 Log2(1/7) – 6/7 Log2(6/7) = 0.59
5/10/2018 UAS Manajemen Data - slidepdf.com
http://slidepdf.com/reader/full/uas-manajemen-data 11/13
10
Merokok = TIDAK
Q2= –0/5 Log2(0/5) – 5/5 Log2(5/5) = 0
Entropy untuk Merokok
E= 7/12(0.59) + 7/12(0) = 0.35
Merokok Jantung Jumlah
Ya Ya 1
Ya Tidak 4
Tidak Ya 0
Tidak Tidak 7
Total 12
Olah Raga = YA
Q1= –1/5 Log2(1/5) – 4/5 Log2(4/5) = 0.72
Olah Raga = TIDAK
Q2= –0/7 Log2(0/7) – 7/7 Log2(7/7) = 0
Entropy untuk Olah Raga
E= 5/12(0.72) + 7/12(0) = 0.30
Penentuan leaf node untuk olah raga Ya
Usia Jenis Kelamin Merokok Olah Raga Jantung
Tua Pria Tidak Ya Tidak
Tua Pria Ya Ya Tidak
Muda Pria Tidak Ya Tidak
Muda Pria Ya Ya Ya
Tua Pria Tidak Ya Tidak
Usia Jantung Jumlah
Tua Ya 0
Tua Tidak 3
Muda Ya 1
Muda Tidak 1
Total 5
Usia = Tua
Q1= –0/3 Log2(0/3) – 3/3 Log2(3/3) = 0
5/10/2018 UAS Manajemen Data - slidepdf.com
http://slidepdf.com/reader/full/uas-manajemen-data 12/13
11
Usia = Muda
Q2= –1/2 Log2(1/2) – 1/2 Log2(1/2) = 1
Entropy untuk Usia
E= 3/5(0) + 2/5(1) = 0.40
Merokok Jantung Jumlah
Ya Ya 1
Ya Tidak 1
Tidak Ya 0
Tidak Tidak 3
Total 5
Merokok = YA Q1= –1/2 Log2(1/2) – 1/2 Log2(1/2) = 1
Merokok = TIDAK
Q2= –0/3 Log2(0/3) – 3/3 Log2(3/3) = 0
Entropy untuk Merokok
E= 2/5(1) + 3/5(0) = 0.40
Pada kondisi merokok terdapat 1 data menyatakan YA
R1= IF Jenis Kelamin = Wanita THEN Jantung = YA
R2 = IF Jenis Kelamin = Pria ^ Olah Raga = Tidak
THEN Jantung = TIDAK
R3 = IF Jenis Kelamin = Pria ^ Olah Raga = YA ^ Usia = Tua
THEN Jantung = Tidak
R4 = IF Jenis Kelamin = Pria ^ Olah Raga = YA ^ Usia = Muda ^
Merokok = TIDAK THEN Jantung = Tidak
R5 = IF Jenis Kelamin = Pria ^ Olah Raga = YA ^ Usia = Muda ^
Merokok = YA THEN Jantung = YA