uas manajemen data

13
  DIT TI / DJHKI SKPL-DJHKI-01.04.20 11.xx Halaman 0 dari 33  Dokumen ini dan informasi yang d imilikinya ad alah milik Dire ktorat TI untu k DJHKI da n bersifat ra hasia. Dilara ng me- reproduksi dokumen ini tanpa diketahui Direktorat TI DJHKI. Sebagian data pada dokumen ini merupakan asumsi.  Manajemen Data Dosen : Dr. Yan Rianto Rini Wijayanti, M.Kom Nama : Yoga Prihastomo NIM : 1011601026 M  A  A G GIS T TER R  I IL LMU U K K OMP PUT TER R U UN NI  V  V E ER R SI I T T  A  A S  B B U UD DI  L L U UHUR R  2011  

Upload: yoga-prihastomo

Post on 08-Jul-2015

128 views

Category:

Documents


6 download

DESCRIPTION

UAS Manajemen DataMKOM Budi Luhur

TRANSCRIPT

5/10/2018 UAS Manajemen Data - slidepdf.com

http://slidepdf.com/reader/full/uas-manajemen-data 1/13

  DIT TI / DJHKI SKPL-DJHKI-01.04.2011.xx Halaman 0 dari 33

 Dokumen ini dan informasi yang dimilikinya adalah milik Direktorat TI untuk DJHKI dan bersifat rahasia. Dilarang me-reproduksi dokumen ini tanpa diketahui Direktorat TI DJHKI. Sebagian data pada dokumen ini merupakan asumsi.

Manajemen Data

Dosen : Dr. Yan RiantoRini Wijayanti, M.Kom

Nama : Yoga PrihastomoNIM : 1011601026

MM A  A GGIISSTTEER R IILLMMUU K K OOMMPPUUTTEER R  

UUNNII V  V EER R SSIITT A  A SS BBUUDDII LLUUHHUUR R  22001111 

5/10/2018 UAS Manajemen Data - slidepdf.com

http://slidepdf.com/reader/full/uas-manajemen-data 2/13

  1 

1.   Apa yang dimaksud dengan data mining dan jelaskan peran data mining dalam

proses pengambilan keputusan?

Jawab:

 Data  mining didefinisikan sebagai satu set teknik yang digunakan secara

otomatis untuk mengeksplorasi secara menyeluruh dan membawa ke permukaan

relasi-relasi yang kompleks pada set data yang sangat besar. Set data yang

dimaksud di sini adalah set data yang berbentuk tabulasi, seperti yang banyak 

diimplementasi-kan dalam teknologi manajemen basis data relasional. Akan

tetapi, teknik-teknik data mining dapat juga diaplikasikan pada representasi data

 yang lain, seperti domain data spatial, berbasis teks, dan multimedia (citra). Data

mining menggunakan pendekatan discovery-based  dimana pencocokan pola

( pattern-matching) dan algoritma-algoritma yang lain digunakan untuk menentu-

kan relasi-relasi kunci di dalam data yang diekplorasi.  Data  mining merupakan

komponen baru pada arsitektur sistem pendukung keputusan (DSS- Decision

 Support System) di perusahaan. Data mining (penambangan data), sesuai dengan

namanya, berkonotasi sebagai pencarian informasi bisnis yang berharga dari basis

data yang sangat besar. Usaha pencarian yang dilakukan dapat dianalogikan

dengan penambangan logam mulia dari lahan sumbernya.

Pada dasarnya penggalian data dibedakan menjadi dua fungsionalitas, yaitu

deskripsi dan  prediksi. Berikut ini beberapa fungsionalitas penggalian data

 yang sering digunakan:

  Karakterisasi dan Diskriminasi

  Penggalian pola berulang

  Klasifikasi

  Prediksi

  Penggugusan/Cluster analysis   Analisis outlier  

   Analisis trend dan evolusi

Jika ditinjau dari fungsionalitas di atas, maka data mining dapat membantu

penggunanya dalam proses pengambilan keputusan. Jika dua saja digunakan

fungsionalitas di atas yakni prediksi dan analisis trend, maka data mining dengan

teknik tertentu akan mengolah berbagai informasi menjadi sebuah hasil yang

signifikan untuk membantu proses pengambilan keputusan.

5/10/2018 UAS Manajemen Data - slidepdf.com

http://slidepdf.com/reader/full/uas-manajemen-data 3/13

  2 

2. Proses data mining umumnya didahului dengan preprocessing. Jelaskan minimal

3 tahapan dalam preprocessing tersebut?

Jawab:

Tahapan tersebut nampak pada gambar berikut:

  Ekstraksi. Data-data yang dikumpulkan dalam proses transaksi sering kali

ditempatkan pada lokasi yang berbeda-beda. Maka dari itu dibutuhkan

kemampuan dari sistem utuk dapat mengumpulkan data dengan cepat. Jika

data tersebut disimpan dalam kantor regional, sering kali data tersebut

diupload ke sebuah server yang lebih terpusat. Hal ini dapat dilakukan secara

harian, mingguan, atau bulanan tergantung jumlah data, keamanan dan biaya.

Data dapat diringkas dulu sebelum dikirimkan ke tempat penyimpanan pusat.

  Seleksi & Pembersihan. Proses pembersihan data, dimana informasi yg

tidak dibutuhkan dibuang. Data dikonfigurasi ulang untuk memastikan format

 yg konsisten krn berasal dari berbagai sumber. Data-data yang telah terkumpul

selanjutnya akan mengalami proses pembersihan. Proses pembersihan data

dilakukan untuk membuang record  yang keliru, menstandarkan attribut-

attribut, merasionalisasi struktur data, dan mengendalikan data yang hilang.

Data yang tidak konsisten dan banyak kekeliruan membuat hasil data mining

tidak akurat. Adalah sangat penting untuk membuat data konsisten dan

seiagam. Pembersihan data juga dapat membantu perusahaan untuk 

mengkonsolidasikan record . Hal ini sangat berguna ketika sebuah perusahaan

mempunyai banyak  record  untuk seorang pelanggan. Setiap record  atau file

5/10/2018 UAS Manajemen Data - slidepdf.com

http://slidepdf.com/reader/full/uas-manajemen-data 4/13

  3 

pelanggan mempunyai nomor pelanggan yang sama, tetapi informasi dalam

tiap filenya berbeda.

  Transformasi. Transformasi data adalah melakukan peringkasan data dengan

mengasumsikan bahwa data telah tersimpan dalam tempat penyimpanan

tunggal. Pada langkah terakhir, data telah diekstrak dari banyak basis data ke

dalam basis data tunggal. Tipe peringkasan yang dikerjakan dalam langkah ini

mirip dengan peringkasan yang dikerjakan selama tahap ekstraksi. Beberapa

perusahaan memilih untuk menngkas data dalam sebuah tempat penyimpanan

tunggal. Fungsi-fungsi agregate yang sering digunakan antara lain: summari-

 zations, averages, minimum, maximum, dan count .

3. Dalam transaksi pembelian tercatat beberapa transaksi berikut ini:

Trans_ID Customer_ID Date Item

111 201 05/01/2002 Ink 

111 201 05/01/2002 Milk 

111 201 05/01/2002 Juice

112 105 06/03/2002 Pen

112 105 06/03/2002 Ink 

112 105 06/03/2002 Water

113 106 05/10/2002 Pen

113 106 05/10/2002 Water

113 106 05/10/2002 Milk 

114 201 06/01/2002 Pen

114 201 06/01/2002 Ink 

114 201 06/01/2002 Juice

114 201 06/01/2002 Water

114 201 06/01/2002 Milk 

Berdasarkan data tersebut, carilah aturan asosiasi yang terbentuk jika diberikan

minimum support 60% dan minimum confidence 90%

Jawab:

Rumus confidence adalah sebagai berikut:

Confidence = Support (X U Y)Support (X)

5/10/2018 UAS Manajemen Data - slidepdf.com

http://slidepdf.com/reader/full/uas-manajemen-data 5/13

  4 

Trans_ID Customer_ID Date Item

111 201 05/01/2002 Ink, Milk, Juice

112 105 06/03/2002 Pen, Ink, Water

113 106 05/10/2002 Pen, Water, Milk 

114 201 06/01/2002 Pen, Ink, Juice, Water, Milk 

L-1Candidate -1

Item Jumlah Support Keterangan

Ink 3 3/4 Memenuhi

Milk 3 3/4 Memenuhi

Juice 1 1/4 Tdk Memenuhi

Pen 3 3/4 Memenuhi

  Water 3 3/4 Memenuhi

L-2 {Ink, Milk, Pen, Water}

Candidate -2

Item Jumlah Support Keterangan

{Ink, Milk} 2 2/4 Tdk Memenuhi

{Ink, Pen} 2 2/4 Tdk Memenuhi

{Ink, Water} 2 2/4 Tdk Memenuhi

{Milk, Pen} 2 2/4 Tdk Memenuhi

{Milk, Water} 2 2/4 Tdk Memenuhi{Pen, Water} 3 3/4 Memenuhi

L-3Candidate - 3 Item = L-3 = Ǿ 

ITEM PERSENTASE Keterangan

L = {Pen, Water} (3/4) : (3/4) = 1 = 100 % Memenuhi

L = {Water, Pen} (3/4) : (3/4) = 1 = 100% Memenuhi

Kesimpulan Confidence >= 90 %Pen Water

 Water Pen

5/10/2018 UAS Manajemen Data - slidepdf.com

http://slidepdf.com/reader/full/uas-manajemen-data 6/13

  5 

4. Dengan menggunakan rapidminer, buatlah 3 cluster untuk data dibawah ini dan

 jelaskan hasilnya (setiap cluster ada berapa item dan item-item tersebut masuk ke

cluster mana)

X1 X2

10 5

20 20

30 10

30 15

5 10

15 20

10 20

30 20

20 5

Jawab: 

Spesifikasi:

  Rapidminer : 5.1

  External data : Excel

  Clustering : k-Means

  Cluster (k) : 3

Hasil yang didapatkan setelah me-run rapid  miner adalah:

5/10/2018 UAS Manajemen Data - slidepdf.com

http://slidepdf.com/reader/full/uas-manajemen-data 7/13

  6 

Cluster Model:  Cluster 0: 3 items

  Cluster 1: 3 items

  Cluster 2: 3 items

Total number of items: 9

5/10/2018 UAS Manajemen Data - slidepdf.com

http://slidepdf.com/reader/full/uas-manajemen-data 8/13

  7 

5. Buatlah tree untuk mendeteksi penyakit jantung berdasarkan data dibawah ini:

Usia Jenis Kelamin Merokok Olah Raga Jantung

Tua Pria Tidak Ya Tidak 

Tua Pria Ya Ya Tidak Muda Pria Ya Tidak Tidak 

Tua Pria Tidak Tidak Tidak 

Muda Wanita Tidak Tidak Ya

Muda Pria Tidak Ya Tidak 

Tua Wanita Tidak Tidak Ya

Muda Pria Ya Tidak Tidak 

Tua Pria Ya Tidak Tidak 

Muda Pria Ya Ya Ya

Tua Pria Ya Tidak Tidak 

Muda Pria Tidak Tidak Tidak Tua Pria Tidak Ya Tidak 

Muda Pria Ya Tidak Tidak 

Jawab: 

Usia Jantung Jumlah

Tua Ya 1

Tua Tidak 6

Muda Ya 2Muda Tidak 5

Total 14

Usia = Tua

  Q1= –1/7 Log2(1/7) – 6/7 Log2(6/7) = 0.59

Usia = Muda

  Q2= –2/7 Log2(2/7) – 5/7 Log2(5/7) = 0.86

 Entropy untuk Usia  E= 7/14(0.59) + 7/14(0.86) = 0.73

Jenis Kelamin Jantung Jumlah

Pria Ya 1

Pria Tidak 11

  Wanita Ya 2

  Wanita Tidak 0

Total 14

5/10/2018 UAS Manajemen Data - slidepdf.com

http://slidepdf.com/reader/full/uas-manajemen-data 9/13

  8 

 Jenis Kelamin = Pria

  Q1= –1/12 Log2(1/12) – 11/12 Log2(11/12) = 0.41

 Jenis Kelamin = Wanita

  Q2= –2/2 Log2(2/2) – 0/2 Log2(0/2) = 0

 Entropy untuk Jenis Kelamin

  E= 12/14(0.41) + 2/14(0) = 0.50

Merokok Jantung Jumlah

  Ya Ya 1

  Ya Tidak 6

Tidak Ya 2

Tidak Tidak 5Total 14

 Merokok = YA

  Q1= –1/7 Log2(1/7) – 6/7 Log2(6/7) = 0.59

 Merokok = TIDAK 

  Q2= –2/7 Log2(2/7) – 5/7 Log2(5/7) = 0.86

 Entropy untuk Merokok

  E= 7/14(0.59) + 7/14(0.86) = 0.73

Olah Raga Jantung Jumlah

  Ya Ya 1

  Ya Tidak 4

Tidak Ya 2

Tidak Tidak 7

Total 14

Olah Raga = YA

  Q1= –1/5 Log2(1/5) – 4/5 Log2(4/5) = 0.72

Olah Raga = TIDAK 

  Q2= –2/9 Log2(2/9) – 7/9 Log2(7/9) = 0.76

 Entropy untuk Olah Raga

  E= 5/14(0.72) + 9/14(0.76) = 0.75

5/10/2018 UAS Manajemen Data - slidepdf.com

http://slidepdf.com/reader/full/uas-manajemen-data 10/13

  9 

Penentuan leaf node untuk jenis kelamin Pria

Usia Jenis Kelamin Merokok Olah Raga Jantung

Tua Pria Tidak Ya Tidak 

Tua Pria Ya Ya Tidak Muda Pria Ya Tidak Tidak 

Tua Pria Tidak Tidak Tidak 

Muda Pria Tidak Ya Tidak 

Muda Pria Ya Tidak Tidak 

Tua Pria Ya Tidak Tidak 

Muda Pria Ya Ya Ya

Tua Pria Ya Tidak Tidak 

Muda Pria Tidak Tidak Tidak 

Tua Pria Tidak Ya Tidak 

Muda Pria Ya Tidak Tidak 

Usia Jantung Jumlah

Tua Ya 1

Tua Tidak 6

Muda Ya 0

Muda Tidak 5

Total 12

Usia = Tua

  Q1= –1/7 Log2(1/7) – 6/7 Log2(6/7) = 0.59

Usia = Muda

  Q2= –0/5 Log2(0/5) – 5/5 Log2(5/5) = 0

 Entropy untuk Usia

  E= 7/12(0.59) + 5/12(0) = 0.35

Merokok Jantung Jumlah

  Ya Ya 1

  Ya Tidak 6

Tidak Ya 0

Tidak Tidak 5

Total 12

 Merokok = YA

 Q1= –1/7 Log2(1/7) – 6/7 Log2(6/7) = 0.59

5/10/2018 UAS Manajemen Data - slidepdf.com

http://slidepdf.com/reader/full/uas-manajemen-data 11/13

  10 

 Merokok = TIDAK 

  Q2= –0/5 Log2(0/5) – 5/5 Log2(5/5) = 0

 Entropy untuk Merokok

  E= 7/12(0.59) + 7/12(0) = 0.35

Merokok Jantung Jumlah

  Ya Ya 1

  Ya Tidak 4

Tidak Ya 0

Tidak Tidak 7

Total 12

Olah Raga = YA

  Q1= –1/5 Log2(1/5) – 4/5 Log2(4/5) = 0.72

Olah Raga = TIDAK 

  Q2= –0/7 Log2(0/7) – 7/7 Log2(7/7) = 0

 Entropy untuk Olah Raga

  E= 5/12(0.72) + 7/12(0) = 0.30

Penentuan leaf node untuk olah raga Ya

Usia Jenis Kelamin Merokok Olah Raga Jantung

Tua Pria Tidak Ya Tidak 

Tua Pria Ya Ya Tidak 

Muda Pria Tidak Ya Tidak 

Muda Pria Ya Ya Ya

Tua Pria Tidak Ya Tidak 

Usia Jantung Jumlah

Tua Ya 0

Tua Tidak 3

Muda Ya 1

Muda Tidak 1

Total 5

Usia = Tua

 Q1= –0/3 Log2(0/3) – 3/3 Log2(3/3) = 0

5/10/2018 UAS Manajemen Data - slidepdf.com

http://slidepdf.com/reader/full/uas-manajemen-data 12/13

  11 

Usia = Muda

  Q2= –1/2 Log2(1/2) – 1/2 Log2(1/2) = 1

 Entropy untuk Usia

  E= 3/5(0) + 2/5(1) = 0.40

Merokok Jantung Jumlah

  Ya Ya 1

  Ya Tidak 1

Tidak Ya 0

Tidak Tidak 3

Total 5

 Merokok = YA  Q1= –1/2 Log2(1/2) – 1/2 Log2(1/2) = 1

 Merokok = TIDAK 

  Q2= –0/3 Log2(0/3) – 3/3 Log2(3/3) = 0

 Entropy untuk Merokok

  E= 2/5(1) + 3/5(0) = 0.40

Pada kondisi merokok terdapat 1 data menyatakan YA 

R1= IF Jenis Kelamin = Wanita THEN Jantung = YA 

R2 = IF Jenis Kelamin = Pria ^ Olah Raga = Tidak 

THEN Jantung = TIDAK 

R3 = IF Jenis Kelamin = Pria ^ Olah Raga = YA ^ Usia = Tua

THEN Jantung = Tidak 

R4 = IF Jenis Kelamin = Pria ^ Olah Raga = YA ^ Usia = Muda ^

Merokok = TIDAK THEN Jantung = Tidak 

R5 = IF Jenis Kelamin = Pria ^ Olah Raga = YA ^ Usia = Muda ^

Merokok = YA THEN Jantung = YA 

5/10/2018 UAS Manajemen Data - slidepdf.com

http://slidepdf.com/reader/full/uas-manajemen-data 13/13

  12 

Tree yang dihasilkan adalah sebagai berikut:

Jenis Kelamin

Olah Raga  Ya

Usia

Tidak 

Tidak 

Merokok 

  Ya Tidak 

Pria  Wanita

 Ya Tidak 

Muda Tua