2 mesin pembelajaran rev
TRANSCRIPT
Ide Mesin Pembelajaran
# Cuaca Temperatur Kecepatan Angin Berolah-raga
Fakta harian dalam 6 hari dan keputusan untuk berolah-raga sebagai berikut:
1 Cerah Normal Pelan Ya2 Cerah Normal Pelan Ya3 Hujan Tinggi Pelan Tidak3 Hujan Tinggi Pelan Tidak4 Cerah Normal Kencang Ya5 Hujan Tinggi Kencang Tidak6 C h N l P l Y6 Cerah Normal Pelan Ya
(1)Ketika cuaca cerah, apakah akan berolah-raga?(2)Ketika cuaca cerah dan temperatur normal, apakah akan berolah-raga?(2)Ketika cuaca cerah dan temperatur normal, apakah akan berolah raga?
Penyajian keputusan berdasarkan f kt i il h ilh ifakta inilah yang mengilhami
konsep dari mesin pembelajaran
Klasifikasi• Klasifikasi merupakan proses pembelajaran suatu fungsi
tujuan (target) f yang memetakan tiap himpunan atribut xke satu dari label kelas y yang didefinisikan sebelumnya.
• Fungsi target disebut juga model klasifikasi
Ilustrasi Proses KlasifikasiTid Attrib1 Attrib2 Attrib3 Class
1 Yes Large 125K No
2 No Medium 100K No
Learn
3 No Small 70K No
4 Yes Medium 120K No
5 No Large 95K Yes
6 No Medium 60K No
Learn Model
7 Yes Large 220K No
8 No Small 85K Yes
9 No Medium 75K No
10 No Small 90K Yes 10
Apply ModelTid Attrib1 Attrib2 Attrib3 Class
11 No Small 55K ?
12 Yes Medium 80K ?
13 Yes Large 110K ?
14 No Small 95K ?
15 No Large 67K ? 10
Data Training
Day Cuaca Temperatur Kecepatan Angin Berolah-raga
KeyAttribut
Target
D1 Cerah Normal Pelan YaD2 Cerah Normal Pelan YaD3 Hujan Tinggi Pelan TidakD3 Hujan Tinggi Pelan TidakD4 Cerah Normal Kencang YaD5 Hujan Tinggi Kencang Tidak
• Attribut adalah kolom data, ada atribut dan targetInstance adalah isi dari attribut sebagai contoh attribut
D6 Cerah Normal Pelan Ya
• Instance adalah isi dari attribut sebagai contoh attribut cuaca mempunyai instance “cerah” dan “hujan”, sering ditulis dengan cuaca={cerah,hujan}
• Record/tuple adalah baris data
Data Konsisten
# Cuaca Temperatur Kecepatan Angin Berolah-raga
3 Hujan Tinggi Pelan Tidak
5 Hujan Tinggi Kencang Tidak
Attribut cuaca dan temperatur mempunyai nilai yang sama dalam satu kep t san (berolah raga) maka data ini adalah data ang konsistenkeputusan (berolah-raga), maka data ini adalah data yang konsisten.
# Cuaca Temperatur Kecepatan Angin Berolah-raga
1 Cerah Normal Pelan Ya
2 Cerah Tinggi Pelan Yagg
4 Hujan Normal Kencang Ya
6 Cerah Normal Pelan Ya
Tidak satupun attibut yang mempunyai nilai yang sama dalam satu keputusan (berolah-raga), maka data ini adalah data yang tidak konsisten.
Data Bias
# Cuaca Temperatur Kecepatan Angin Berolah-raga
1 Cerah Normal Pelan Ya2 Cerah Normal Pelan Ya3 Hujan Normal Pelan Yaj4 Cerah Normal Pelan Tidak
Perhatikan data ke 4, data ini mempunyai keputusan yang berbeda dengan data 1 dan data 2, tetapi instance pada semua attributnya sama, sehinggadata 1 dan data 2, tetapi instance pada semua attributnya sama, sehingga data ini disebut dengan data bias.
Hipotesa
Hipotesa dituliskan dengan:H(attribut1, attribut2, …, attributn) = keputusan( 1, 2, , n) p
H(cuaca=cerah, temperatur=normal, kec.angin=pelan) = yaHipotesa ini menunjukkan bahwa keputusan untuk berolahraga bila cuaca=cerah, temperatur=normal dan kec.angin=pelan, untuk singkatnya dituliskan hanya instance pada setiap attibut dengan H(cerah,normal,pelan)=ya
H(cuaca=cerah, kec.angin=pelan) = yaHipotesa ini menunjukkan bahwa keputusan untuk berolahraga bila cuaca=cerah, dan kec.angin=pelan, untuk singkatnya dituliskan hanya instance pada setiap attibut dengan H(cerah,*,pelan)=ya
H(cuaca=cerah) = yaHipotesa ini menunjukkan bahwa keputusan untuk berolahraga bila cuaca=cerahHipotesa ini menunjukkan bahwa keputusan untuk berolahraga bila cuaca=cerah, untuk singkatnya dituliskan hanya instance pada setiap attibut dengan H(cerah,*,*)=ya
Ide Mesin Pembelajaran
Pada dasarnya semua algoritma dik b k d l i yang dikembangkan dalam mesin
pembelajaran adalah algoritma yang menghasilkan hipotesa dari yang menghasilkan hipotesa dari
suatu keputusan berdasarkan data pembelajaran yang diberikan.
Find-S
• Find-S adalah suatu metode paling sederhana yang dapat digunakan untuk mendapatkan suatu hipotesa berdasarkan data.
• Find-S mencari kesamaan nilai attribut untuk memperoleh suatu hipotesaK l h d i Fi d S d l h d t• Kelemahan dari Find-S adalah data yang digunakan harus bersifat konsisten dan tidak bias ??? (Terlalu sulit untuk dapat memperolehbias ??? (Terlalu sulit untuk dapat memperoleh data semacam ini pada persoalan nyata)
(1) Langkah Find-S
Day Cuaca Temperatur Kecepatan Angin Berolah-ragay p p g gD1 Cerah Normal Pelan YaD2 Cerah Normal Pelan YaD3 Hujan Tinggi Pelan TidakD3 Hujan Tinggi Pelan TidakD4 Cerah Normal Kencang YaD5 Hujan Tinggi Kencang TidakD6 Cerah Normal Pelan Ya
Untuk memperoleh hipotesa dengan Find-S dari data training di atas, langkah pertama yang harus dilakukan adalah memcah data berdasarkan keputusannya, sehingga akan diperoleh 2 data: pertama untuk keputusan=ya dan kedua untuk keputusan=tidak
(2) Langkah Find-SDay Cuaca Temperatur Kecepatan Angin Berolah-ragaD1 Cerah Normal Pelan YaD2 Cerah Normal Pelan YaD4 Cerah Normal Kencang YaD6 Cerah Normal Pelan Ya
Day Cuaca Temperatur Kecepatan Angin Berolah-raga
D3 Hujan Tinggi Pelan Tidak
D5 Hujan Tinggi Kencang Tidak
Dari hasil pemisahan tersebut, terlihat bahwa data training tersebut Konsisten dan tidak bias Langkah berikutnya adalah membuat hipotesaKonsisten dan tidak bias. Langkah berikutnya adalah membuat hipotesa untuk masing-masing keputusan. Pembuatan hipotesa ini dilakukan dengan mengambil data pertama sebagai hipotesa awal yang dianggap sebagai hipotesa spesifik dan diteruskan hingga data terakhir dengansebagai hipotesa spesifik, dan diteruskan hingga data terakhir dengan memperhatikan kesamaan sampai didapatkan hipotesa umum.
[3] Langkah Find-SLangkah ini digunakan untuk menentukan hipotesa dari keputusan=ya
Day Cuaca Temperatur Kecepatan Angin Berolah-ragaD1 Cerah Normal Pelan YaD2 Cerah Normal Pelan YaD4 Cerah Normal Kencang YaD6 Cerah Normal Pelan YaD6 Cerah Normal Pelan Ya
Hipotesa awal disamakan dengan data pertama:H(Cerah, Normal, Pelan) = Ya1 ( , , )
Data kedua, tidak ada perubahan karena semua nilai instancenya sama:H(Cerah, Normal, Pelan) = Ya2
Data ketiga, ada perubahan di attribut kec angin, sehingga :H(Cerah, Normal, *) = Ya3
Data keenam, ada perubahan di attribut kec angin, sehingga :H(Cerah, Normal, *) = Ya4
[4] Langkah Find-SLangkah ini digunakan untuk menentukan hipotesa dari keputusan=tidak
Day Cuaca Temperatur Kecepatan Angin Berolah-raga
D3 Hujan Tinggi Pelan Tidak
D5 Hujan Tinggi Kencang Tidak
Hipotesa awal disamakan dengan data pertama (D3):H(Hujan, Tinggi, Pelan) = Tidak1 ( j , gg , )
Data kelima, ada perubahan di kec.anginH(Hujan, Tinggi, *) = Tidak2
Hasil Find-SDay Cuaca Temperatur Kecepatan Angin Berolah-ragaD1 Cerah Normal Pelan YaD2 Cerah Normal Pelan YaD3 Hujan Tinggi Pelan TidakD4 Cerah Normal Kencang YaD5 Hujan Tinggi Kencang TidakD6 Cerah Normal Pelan Ya
Hasil Find-S adalah:
H(Cerah Normal *) = YaH(Cerah, Normal, ) = YaH(Hujan, Tinggi, *) = Tidak
Contoh Keputusan Dari Hipotesa
H(Cerah, Normal, *) = YaHIPOTESA
H(Hujan, Tinggi, *) = Tidak
Bila cuaca cerah, ,apakah akan berolahraga?
CEK
JAWAB : YAJAWAB : YA
Algoritma Berikutnya
BAGAIMANA BILA DATA TIDAK KONSISTEN DAN BIAS?
METODE BAYES ALGORITMA GENETIKA
JARINGAN SYARAF TIRUAN