pengembangan adaptive web server berbasis...
TRANSCRIPT
PENGEMBANGAN ADAPTIVE WEB SERVER
BERBASIS METODE HIERARCHICAL CLSTERING
PADA DATA LOG WEB SERVER
Yodiar Hellian Y – 5108100165
Dosen Pembimbing :
Waskitho Wibisono, S.Kom, M.Eng, Ph.D
Hudan Studiawan, S.Kom, M.Kom
Latar Belakang Masalah
• Web saat ini mengandung informasi yang sangat banyak, diperlukan
suatu cara yang memudahkan pengguna untuk mendapatkan
informasi yang benar–benar dia cari dengan mudah dan cepat.
• Berbeda dengan web biasa, website adaptif akan mempelajari
kebiasaan pengguna dan menampilkan suatu halaman web yang
sudah diubah sesuai dengan ketertarikan pengguna.sudah diubah sesuai dengan ketertarikan pengguna.
Rumusan Masalah
• Bagaimana mendapatkan informasi dari data yang ada di log web
server.
• Bagaimana menggunakan algoritma hierarchical clustering untuk
mendapatkan kelompok-kelompok kelas (cluster) yang mempunyai
persamaan dengan batasan tertentu.
Bagaimana menampilkan halaman web yang sudah terpersonalisai • Bagaimana menampilkan halaman web yang sudah terpersonalisai
dari akses pengguna sehingga dapat ditampilkan informasi dan
tautan yang mungkin diinginkan oleh pengguna.
Tujuan
• Untuk membuat dan menerapkan data clustering yang efektif pada
web log untuk mendapatkan pola penjelajahan dari pengguna
• Untuk membuat aplikasi yang digunakan pada web server yang
menghasilkan keluaran yang terpersonalisasi dari server.
• Memudahkan pengguna untuk mengakses halaman web sesuai Memudahkan pengguna untuk mengakses halaman web sesuai
dengan kebiasaannya.
Batasan Masalah
• Pembahasan Tugas Akhir ini lebih menitikberatkan pada
perancangan suatu website yang mampu mempersonalisasikan
pengguna tanpa perlu mengetahui profil dari pengguna dengan
metode hierarchical clustering.
• Website yang digunakan adalah website yang mempunyai struktur
web tersusun dengan jelas dan rapi strukturnya.web tersusun dengan jelas dan rapi strukturnya.
• Untuk komputer jaringan yang mempunyai IP sama, dianggap hanya
ada satu komputer saja yang mengakses web, sehingga hanya ada
satu personalisasi pengguna saja.
Menghitung Jarak Kedekatan
• Diambil contoh menghitung jarak antara tautan
/course/SOCIAL/ECO/index.html dan /course/TECH142/
description.html.
• Bandingkan antara dua string pada dua tautan tersebut dimulai dari
paling depan. String-string tersebut dipisahkan dengan tanda ‘/’.
Untuk tautan course/TECH142/index.html, maka string paling depan Untuk tautan course/TECH142/index.html, maka string paling depan
adalah course dan terakhir adalah index.html.
• Beri nilai masing-masing string berdasarkan pada tautan yang
memiliki kedalaman terpanjang. Tautan
/course/SOCIAL/ECO/index.html memiliki kedalaman terdalam yaitu
4. Jadi masing-masing tautan pada string terdepannya berbobot 4
dan akan berkurang 1 pada string berikutnya.
• /course/SOCIAL/ECO/index.html 4/3/2/1
• /course/TECH142/ description.html 4/3/2
• Selanjutnya bandingkan antar string dua tautan tersebut dimulai
dari yang terdepan. Jika panjang string terpanjang mengandung
string terpendek maka nilai bobot string itu akan dijumlahkan. string terpendek maka nilai bobot string itu akan dijumlahkan.
Perbandingan akan dihentikan jika menemukan string yang
berbeda.
• Jarak akan didapatkan dari penjumlahan nilai kesamaan string
dibagi dengan total jumlah bobot tautan terpanjang. Dalam contoh
string yang mirip hanya course yang berbobot 4, jadi jarak
kedekatannya
• Jika dua tautan sama sekali berbeda jaraknya adalah 0.0 dan apabila
dua tautan tersebut sama persis maka jaraknya adalah 1.0.
Antarmuka Sistem
Untuk melihat hasil dari pengelompokan dapat dilihat pada halaman web yang
mana menampilkan informasi hasil pengelompokan pada tautan yang diakses dari tiap
tiap pengguna
Antarmuka Hierarchical Clustering pada Web
Antar Muka Sistem
Antarmuka Suggestion
Suggestion merupakan suatu fitur yang memudahkan pengguna untuk
melihat berita – berita baru yang ada. Berita baru tersebut sudah terpersonalisasi
menurut kebiasaan pengguna dengan merujuk pada prosentase hasil
pengelompokan yang dilakukan. Suggestion ini akan menampilkan berita yang
sesuia dengan kategori paling banyak diakses oleh pengguna. Suggestion yang
tampil akan tetap sama disetiap halaman disemua kategori.
Uji Coba dan Evaluasi
Skenario Uji Coba Akurasi Hierarchical Clustering
• Digunakan data sebanyak 50 data tautan yang diakses oleh satu IP.
• Hasil clustering akan dicari nilai Dunn Index.
• Dunn Index yang merupakan indeks akurasi metode clustering.
Hasil Pengelompokan IP
10.151.22.134Data ke- Tautan Cluster 1
1 /refillable/category/Film/Drama.php
2 /refillable/category/Film/Drama/BrilliantLegacy.php
3 /refillable/category/Film/Drama/City.php
4 /refillable/category/Film/Drama/Summer.php
5 /refillable/category/Film/Movie/How2.php
6 /refillable/category/Film/Movie/BrakingDawn2.php
7 /refillable/category/Film/Movie/BrakingDawn2.php
8 /refillable/category/Film/Movie.php
9 /refillable/category/Film/Movie/LaskarPelangi.php
10 /refillable/category/Film/Movie/BankJob.php
11 /refillable/category/Film/Movie/Iron2.php
Data ke- Tautan Cluster 2
1 /refillable/category/Olahraga/GP/MarqezHarusBelajar.php
2 /refillable/category/Olahraga/GP/MarqezHarusBelajar.php
3 /refillable/category/Olahraga/GP.php
4 /refillable/category/Olahraga/GP.php
5 /refillable/category/Olahraga/GP/RosiYamahaLagi.php
6 /refillable/category/Olahraga/GP/HondaBaru.php
7 /refillable/category/Olahraga/GP/klasemenGP.php
8 /refillable/category/Olahraga/GP/HappyRossi.php
9 /refillable/category/Olahraga/GP/HappyRossi.php
Data ke- Tautan Cluster 2
10 /refillable/category/Olahraga.php
11 /refillable/category/Olahraga/Sepak/England.php
12 /refillable/category/Olahraga/Sepak/England.php
13 /refillable/category/Olahraga/Sepak/Liverpool.php
14 /refillable/category/Olahraga/Sepak/TorresTajam.php
15 /refillable/category/Olahraga/Sepak/imbang.php
16 /refillable/category/Olahraga/Sepak/roni.php
17 /refillable/category/Olahraga/Sepak/minder.php
18 /refillable/category/Olahraga/Sepak.php
19 /refillable/category/Olahraga/Sepak.php
Data ke- Tautan Cluster 3
1 /refillable/category/Gosip/Gocip/anang.php
2 /refillable/category/Gosip/Gocip/anang.php
3 /refillable/category/Gosip/Gocip/anang.php
4 /refillable/category/Gosip/Gocip/CitraRihanna.php
5 /refillable/category/Gosip/Gocip/EgiStress.php
6 /refillable/category/Gosip.php
7 /refillable/category/Gosip/Gossip/2pmJakarta.php
8 /refillable/category/Gosip/Gossip/Dragon.php
9 /refillable/category/Gosip/Gossip/LiveBand2pm.php
10 /refillable/category/Gosip/Gossip/YJSberhentirokok.php
Data ke- Tautan Cluster 3
11 /refillable/category/Gosip/Gossip.php
12 /refillable/category/Music/Musik/owlcity.php
13 /refillable/category/Music/Musik/reuniF4.php
14 /refillable/category/Music/Musik/reuniF4.php
15 /refillable/category/Music/Musik/T2Takhny.php
16 /refillable/category/Music/Musik/terbaik.php
17 /refillable/category/Music/Musik/idol.php
18 /refillable/category/Music/Musik/Dewa19.php
19 /refillable/category/Film.php
20 /refillable/category/Music.php
• Keterangan:
• = /refillable/category/Film/Drama.php
• = /refillable/category/Film/Drama/BrilliantLegacy.php
| - | =
Intra Cluster
| - | =
• Keterangan:
• = /refillable/category/Film/Drama.php
• = /refillable/category/Olahraga/GP/MarqezHarusBelajar.php
• | - | =
Inter Cluster
Index Dunn
• Penjelasan persamaan:
• DI = Dunn Index• DI = Dunn Index
• d( ) = inter-cluster distance pada cluster i dan j
• d(xk) = intra-cluster distance dari cluster k
• c = jumlah cluster dari data set
Uji Coba dan EvaluasiEvaluasi Uji Coba Suggestion
• Untuk menguji halaman yang disarankan apakah sudah sesuai
dengan kebiasaan pengguna dengan mengacu pada cluster
terbesar.
• Memasukkan beberapa data tes berjumlah lima belas data
yang merupakan berita baru.yang merupakan berita baru.
• Diantara data tes akan dicari data yang memiliki jarak
kedekatan paling dekat dengan cluster terbesar.
Hasil Uji CobaDATA TES HASIL YANG
DIHARAPKAN
HASIL CLUSTERING
/category/Olahraga/NBA/RudyGay.php
/category/Olahraga/GP/SperpartHonda.php
/category/Film/Drama/Missingyou.php
/category/Film/Movie/DuaCintaSatuHati.php
/category/Gosip/Gocip/Mirzani.php
/category/Gosip/Gocip/YodaIdol.php
TIDAK TAMPIL
TIDAK TAMPIL
TIDAK TAMPIL
TIDAK TAMPIL
TAMPIL
TAMPIL
TIDAK TAMPIL
TIDAK TAMPIL
TIDAK TAMPIL
TIDAK TAMPIL
TAMPIL TAMPIL
TAMPIL
/category/Gosip/Gossip/KonserSNSD.php
/category/Music/Musik/LinkinParkLive.php
/category/Music/Kpopmusic/TVXQphp
/category/Gosip/Gossip/KonserfuySNSD.php
/category/Music/Musik/LinkinghdftydParkLive.p
hp
/category/Music/Kpopmusic/TVhjgfjyXQphp
/category/Olahraga/Sepak/Persebaya.php
/category/Olahraga/NBA/TimDuncan.php
/category/Olahraga/GP/RossiKeok.php
TAMPIL
TAMPIL
TAMPIL
TAMPIL
TAMPIL
TAMPIL
TIDAK
TIDAK
TIDAK
TAMPIL
TAMPIL
TAMPIL
TAMPIL
TAMPIL
TAMPIL
TIDAK TAMPIL
TIDAK TAMPIL
TIDAK TAMPIL
Kesimpulan
• Aplikasi yang dibangun pada Tugas Akhir ini mampumenghasilkan
keluaran yang terpersonalisasi dari server.
• Dengan adaptif website ini variasi personalisasi dari server dapat
berbeda beda untuk IP yang berbeda.
• Data request URI dapat dignakan untuk data masukkan clustering Data request URI dapat dignakan untuk data masukkan clustering
sesuai IP masing masing.
Kesimpulan
• IP komputer merupakan proyeksi pengguna di mana satu pengguna
hanya menggunakan satu IP.
• Meteode hierarchical clustering yang digunakan mampu
mengkelompokkan kebiasaan pengguna berdasarkan kategorinya.
• Hasil evaluasi untuk akurasi clustering menggunakan metode Dunn Hasil evaluasi untuk akurasi clustering menggunakan metode Dunn
Index sebesar 0.93.
• Jumlah IP yang mengakses selama bersamaan mempengaruhi
running time aplikasi. Semakin banyak jumlah IP yang mengakses
secara besamaan maka semakin lama waktu running time aplikasi.
Saran
• Dari Tugas Akhir yang dibuat, ada beberapa saran untuk
pengembangan sistem. Dari segi metode clustering, untuk
meningkatakan akurasi bisa menerapkan metode clustering yang
mungkin memiliki performa dan akurasi yang lebih tinggi.