pengembangan adaptive web server berbasis...

28
PENGEMBANGAN ADAPTIVE WEB SERVER BERBASIS METODE HIERARCHICAL CLSTERING PADA DATA LOG WEB SERVER Yodiar Hellian Y – 5108100165 Dosen Pembimbing : Waskitho Wibisono, S.Kom, M.Eng, Ph.D Hudan Studiawan, S.Kom, M.Kom

Upload: phungnhi

Post on 02-May-2019

217 views

Category:

Documents


0 download

TRANSCRIPT

PENGEMBANGAN ADAPTIVE WEB SERVER

BERBASIS METODE HIERARCHICAL CLSTERING

PADA DATA LOG WEB SERVER

Yodiar Hellian Y – 5108100165

Dosen Pembimbing :

Waskitho Wibisono, S.Kom, M.Eng, Ph.D

Hudan Studiawan, S.Kom, M.Kom

Latar Belakang Masalah

• Web saat ini mengandung informasi yang sangat banyak, diperlukan

suatu cara yang memudahkan pengguna untuk mendapatkan

informasi yang benar–benar dia cari dengan mudah dan cepat.

• Berbeda dengan web biasa, website adaptif akan mempelajari

kebiasaan pengguna dan menampilkan suatu halaman web yang

sudah diubah sesuai dengan ketertarikan pengguna.sudah diubah sesuai dengan ketertarikan pengguna.

Rumusan Masalah

• Bagaimana mendapatkan informasi dari data yang ada di log web

server.

• Bagaimana menggunakan algoritma hierarchical clustering untuk

mendapatkan kelompok-kelompok kelas (cluster) yang mempunyai

persamaan dengan batasan tertentu.

Bagaimana menampilkan halaman web yang sudah terpersonalisai • Bagaimana menampilkan halaman web yang sudah terpersonalisai

dari akses pengguna sehingga dapat ditampilkan informasi dan

tautan yang mungkin diinginkan oleh pengguna.

Tujuan

• Untuk membuat dan menerapkan data clustering yang efektif pada

web log untuk mendapatkan pola penjelajahan dari pengguna

• Untuk membuat aplikasi yang digunakan pada web server yang

menghasilkan keluaran yang terpersonalisasi dari server.

• Memudahkan pengguna untuk mengakses halaman web sesuai Memudahkan pengguna untuk mengakses halaman web sesuai

dengan kebiasaannya.

Batasan Masalah

• Pembahasan Tugas Akhir ini lebih menitikberatkan pada

perancangan suatu website yang mampu mempersonalisasikan

pengguna tanpa perlu mengetahui profil dari pengguna dengan

metode hierarchical clustering.

• Website yang digunakan adalah website yang mempunyai struktur

web tersusun dengan jelas dan rapi strukturnya.web tersusun dengan jelas dan rapi strukturnya.

• Untuk komputer jaringan yang mempunyai IP sama, dianggap hanya

ada satu komputer saja yang mengakses web, sehingga hanya ada

satu personalisasi pengguna saja.

Data Log Pada Database

Data yang tersimpan pada

database

Data Log pada web server

Alur Sistem

Flowchart

Sistem

Metode Hierarchical Clustering

Menghitung Jarak Kedekatan

• Diambil contoh menghitung jarak antara tautan

/course/SOCIAL/ECO/index.html dan /course/TECH142/

description.html.

• Bandingkan antara dua string pada dua tautan tersebut dimulai dari

paling depan. String-string tersebut dipisahkan dengan tanda ‘/’.

Untuk tautan course/TECH142/index.html, maka string paling depan Untuk tautan course/TECH142/index.html, maka string paling depan

adalah course dan terakhir adalah index.html.

• Beri nilai masing-masing string berdasarkan pada tautan yang

memiliki kedalaman terpanjang. Tautan

/course/SOCIAL/ECO/index.html memiliki kedalaman terdalam yaitu

4. Jadi masing-masing tautan pada string terdepannya berbobot 4

dan akan berkurang 1 pada string berikutnya.

• /course/SOCIAL/ECO/index.html 4/3/2/1

• /course/TECH142/ description.html 4/3/2

• Selanjutnya bandingkan antar string dua tautan tersebut dimulai

dari yang terdepan. Jika panjang string terpanjang mengandung

string terpendek maka nilai bobot string itu akan dijumlahkan. string terpendek maka nilai bobot string itu akan dijumlahkan.

Perbandingan akan dihentikan jika menemukan string yang

berbeda.

• Jarak akan didapatkan dari penjumlahan nilai kesamaan string

dibagi dengan total jumlah bobot tautan terpanjang. Dalam contoh

string yang mirip hanya course yang berbobot 4, jadi jarak

kedekatannya

• Jika dua tautan sama sekali berbeda jaraknya adalah 0.0 dan apabila

dua tautan tersebut sama persis maka jaraknya adalah 1.0.

Antarmuka Sistem

Untuk melihat hasil dari pengelompokan dapat dilihat pada halaman web yang

mana menampilkan informasi hasil pengelompokan pada tautan yang diakses dari tiap

tiap pengguna

Antarmuka Hierarchical Clustering pada Web

Antar Muka Sistem

Antarmuka Suggestion

Suggestion merupakan suatu fitur yang memudahkan pengguna untuk

melihat berita – berita baru yang ada. Berita baru tersebut sudah terpersonalisasi

menurut kebiasaan pengguna dengan merujuk pada prosentase hasil

pengelompokan yang dilakukan. Suggestion ini akan menampilkan berita yang

sesuia dengan kategori paling banyak diakses oleh pengguna. Suggestion yang

tampil akan tetap sama disetiap halaman disemua kategori.

Uji Coba dan Evaluasi

Skenario Uji Coba Akurasi Hierarchical Clustering

• Digunakan data sebanyak 50 data tautan yang diakses oleh satu IP.

• Hasil clustering akan dicari nilai Dunn Index.

• Dunn Index yang merupakan indeks akurasi metode clustering.

Uji Coba dan Evaluasi

Hasil Pengelompokan IP

10.151.22.134Data ke- Tautan Cluster 1

1 /refillable/category/Film/Drama.php

2 /refillable/category/Film/Drama/BrilliantLegacy.php

3 /refillable/category/Film/Drama/City.php

4 /refillable/category/Film/Drama/Summer.php

5 /refillable/category/Film/Movie/How2.php

6 /refillable/category/Film/Movie/BrakingDawn2.php

7 /refillable/category/Film/Movie/BrakingDawn2.php

8 /refillable/category/Film/Movie.php

9 /refillable/category/Film/Movie/LaskarPelangi.php

10 /refillable/category/Film/Movie/BankJob.php

11 /refillable/category/Film/Movie/Iron2.php

Data ke- Tautan Cluster 2

1 /refillable/category/Olahraga/GP/MarqezHarusBelajar.php

2 /refillable/category/Olahraga/GP/MarqezHarusBelajar.php

3 /refillable/category/Olahraga/GP.php

4 /refillable/category/Olahraga/GP.php

5 /refillable/category/Olahraga/GP/RosiYamahaLagi.php

6 /refillable/category/Olahraga/GP/HondaBaru.php

7 /refillable/category/Olahraga/GP/klasemenGP.php

8 /refillable/category/Olahraga/GP/HappyRossi.php

9 /refillable/category/Olahraga/GP/HappyRossi.php

Data ke- Tautan Cluster 2

10 /refillable/category/Olahraga.php

11 /refillable/category/Olahraga/Sepak/England.php

12 /refillable/category/Olahraga/Sepak/England.php

13 /refillable/category/Olahraga/Sepak/Liverpool.php

14 /refillable/category/Olahraga/Sepak/TorresTajam.php

15 /refillable/category/Olahraga/Sepak/imbang.php

16 /refillable/category/Olahraga/Sepak/roni.php

17 /refillable/category/Olahraga/Sepak/minder.php

18 /refillable/category/Olahraga/Sepak.php

19 /refillable/category/Olahraga/Sepak.php

Data ke- Tautan Cluster 3

1 /refillable/category/Gosip/Gocip/anang.php

2 /refillable/category/Gosip/Gocip/anang.php

3 /refillable/category/Gosip/Gocip/anang.php

4 /refillable/category/Gosip/Gocip/CitraRihanna.php

5 /refillable/category/Gosip/Gocip/EgiStress.php

6 /refillable/category/Gosip.php

7 /refillable/category/Gosip/Gossip/2pmJakarta.php

8 /refillable/category/Gosip/Gossip/Dragon.php

9 /refillable/category/Gosip/Gossip/LiveBand2pm.php

10 /refillable/category/Gosip/Gossip/YJSberhentirokok.php

Data ke- Tautan Cluster 3

11 /refillable/category/Gosip/Gossip.php

12 /refillable/category/Music/Musik/owlcity.php

13 /refillable/category/Music/Musik/reuniF4.php

14 /refillable/category/Music/Musik/reuniF4.php

15 /refillable/category/Music/Musik/T2Takhny.php

16 /refillable/category/Music/Musik/terbaik.php

17 /refillable/category/Music/Musik/idol.php

18 /refillable/category/Music/Musik/Dewa19.php

19 /refillable/category/Film.php

20 /refillable/category/Music.php

• Keterangan:

• = /refillable/category/Film/Drama.php

• = /refillable/category/Film/Drama/BrilliantLegacy.php

| - | =

Intra Cluster

| - | =

• Keterangan:

• = /refillable/category/Film/Drama.php

• = /refillable/category/Olahraga/GP/MarqezHarusBelajar.php

• | - | =

Inter Cluster

Index Dunn

• Penjelasan persamaan:

• DI = Dunn Index• DI = Dunn Index

• d( ) = inter-cluster distance pada cluster i dan j

• d(xk) = intra-cluster distance dari cluster k

• c = jumlah cluster dari data set

Uji Coba dan EvaluasiEvaluasi Uji Coba Suggestion

• Untuk menguji halaman yang disarankan apakah sudah sesuai

dengan kebiasaan pengguna dengan mengacu pada cluster

terbesar.

• Memasukkan beberapa data tes berjumlah lima belas data

yang merupakan berita baru.yang merupakan berita baru.

• Diantara data tes akan dicari data yang memiliki jarak

kedekatan paling dekat dengan cluster terbesar.

Hasil Uji CobaDATA TES HASIL YANG

DIHARAPKAN

HASIL CLUSTERING

/category/Olahraga/NBA/RudyGay.php

/category/Olahraga/GP/SperpartHonda.php

/category/Film/Drama/Missingyou.php

/category/Film/Movie/DuaCintaSatuHati.php

/category/Gosip/Gocip/Mirzani.php

/category/Gosip/Gocip/YodaIdol.php

TIDAK TAMPIL

TIDAK TAMPIL

TIDAK TAMPIL

TIDAK TAMPIL

TAMPIL

TAMPIL

TIDAK TAMPIL

TIDAK TAMPIL

TIDAK TAMPIL

TIDAK TAMPIL

TAMPIL TAMPIL

TAMPIL

/category/Gosip/Gossip/KonserSNSD.php

/category/Music/Musik/LinkinParkLive.php

/category/Music/Kpopmusic/TVXQphp

/category/Gosip/Gossip/KonserfuySNSD.php

/category/Music/Musik/LinkinghdftydParkLive.p

hp

/category/Music/Kpopmusic/TVhjgfjyXQphp

/category/Olahraga/Sepak/Persebaya.php

/category/Olahraga/NBA/TimDuncan.php

/category/Olahraga/GP/RossiKeok.php

TAMPIL

TAMPIL

TAMPIL

TAMPIL

TAMPIL

TAMPIL

TIDAK

TIDAK

TIDAK

TAMPIL

TAMPIL

TAMPIL

TAMPIL

TAMPIL

TAMPIL

TIDAK TAMPIL

TIDAK TAMPIL

TIDAK TAMPIL

Kesimpulan

• Aplikasi yang dibangun pada Tugas Akhir ini mampumenghasilkan

keluaran yang terpersonalisasi dari server.

• Dengan adaptif website ini variasi personalisasi dari server dapat

berbeda beda untuk IP yang berbeda.

• Data request URI dapat dignakan untuk data masukkan clustering Data request URI dapat dignakan untuk data masukkan clustering

sesuai IP masing masing.

Kesimpulan

• IP komputer merupakan proyeksi pengguna di mana satu pengguna

hanya menggunakan satu IP.

• Meteode hierarchical clustering yang digunakan mampu

mengkelompokkan kebiasaan pengguna berdasarkan kategorinya.

• Hasil evaluasi untuk akurasi clustering menggunakan metode Dunn Hasil evaluasi untuk akurasi clustering menggunakan metode Dunn

Index sebesar 0.93.

• Jumlah IP yang mengakses selama bersamaan mempengaruhi

running time aplikasi. Semakin banyak jumlah IP yang mengakses

secara besamaan maka semakin lama waktu running time aplikasi.

Saran

• Dari Tugas Akhir yang dibuat, ada beberapa saran untuk

pengembangan sistem. Dari segi metode clustering, untuk

meningkatakan akurasi bisa menerapkan metode clustering yang

mungkin memiliki performa dan akurasi yang lebih tinggi.