template makalah seminasik 2014
TRANSCRIPT
-
8/16/2019 Template Makalah Seminasik 2014
1/5
Prosiding – Seminar Nasional Ilmu Komputer 2014
ISBN:XXXX
Data Mining Untuk Analisis Pola Penggunaan Internet
Menggunakan Metode Clustering
Yudi Wahyu W, Program Studi Teknik Elektro, and Third C. Author
Abstrak 1 — Pada saat ini dimana sistem informasidan data semakin berkembang dikenal dengan adana
teknik aplikasi data mining untuk melakukan
pengola!an data se!ingga akan diperole! pola" #ata
$lustering diperlukan agar mendapatkan suatu
pengeta!uan %kno&ledge dis$o'er( tentang pola
%pattern re$ognition( pelaksanaan sistem informasi
berupa internet pada perguruan tinggi" Banak
metode dalam data mining sala! satuna adala!teknik $lustering aitu dimana proses pengelompokan
beberapa data ke dalam $luster dan didalam $luster
akan terdapat data ang mirip dan berbeda dengan
obek dalam suatu $luster lainna" #idalam $luster
ada dua metode aitu !ierarki dan partisi dengan
menggabungkan keduana di!arapkan dapat
meng!asilkan !asil ang baik" #ari data problem
ang ada akan diperole! pola penggunaan internet
dalam suatu komputer"
Keywords — $luster) data mininig) pengola!an datainternet
1. PENDAH!AN
ema"uki era "i"tem in#orma"i.
$enggunaan internet %ukanlah hal
yang %aru. Perkem%angan teknologi yang
"emakin $e"at teru" %ermun&ulan menggantikan
teknologi yang "e%elumnya. Teknologi yang
%aru teru" da$at dira"akan man#aatnya untuk
mengata"i "egala $erma"alahan yang ada untuk
memtu $ro"e" ker'a manu"ia . Namun yang
men'adi $erma"alahan 'u"tru #oku" $ada &ara
mengolah dan mengo$era"ikan teknologi
ter"e%ut.
(
Sum%er daya manu"ia yang %erkualita" "angat
di$erlukan untuk menun'ang $erkem%angan
teknologi yang ada. Salah "atu &ara untuk
meningkatkan 'umlah "um%er daya manu"ia yang
%erkualita" ini tentunya dengan &ara ker'a yang
le%ih $rodukti#.Data mining meru$akan "uatu
$ro"e" untuk mem$eroleh nilai dari "e%uah data
yang kurang di $ela'ari le%ih lan'ut.
Dalam hal ini #un"i utamanya adalah dengan
melakukan $em%ela'aran, $em%uatan rangkuman,
1
)ir"t1 !a"t1 Name, *n"titu"i Anda, Alamat, +ota e-mail.*da (aratul +hamidah, Program Studi S/ *lmu +om$uter,
)(*PA 0(, l. Seki$ tara, Sleman, Yogyakarta,
yude2tyra3gmail.&om
$emodelan, dan $edetek"ian yang "e&ara
ke"eluruhan %erda"arkan data yang ter"edia.
Perma"alahan yang dihada$i adalah %agaimana
$enggunaan ak"e" internet dalam "uatu kom$uter
"ehingga kom$uter akan %eker'a "e&ara
mak"imal. 4nyak $engguna yang menggunakan
ak"e" internet $ada "uatu kom$uter, teta$i tidak
$aham dalam mengorgani"ir $emakaian
internet."ehingga akan menim%ulkan kurang
mak"imalnya $ro"e" dalam kom$uter.516
Ada$un tu'uan dari $enelitian ini adalah untuk
melihat &lu"ter dalam "uatu kom$uter yang
terhu%ung dengan ak"e" internet. Dari anali"i"
ter"e%ut da$at diketahui $ola lalu linta"
$enggunaan internet yang ter'adi dalam kom$uter
ter"e%ut 5/6. 7leh karenan itu yang men'adi
$ertanyyan dalam $enelitian ini adalah
%agaimana mengetahui mengidenti#ika"i dan
anali"i" terhada$ karakteri"tik $enggunaan
internet "ehingga akan di$eroleh data yang da$agmemak"imalkan $enggunaan kom$uter dan ak"e"
internet.
Gambar 1. Ide dasar data mining pada perguruan tinggi
(Delavari, 2!".
/. (ET7DE PENE!*T*AN
Pada %agian metodologi $enelitian ini akan
diuraikan "um%er dari teknik data mining "e$ertilangkah-langkah "i"temati" dan terarah dalam
menganali"i" &lu"ter yang akan di'adikan a&uan
"e%agai kerangka $enelitian $enentuan kemiri$an
atau mem%andingkan $en&arian $ola $enggunaan
internet.586 Dengan menggunakan kom%ina"i
"emua metode +-mean" "ehingga da$at diketahui
metode manakah yang mengha"ilkan ha"il &lu"ter
yang ter%aik.5965:6 Penelitian ini menggunakan
:;8 data internet yang telah "tudi di "atu unit
kom$uter yang terkonek"i dengan ak"e" internet.
5eka ?er"i 8.
-
8/16/2019 Template Makalah Seminasik 2014
2/5
Prosiding – Seminar Nasional Ilmu Komputer 201*
ISBN:XXXX
!angkah-langkah yang dilakukan dalam
$enelitian ini "e&ara "ingkat da$at dilihat $ada
0am%ar /
Gambar 2.Alur penelitian
2"1"+a!ap Pengola!an #ata Kedalam ,etadata
Dari data yang di$eroleh yang da$at
digunakan untuk melakukan anali"i" &lu"teringuntuk menda$atkan $ola nantinya digunakan
untuk taha$ "elan'utnya.dengan menggunakan
metode do&ument &lu"tering.56 Dalam $enelitian
ini digunakan algoritma do&ument &lu"tering
"ederhana karena domain tek" yang akan di%a>a
kedalam "uatu &lu"ter %er"i#at "$e"i#ik, yaitu
$enentuan data antara do"en dan maha"i">a.
Sehingga key>ord" yang akan digunakan dalam
metadata da$at ditentukan "e&ara manual oleh
$eneliti"
2"2"+a!ap -lustering Harap +ategori algoritma &lu"tering yang
%anyak dikenal adalah Hierar&hi&al Clu"tering.
5;6 Hierar&hi&al Clu"tering adalah "alah "atu
algoritma &lu"tering yang da$at digunakan untuk
meng-&lu"ter dokumen do&ument &lu"tering. 5B6
Dari teknik hierar&hi&al &lu"tering, da$at
diha"ilkan "uatu kum$ulan $arti"i yang
%erurutan, dimana dalam kum$ulan ter"e%ut
terda$at1. Clu"ter &lu"ter yang mem$unyai $oin $oinindi?idu. Clu"ter &lu"ter ini %erada di le?el yang
$aling %a>ah.
/. Se%uah &lu"ter yang didalamnya terda$at $oin $oin yang di$unyai "emua &lu"ter didalamnya.Single &lu"ter ini %erada di le?el yang $aling ata".
Ha"il ke"eluruhan dari algoritma hierar&hi&al
&lu"tering "e&ara gra#ik da$at digam%arkan"e%agai tree, yang di"e%ut dengan dendogram.
Tree ini "e&ara gra#ik menggam%arkan $ro"e"
$engga%ungan dari &lu"ter &lu"ter yang ada,
"ehingga mengha"ilkan &lu"ter dengan le?el yang
le%ih tinggi.
Dalam teknik multi?ariat lain $ro"e" anali"i"
&lu"ter di'ela"kan dalam enam taha$ antara lain
Taha$ Pertama Tu'uan Anali"i" Clu"ter
Tu'uan utama anali"i" &lu"ter adalah
mem$arti"i "uatu "et o%'ek men'adi dua
kelom$ok atau le%ih %erda"arkan ke"amaankarakteri"tik khu"u" yang dimilikinya yaitu
A. De"kri$"i kla"i#ika"i taonomy
de"&ri$tion
Penera$an anali"i" &lu"ter "e&ara tradi"i"onal
%ertu'uan mengek"$lora"i dan mem%entuk "uatu
kla"i"#ika"iFtak"onomi "e&ara em$iri".51@6
+arena kemam$uan $arti"inya anali"i" &lu"ter
da$at ditera$kan "e&ara lua". (e"ki$un "e&ara
em$iri" meru$akan teknik ek"$lora"i anali"i"
&lu"ter da$at $ula digunakan untuk tu'uan
kon#irma"i.
1. Penyederhanaan Data
(eru$akan %agian dari "uatu tak"onomi.
Dengan "truktur yang ter%ata" o%"er?a"iFo%'ek
da$at dikelom$okkan untuk anali"i" "elan'utnya.
/. *denti#ika"i Hu%ungan Gelation"hi$
*denti#i&ation
Hu%ungan antar o%'ek diidenti#ika"i "e&ara
em$iri". Struktur anali"i" &lu"ter yang "ederhana
da$at menggam%arkan adanya hu%ungan atau
ke"amaan dan $er%edaan yang tidak dinyatakan"e%elumnya.
Tu'uan anali"i" &lu"ter tidak da$at di$i"ahkan
dengan $emilihan ?aria%el yang digunakan untuk
menggolongkan o%'ek ke dalam &lu&ter-&lu"ter.
Clu"ter yang ter%entuk mere#lek"ikan "truktur
yang melekat $ada data "e$erti yang
dide#ini"ikan oleh ?aria%el-?aria%el. Pemilihan
?aria%el haru" "e"uai dengan teori dan kon"e$
yang umum digunakan dan haru" ra"ional.5116
Ga"ionalita" ini dida"arkan $ada teori-teori
ek"$li"it atau $enelitian "e%elumnya. aria%el-?aria%el yang di$ilih hanyalah ?aria%el yang
da$at men&irikan o%'ek yang akan
-
8/16/2019 Template Makalah Seminasik 2014
3/5
Prosiding – Seminar Nasional Ilmu Komputer 2014
ISBN:XXXX
dikelom$okkan dan "e&ara "$e"i#ik haru" "e"uai
dengan tu'uan anali"i" &lu"ter.
Taha$ +edua De"ain Penelitian dalam
Anali"i" Clu"ter
Tiga hal $enting dalam taha$ ini adalah
$endetek"ian outlier, mengukur ke"amaan, dan
"tandari"a"i data.
1. Pendetek"ian 7utlier
7utlier adalah "uatu o%'ek yang "angat
%er%eda dengan o%'ek lainnya. 7utlier da$at
digam%arkan "e%agai o%"er?a"i yang "e&ara nyata
ke%ia"aan, tidak me>akili $o$ula"i umum, dan
adanya under"am$ling da$at $ula memun&ulkan
outlier. 7utlier menye%a%kan menye%a%kan
"truktur yang tidak %enar dan &lu"ter yangter%entuk men'adi tidak re$re"entati#.
/. (engukur +e"amaan antar 7%'ek
+on"e$ ke"amaan adalah hal yang
#undamental dalam anali"i" &lu"ter. +e"amaan
antar o%'ek meru$akan ukuran kore"$onden"i
antar o%'ek. Ada tiga metode yang da$at
ditera$kan, yaitu ukuran korela"i, ukuran 'arak,
dan ukuran a"o"ia"i.
/.1 kuran +orela"i
kuran ini da$at ditera$kan $ada datadengan "kala metrik, namun 'arang digunakan
karena titik %ertnya $ada nilai "uatu $ola tertentu,
$adahal ti"ik %erat anali"i" &lu"ter adalah
%e"arnya o%'ek. +e"amaan antar o%'ek da$at
dilihat dari koe#i"ien korela"i antar $a"angan
o%'ek yang diukur dengan %e%era$a ?aria%el.
/./ kuran arak
(eru$akan ukuran yang $aling "ering
digunakan. Ditera$kan untuk data %er"kala
metrik. Se%enarnya meru$akan ukuran
ketidakmiri$an, dimana 'arak yang %e"ar
menun'ukkan "edikit ke"amaan "e%aliknya 'arak
yang $endekFke"il menun'ukkan %ah>a "uatu
o%'ek makin miri$ dengan o%'ek lain. 4edanya
dengan ukuran korela"i adalah %nah>a ukuran
'arak #oku"nya $ada %e"arnya nilai. Clu"ter
%erda"arkan ukuran korela"i %i"a "a'a tidak
memiliki ke"amaan nilai ta$i memiliki ke"amaan
$ola, "edangkan &lu"ter d%erda"rkan ukuran 'arak
le%ih memiliki ke"amaan nilai me"ki$un $olanya
%er%eda./.8 kuran A"o"ia"i
kuran a"o"ia"i di$akai untuk mengukur data
%er"kala nonmetrik nominal atau ordinal.
8. Standari"a"i Data
a. Standari"a"i aria%el
4entuk $aling umum dalam "tandari"a"i?aria%el adalah kon?er"i "etia$ ?aria%el terhada$
"kor "tandar dikenal dengan I "&ore dengan
melakukan "u%"trak"i nilai tengan dan
mem%aginyadengan "tandar de?ia"i tia$ ?aria%el.
%. Standari"a"i Data
4er%eda dengan "tandari"a"i ?aria%el,
"tandari"a"i ndata dilakukan terhada$
o%"er?a"iFo%'ek yang akan dikelom$okkan.
Taha$ +etiga A"um"i-a"um"i dalam
Anali"i" Clu"ter
Se$erti hal teknik anali"i" lain,anali"i" &lu"ter
'uga meneta$kan adanya "uatu a"um"i. Ada dua
a"um"i dalam anali"i" &lu"ter, yaitu
1. +e&uku$an Sam$el untuk
mere$re"enta"ikan F me>akili $o$ula"i.
4ia"anya "uatu $enelitian dilakukan terhada$
$o$ula"i di>akili oleh "ekelom$ok "am$el.
Sam$el yang digunakan dalam anali"i" &ku"ter
haru" da$at me>akili $o$ula"i yang ingin
di'ela"kan, karena anali"i" ini %aik 'ika "am$el
re$re"entati#. umlah "am$el yang diam%il
tergantung $enelitinya, "eorang $eneliti haru"
yakin %ah>a "am$il yang diam%il re$re"entati#
terhada$ $o$ula"i.
/. Pengaruh (ultukolinierita"
Ada atau tidaknya multikolinierita" antar
?aria%el "angat di$erhatikan dalam anali"i"
&lu"ter karena hal itu %er$engaruh, "ehingga
?aria%el-?aria%el yang %er"i#at multikolinierita"
"e&ara ek"$li"it die$rtim%angkan dengan le%ih"ek"ama.
Taha$ +eem$at Pro"e" (enda$atkan
Clu"ter dan (enilai kelayakan "e&ara
ke"eluruhan.
Ada dua $ro"e" $enting yaitu algoritma
&lu"ter dalam $em%entukan &lu"ter dan
menentukan 'umlah &lu"ter yang akan di%entuk.
+eduanya mem$unyai im$lika"i "u%"tan"ial tidak
hanya $ada ha"il yang di$eroleh teta$i 'uga $ada
inter$reta"i yang akan dilakukan terhada$ ha"il
ter"e%ut.
-
8/16/2019 Template Makalah Seminasik 2014
4/5
Prosiding – Seminar Nasional Ilmu Komputer 201*
ISBN:XXXX
Taha$ +elima *nter$reta"i terhada$ Clu"ter
Taha$ inter$reta"i meli$uti $engu'ian tia$
&lu"ter dalam term untuk menamai dan menandai
dengan "uatu la%el yang "e&ara akurat da$atmen'ela"kan kealamian &lu"ter. Pro"e" ini dimulai
dengan "uatu ukuran yang "ering digunakan yaitu
&entroid &lu"ter.
(em%uat $ro#il dan inter$reta"i &lu"ter tidak
hanya tidak hanya untuk memoeroleh "uatu
gam%aran "a'a melainkan $ertama, menyediakan
"uatu rata-rata untuk menilai kore"$onden"i $ada
&lu"ter yang ter%entuk, kedua, $ro#il &lu"ter
mem%erikan araha %agi $enilainan terhada$
"igni#ikan"i $rakti".
Taha$ +eenam Pro"e" alida"i dan
Pem%uatan Pro#il PG7)*!*N0 Clu"ter
1. Pro"e" ?alida"i "olu"i &lu"ter
Pro"e" ?alida"i %ertu'uan men'amin %ah>a
"olu"i yang diha"ilkan dari anali"i" &lu"ter da$at
me>akili $o$ula"i dan da$at digenerali"a"i untuk
o%'ek lain. Pendekatan ini mem%andingkan "olu"i
&lu"ter dan menilai kore"$onden"i ha"il.
Terkadang tidak da$at di$raktekkan karena
adanya kendala >aktu dan %iaya atauketidakter"ediaan i%'ek untuk anali"i" &lu"ter
ganda.
/. Pem%uatan Pro#il PG7)*!*N0 Solu"i
Clu"ter
Taha$ ini menggam%arkan karakteri"tik tia$
&lu"ter untuk men'ela"kan &lu"ter-&lu"ter ter"e%ut
da$at da$at %er%eda $ada dimen"i yang rele?an.
Titik %eratnta $ada karakteri"tik yang "e&ara
"igni#ikan %er%eda antar &lu"tre dan mem$redik"i
anggota dalam "uatu &lu"ter khu"u".
Se&ara ke"eluruhan $ro"e" anali"i" &lu"ter
%erakhir "etelah keenam taha$ ini dilalui. Ha"il
anali"i" &lu"ter da$at digunakan untuk %er%agai
ke$entingan "e"uai dengan materi yang
dianali"i".
8. HAS*! DAN PE(4AHASAN
Anali"a kla"ter %i"a di$eroleh dari ke$adatan
kla"ter yang di%entuk &lu"ter den"ity. Pro"e"
&lu"ter di%agi men'adi 9 &lu"ter. Algoritma yang
diguakan adalah Sim$le +mean", dan
mengha"ilkan data "e%agai %erikut
Ta%le 1 &lu"ter Centroid +mean"
"edang kan untuk tam$ilan &lu"ternya
mengha"ilkan data "e%agai %erikut
Gambar #. $ampilan visual setela%
&lustering
Dari gam%ar yang diha"ilkan dari $ro"e"
&lu"tering. Di"im$ulkan %ah>a "emakin "ering
akti#ita" yang dilakukan dalam $enggunaan ak"e"
&om$uter yang tehu%ung dengan internet, maka
akan mengha"ilkan $ro"e" tukar data yang
%anyak 'uga.
ntuk ke"im$ulan %anyaknya data yang
terda$at "etia$ &lu"ter adalah "e%agai %erikut dari
total data "e%anyak :;8.
$abel 2. 'asil )Means Clustering Cluster Cluster 1 Cluster 2 Cluster #
; data :1B data 9 data B data
Dari ta%le / di"im$ulkan %ah>a $ro"e" data
%anyak ter'adi $ada &lu"ter 1 yaitu "e%anyak :1B
data, hal ini ter'adi karena dalam akti?ita"
&om$uter ter"e%ut yang terhu%ung dengan
internet "e&ara &e$at dan %anyak data yang "aling
mengirim dan menerima.
9. + ES*(P!AN
-
8/16/2019 Template Makalah Seminasik 2014
5/5
Prosiding – Seminar Nasional Ilmu Komputer 2014
ISBN:XXXX
1. Semakain %anyak $ro"e" akti?ita" yang di
lakukan dalam &om$uter yang terhu%ung
internet. (aka akan menha"ilkan $ro"e"
tukar data yang %anyak $ula.
/. Data mining "endiri "ering di"e%ut "e%agaikno>ledge di"&o?ery in data%a"e +DD
adalah kegiatan yang meli$uti $engum$ulan
$emakaian data hi"tori" untuk menemukan
keteraturan, $ola hu%ungan dalam "et data
%erukuran %e"ar. 7ut$ut dari data mining ini
da$at digunakan untuk $engam%ilan
ke$utu"an di ma"a de$an.
8. (etode &lu"tering "angat e#ekti# dan e#i"ien
dalam $emro"e"an datanya "ehingga
mem$ermudah meda$atkan ha"ilnya.
:. SAGANPenelitian ini menda$atkan 'umlanya data
tia$ &lu"ter. Dihara$kan $ada $enelitian
%erikutnya ledih detail dalam $em%agian data.
U&apan $erima kasi%
Penuli" mengu&a$kan terima ka"ih ke$ada
ni?er"ita" 0ad'ah (ada yang telah mem%erikan
#a"ilita" untuk melakukan $enelitian ini.
DA)TAG PSTA+A
516 Ca"tleman, !aleh Ar"hadi, Amir Ho""ein ahangir.J4en#ordK"
la> %eha?ior o# internet tra##i&J. ournal o# Net>ork and
Com$uter A$$li&ation"./@18
5/6 Iainuddin Ia"lina JPola Peman#aatan *nternet oleh (aha"i">a
Program (agi"ter *lmu Hukum Program Pa"&a"ar'ana
ni?er"ita Sumatra taraJ.$u"taha urnal StudiPer$u"takaan dan *n#orma"i, ol./, No.1, uni /@@<
586 Shu-H"ien !iao, Pei-Hui Chu, Pei-Yuan H"iao. JData miningte&hniLue" and a$$li&ation" A de&ade re?ie> #rom
/@@@ to /@11J.E$ert Sy"tem" >ith A$$li&ation" 8B
/@1/
596 Tahta Al#ina, 4udi Santo"a, dan Ali Gidho 4arak%ah.JAnali"a
Per%andingan (etode Hierar&hi&al Clu"tering, +-mean"dan 0a%ungan +eduanya dalam Clu"ter Data Studi
ka"u" Pro%lem +er'a Praktek uru"an Teknik *ndu"tri
*TSJ.GNA! TE+N*+ *TS ol. 1, Se$t, /@1/ *SSN/8@1-B/1
5:6 !inda>atiJ. DATA (*N*N0 DEN0AN TE+N*+
C!STEG*N0 DA!A( PEN0+!AS*)*+AS*ANDATA (AHAS*SWA STD* +ASS PGED*+S*
!A(A STD* (AHAS*SWA N*EGS*TAS 4*NA
NSANTAGAJ.Seminar Na"ional *n#ormatika /@@;"emna"*) /@@; *SSN 1BB-/8/; PN MeteranM
Yogyakarta, /9 (ei /@@;
5ei Hany.JE##o&ient and E##e&ti?e
Clu"tering (ethod" #or S$atial Data (iningJ.*EEE
TGANSACT*7NS 7N +N7W!ED0E AND DATA
EN0*NEEG*N0, 7!. 19, N7. :,SEPTE(4EGF7CT74EG /@@/
56 Naeimeh DE!AAG*, Somnuk PH7N-A(NA*S+.JData(ining A$$li&ation in Higher !earning
*n"titution"J.*n#ormati&" in Edu&ation, /@@;, ol. , No.
1, 81:9
5;6 +ohei Arai= and Ali Gidho 4arak%ah,JHierar&hi&al +-mean"
an algorithm #or &entroid" initiali2ation #or +-
mean"J.Ge$ort" o# the )a&ulty o# S&ien&e andEngineering, Saga ni?er"ity, ol. 8 E.
+rumm&.JWho need" to do >hat >hereO "ing learningmanagement "y"tem" on re"idential ?". &ommuter
&am$u"e"J.Com$uter" Edu&ation :< /@11