template makalah seminasik 2014

Upload: yudeztyra

Post on 05-Jul-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/16/2019 Template Makalah Seminasik 2014

    1/5

     Prosiding – Seminar Nasional Ilmu Komputer 2014

     ISBN:XXXX 

    Data Mining Untuk Analisis Pola Penggunaan Internet

    Menggunakan Metode Clustering

     Yudi Wahyu W, Program Studi Teknik Elektro, and Third C. Author 

     Abstrak 1 —  Pada saat ini dimana sistem informasidan data semakin berkembang dikenal dengan adana

    teknik aplikasi data mining untuk melakukan

     pengola!an data se!ingga akan diperole! pola" #ata

    $lustering diperlukan agar mendapatkan suatu

     pengeta!uan %kno&ledge dis$o'er( tentang pola

    %pattern re$ognition( pelaksanaan sistem informasi

    berupa internet pada perguruan tinggi" Banak 

    metode dalam data mining sala! satuna adala!teknik $lustering aitu dimana proses pengelompokan

    beberapa data ke dalam $luster dan didalam $luster 

    akan terdapat data ang mirip dan berbeda dengan

    obek dalam suatu $luster lainna" #idalam $luster 

    ada dua metode aitu !ierarki dan partisi dengan

    menggabungkan keduana di!arapkan dapat 

    meng!asilkan !asil ang baik" #ari data problem

     ang ada akan diperole! pola penggunaan internet 

    dalam suatu komputer"

     Keywords — $luster) data mininig) pengola!an datainternet 

    1. PENDAH!AN

    ema"uki era "i"tem in#orma"i.

     $enggunaan internet %ukanlah hal

    yang %aru. Perkem%angan teknologi yang

    "emakin $e"at teru" %ermun&ulan menggantikan

    teknologi yang "e%elumnya. Teknologi yang

     %aru teru" da$at dira"akan man#aatnya untuk 

    mengata"i "egala $erma"alahan yang ada untuk 

    memtu $ro"e" ker'a manu"ia . Namun yang

    men'adi $erma"alahan 'u"tru #oku" $ada &ara

    mengolah dan mengo$era"ikan teknologi

    ter"e%ut.

    Sum%er daya manu"ia yang %erkualita" "angat

    di$erlukan untuk menun'ang $erkem%angan

    teknologi yang ada. Salah "atu &ara untuk 

    meningkatkan 'umlah "um%er daya manu"ia yang

     %erkualita" ini tentunya dengan &ara ker'a yang

    le%ih $rodukti#.Data mining meru$akan "uatu

     $ro"e" untuk mem$eroleh nilai dari "e%uah data

    yang kurang di $ela'ari le%ih lan'ut.

    Dalam hal ini #un"i utamanya adalah dengan

    melakukan $em%ela'aran, $em%uatan rangkuman,

    1

    )ir"t1 !a"t1 Name, *n"titu"i Anda, Alamat, +ota e-mail.*da (aratul +hamidah, Program Studi S/ *lmu +om$uter,

    )(*PA 0(, l. Seki$ tara, Sleman, Yogyakarta,

    yude2tyra3gmail.&om

     $emodelan, dan $edetek"ian yang "e&ara

    ke"eluruhan %erda"arkan data yang ter"edia.

    Perma"alahan yang dihada$i adalah %agaimana

     $enggunaan ak"e" internet dalam "uatu kom$uter 

    "ehingga kom$uter akan %eker'a "e&ara

    mak"imal. 4nyak $engguna yang menggunakan

    ak"e" internet $ada "uatu kom$uter, teta$i tidak 

     $aham dalam mengorgani"ir $emakaian

    internet."ehingga akan menim%ulkan kurang

    mak"imalnya $ro"e" dalam kom$uter.516

    Ada$un tu'uan dari $enelitian ini adalah untuk 

    melihat &lu"ter dalam "uatu kom$uter yang

    terhu%ung dengan ak"e" internet. Dari anali"i"

    ter"e%ut da$at diketahui $ola lalu linta"

     $enggunaan internet yang ter'adi dalam kom$uter 

    ter"e%ut 5/6. 7leh karenan itu yang men'adi

     $ertanyyan dalam $enelitian ini adalah

     %agaimana mengetahui mengidenti#ika"i dan

    anali"i" terhada$ karakteri"tik $enggunaan

    internet "ehingga akan di$eroleh data yang da$agmemak"imalkan $enggunaan kom$uter dan ak"e"

    internet.

    Gambar 1. Ide dasar data mining pada perguruan tinggi

    (Delavari, 2!".

    /. (ET7DE PENE!*T*AN

    Pada %agian metodologi $enelitian ini akan

    diuraikan "um%er dari teknik data mining "e$ertilangkah-langkah "i"temati" dan terarah dalam

    menganali"i" &lu"ter yang akan di'adikan a&uan

    "e%agai kerangka $enelitian $enentuan kemiri$an

    atau mem%andingkan $en&arian $ola $enggunaan

    internet.586 Dengan menggunakan kom%ina"i

    "emua metode +-mean" "ehingga da$at diketahui

    metode manakah yang mengha"ilkan ha"il &lu"ter 

    yang ter%aik.5965:6 Penelitian ini menggunakan

    :;8 data internet yang telah "tudi di "atu unit

    kom$uter yang terkonek"i dengan ak"e" internet.

    5eka ?er"i 8.

  • 8/16/2019 Template Makalah Seminasik 2014

    2/5

     Prosiding – Seminar Nasional Ilmu Komputer 201*

     ISBN:XXXX 

    !angkah-langkah yang dilakukan dalam

     $enelitian ini "e&ara "ingkat da$at dilihat $ada

    0am%ar /

    Gambar 2.Alur penelitian

    2"1"+a!ap Pengola!an #ata Kedalam ,etadata

    Dari data yang di$eroleh yang da$at

    digunakan untuk melakukan anali"i" &lu"teringuntuk menda$atkan $ola nantinya digunakan

    untuk taha$ "elan'utnya.dengan menggunakan

    metode do&ument &lu"tering.56 Dalam $enelitian

    ini digunakan algoritma do&ument &lu"tering

    "ederhana karena domain tek" yang akan di%a>a

    kedalam "uatu &lu"ter %er"i#at "$e"i#ik, yaitu

     $enentuan data antara do"en dan maha"i">a.

    Sehingga key>ord" yang akan digunakan dalam

    metadata da$at ditentukan "e&ara manual oleh

     $eneliti"

    2"2"+a!ap -lustering  Harap  +ategori algoritma &lu"tering yang

     %anyak dikenal adalah Hierar&hi&al Clu"tering.

    5;6 Hierar&hi&al Clu"tering adalah "alah "atu

    algoritma &lu"tering yang da$at digunakan untuk 

    meng-&lu"ter dokumen do&ument &lu"tering. 5B6

    Dari teknik hierar&hi&al &lu"tering, da$at

    diha"ilkan "uatu kum$ulan $arti"i yang

     %erurutan, dimana dalam kum$ulan ter"e%ut

    terda$at1. Clu"ter &lu"ter yang mem$unyai $oin $oinindi?idu. Clu"ter &lu"ter ini %erada di le?el yang

     $aling %a>ah.

    /. Se%uah &lu"ter yang didalamnya terda$at $oin  $oin yang di$unyai "emua &lu"ter didalamnya.Single &lu"ter ini %erada di le?el yang $aling ata".

    Ha"il ke"eluruhan dari algoritma hierar&hi&al

    &lu"tering "e&ara gra#ik da$at digam%arkan"e%agai tree, yang di"e%ut dengan dendogram.

    Tree ini "e&ara gra#ik menggam%arkan $ro"e"

     $engga%ungan dari &lu"ter &lu"ter yang ada,

    "ehingga mengha"ilkan &lu"ter dengan le?el yang

    le%ih tinggi.

    Dalam teknik multi?ariat lain $ro"e" anali"i"

    &lu"ter di'ela"kan dalam enam taha$ antara lain

    Taha$ Pertama Tu'uan Anali"i" Clu"ter 

    Tu'uan utama anali"i" &lu"ter adalah

    mem$arti"i "uatu "et o%'ek men'adi dua

    kelom$ok atau le%ih %erda"arkan ke"amaankarakteri"tik khu"u" yang dimilikinya yaitu

    A. De"kri$"i kla"i#ika"i taonomy

    de"&ri$tion

    Penera$an anali"i" &lu"ter "e&ara tradi"i"onal

     %ertu'uan mengek"$lora"i dan mem%entuk "uatu

    kla"i"#ika"iFtak"onomi "e&ara em$iri".51@6

    +arena kemam$uan $arti"inya anali"i" &lu"ter 

    da$at ditera$kan "e&ara lua". (e"ki$un "e&ara

    em$iri" meru$akan teknik ek"$lora"i anali"i"

    &lu"ter da$at $ula digunakan untuk tu'uan

    kon#irma"i.

    1. Penyederhanaan Data

    (eru$akan %agian dari "uatu tak"onomi.

    Dengan "truktur yang ter%ata" o%"er?a"iFo%'ek 

    da$at dikelom$okkan untuk anali"i" "elan'utnya.

    /. *denti#ika"i Hu%ungan Gelation"hi$

    *denti#i&ation

    Hu%ungan antar o%'ek diidenti#ika"i "e&ara

    em$iri". Struktur anali"i" &lu"ter yang "ederhana

    da$at menggam%arkan adanya hu%ungan atau

    ke"amaan dan $er%edaan yang tidak dinyatakan"e%elumnya.

    Tu'uan anali"i" &lu"ter tidak da$at di$i"ahkan

    dengan $emilihan ?aria%el yang digunakan untuk 

    menggolongkan o%'ek ke dalam &lu&ter-&lu"ter.

    Clu"ter yang ter%entuk mere#lek"ikan "truktur 

    yang melekat $ada data "e$erti yang

    dide#ini"ikan oleh ?aria%el-?aria%el. Pemilihan

    ?aria%el haru" "e"uai dengan teori dan kon"e$

    yang umum digunakan dan haru" ra"ional.5116

    Ga"ionalita" ini dida"arkan $ada teori-teori

    ek"$li"it atau $enelitian "e%elumnya. aria%el-?aria%el yang di$ilih hanyalah ?aria%el yang

    da$at men&irikan o%'ek yang akan

  • 8/16/2019 Template Makalah Seminasik 2014

    3/5

     Prosiding – Seminar Nasional Ilmu Komputer 2014

     ISBN:XXXX 

    dikelom$okkan dan "e&ara "$e"i#ik haru" "e"uai

    dengan tu'uan anali"i" &lu"ter.

    Taha$ +edua De"ain Penelitian dalam

    Anali"i" Clu"ter 

    Tiga hal $enting dalam taha$ ini adalah

     $endetek"ian outlier, mengukur ke"amaan, dan

    "tandari"a"i data.

    1. Pendetek"ian 7utlier 

    7utlier adalah "uatu o%'ek yang "angat

     %er%eda dengan o%'ek lainnya. 7utlier da$at

    digam%arkan "e%agai o%"er?a"i yang "e&ara nyata

    ke%ia"aan, tidak me>akili $o$ula"i umum, dan

    adanya under"am$ling da$at $ula memun&ulkan

    outlier. 7utlier menye%a%kan menye%a%kan

    "truktur yang tidak %enar dan &lu"ter yangter%entuk men'adi tidak re$re"entati#.

    /. (engukur +e"amaan antar 7%'ek 

    +on"e$ ke"amaan adalah hal yang

    #undamental dalam anali"i" &lu"ter. +e"amaan

    antar o%'ek meru$akan ukuran kore"$onden"i

    antar o%'ek. Ada tiga metode yang da$at

    ditera$kan, yaitu ukuran korela"i, ukuran 'arak,

    dan ukuran a"o"ia"i.

    /.1 kuran +orela"i

    kuran ini da$at ditera$kan $ada datadengan "kala metrik, namun 'arang digunakan

    karena titik %ertnya $ada nilai "uatu $ola tertentu,

     $adahal ti"ik %erat anali"i" &lu"ter adalah

     %e"arnya o%'ek. +e"amaan antar o%'ek da$at

    dilihat dari koe#i"ien korela"i antar $a"angan

    o%'ek yang diukur dengan %e%era$a ?aria%el.

    /./ kuran arak 

    (eru$akan ukuran yang $aling "ering

    digunakan. Ditera$kan untuk data %er"kala

    metrik. Se%enarnya meru$akan ukuran

    ketidakmiri$an, dimana 'arak yang %e"ar 

    menun'ukkan "edikit ke"amaan "e%aliknya 'arak 

    yang $endekFke"il menun'ukkan %ah>a "uatu

    o%'ek makin miri$ dengan o%'ek lain. 4edanya

    dengan ukuran korela"i adalah %nah>a ukuran

     'arak #oku"nya $ada %e"arnya nilai. Clu"ter 

     %erda"arkan ukuran korela"i %i"a "a'a tidak 

    memiliki ke"amaan nilai ta$i memiliki ke"amaan

     $ola, "edangkan &lu"ter d%erda"rkan ukuran 'arak 

    le%ih memiliki ke"amaan nilai me"ki$un $olanya

     %er%eda./.8 kuran A"o"ia"i

    kuran a"o"ia"i di$akai untuk mengukur data

     %er"kala nonmetrik nominal atau ordinal.

    8. Standari"a"i Data

    a. Standari"a"i aria%el

    4entuk $aling umum dalam "tandari"a"i?aria%el adalah kon?er"i "etia$ ?aria%el terhada$

    "kor "tandar dikenal dengan I "&ore dengan

    melakukan "u%"trak"i nilai tengan dan

    mem%aginyadengan "tandar de?ia"i tia$ ?aria%el.

     %. Standari"a"i Data

    4er%eda dengan "tandari"a"i ?aria%el,

    "tandari"a"i ndata dilakukan terhada$

    o%"er?a"iFo%'ek yang akan dikelom$okkan.

    Taha$ +etiga A"um"i-a"um"i dalam

    Anali"i" Clu"ter 

    Se$erti hal teknik anali"i" lain,anali"i" &lu"ter 

     'uga meneta$kan adanya "uatu a"um"i. Ada dua

    a"um"i dalam anali"i" &lu"ter, yaitu

    1. +e&uku$an Sam$el untuk  

    mere$re"enta"ikan F me>akili $o$ula"i.

    4ia"anya "uatu $enelitian dilakukan terhada$

     $o$ula"i di>akili oleh "ekelom$ok "am$el.

    Sam$el yang digunakan dalam anali"i" &ku"ter 

    haru" da$at me>akili $o$ula"i yang ingin

    di'ela"kan, karena anali"i" ini %aik 'ika "am$el

    re$re"entati#. umlah "am$el yang diam%il

    tergantung $enelitinya, "eorang $eneliti haru"

    yakin %ah>a "am$il yang diam%il re$re"entati# 

    terhada$ $o$ula"i.

    /. Pengaruh (ultukolinierita"

    Ada atau tidaknya multikolinierita" antar 

    ?aria%el "angat di$erhatikan dalam anali"i"

    &lu"ter karena hal itu %er$engaruh, "ehingga

    ?aria%el-?aria%el yang %er"i#at multikolinierita"

    "e&ara ek"$li"it die$rtim%angkan dengan le%ih"ek"ama.

    Taha$ +eem$at Pro"e" (enda$atkan

    Clu"ter dan (enilai kelayakan "e&ara

    ke"eluruhan.

    Ada dua $ro"e" $enting yaitu algoritma

    &lu"ter dalam $em%entukan &lu"ter dan

    menentukan 'umlah &lu"ter yang akan di%entuk.

    +eduanya mem$unyai im$lika"i "u%"tan"ial tidak 

    hanya $ada ha"il yang di$eroleh teta$i 'uga $ada

    inter$reta"i yang akan dilakukan terhada$ ha"il

    ter"e%ut.

  • 8/16/2019 Template Makalah Seminasik 2014

    4/5

     Prosiding – Seminar Nasional Ilmu Komputer 201*

     ISBN:XXXX 

    Taha$ +elima *nter$reta"i terhada$ Clu"ter 

    Taha$ inter$reta"i meli$uti $engu'ian tia$

    &lu"ter dalam term untuk menamai dan menandai

    dengan "uatu la%el yang "e&ara akurat da$atmen'ela"kan kealamian &lu"ter. Pro"e" ini dimulai

    dengan "uatu ukuran yang "ering digunakan yaitu

    &entroid &lu"ter.

    (em%uat $ro#il dan inter$reta"i &lu"ter tidak 

    hanya tidak hanya untuk memoeroleh "uatu

    gam%aran "a'a melainkan $ertama, menyediakan

    "uatu rata-rata untuk menilai kore"$onden"i $ada

    &lu"ter yang ter%entuk, kedua, $ro#il &lu"ter 

    mem%erikan araha %agi $enilainan terhada$

    "igni#ikan"i $rakti".

    Taha$ +eenam Pro"e" alida"i dan

    Pem%uatan Pro#il PG7)*!*N0 Clu"ter 

    1. Pro"e" ?alida"i "olu"i &lu"ter 

    Pro"e" ?alida"i %ertu'uan men'amin %ah>a

    "olu"i yang diha"ilkan dari anali"i" &lu"ter da$at

    me>akili $o$ula"i dan da$at digenerali"a"i untuk 

    o%'ek lain. Pendekatan ini mem%andingkan "olu"i

    &lu"ter dan menilai kore"$onden"i ha"il.

    Terkadang tidak da$at di$raktekkan karena

    adanya kendala >aktu dan %iaya atauketidakter"ediaan i%'ek untuk anali"i" &lu"ter 

    ganda.

    /. Pem%uatan Pro#il PG7)*!*N0 Solu"i

    Clu"ter 

    Taha$ ini menggam%arkan karakteri"tik tia$

    &lu"ter untuk men'ela"kan &lu"ter-&lu"ter ter"e%ut

    da$at da$at %er%eda $ada dimen"i yang rele?an.

    Titik %eratnta $ada karakteri"tik yang "e&ara

    "igni#ikan %er%eda antar &lu"tre dan mem$redik"i

    anggota dalam "uatu &lu"ter khu"u".

    Se&ara ke"eluruhan $ro"e" anali"i" &lu"ter 

     %erakhir "etelah keenam taha$ ini dilalui. Ha"il

    anali"i" &lu"ter da$at digunakan untuk %er%agai

    ke$entingan "e"uai dengan materi yang

    dianali"i".

    8. HAS*! DAN PE(4AHASAN

    Anali"a kla"ter %i"a di$eroleh dari ke$adatan

    kla"ter yang di%entuk &lu"ter den"ity. Pro"e"

    &lu"ter di%agi men'adi 9 &lu"ter. Algoritma yang

    diguakan adalah Sim$le +mean", dan

    mengha"ilkan data "e%agai %erikut

    Ta%le 1 &lu"ter Centroid +mean"

    "edang kan untuk tam$ilan &lu"ternya

    mengha"ilkan data "e%agai %erikut

    Gambar #. $ampilan visual setela%

    &lustering

    Dari gam%ar yang diha"ilkan dari $ro"e"

    &lu"tering. Di"im$ulkan %ah>a "emakin "ering

    akti#ita" yang dilakukan dalam $enggunaan ak"e"

    &om$uter yang tehu%ung dengan internet, maka

    akan mengha"ilkan $ro"e" tukar data yang

     %anyak 'uga.

    ntuk ke"im$ulan %anyaknya data yang

    terda$at "etia$ &lu"ter adalah "e%agai %erikut dari

    total data "e%anyak :;8.

    $abel 2. 'asil )Means Clustering Cluster Cluster 1 Cluster 2 Cluster #

    ; data :1B data 9 data B data

    Dari ta%le / di"im$ulkan %ah>a $ro"e" data

     %anyak ter'adi $ada &lu"ter 1 yaitu "e%anyak :1B

    data, hal ini ter'adi karena dalam akti?ita"

    &om$uter ter"e%ut yang terhu%ung dengan

    internet "e&ara &e$at dan %anyak data yang "aling

    mengirim dan menerima.

    9. + ES*(P!AN

  • 8/16/2019 Template Makalah Seminasik 2014

    5/5

     Prosiding – Seminar Nasional Ilmu Komputer 2014

     ISBN:XXXX 

    1. Semakain %anyak $ro"e" akti?ita" yang di

    lakukan dalam &om$uter yang terhu%ung

    internet. (aka akan menha"ilkan $ro"e"

    tukar data yang %anyak $ula.

    /. Data mining "endiri "ering di"e%ut "e%agaikno>ledge di"&o?ery in data%a"e +DD

    adalah kegiatan yang meli$uti $engum$ulan

     $emakaian data hi"tori" untuk menemukan

    keteraturan, $ola hu%ungan dalam "et data

     %erukuran %e"ar. 7ut$ut dari data mining ini

    da$at digunakan untuk $engam%ilan

    ke$utu"an di ma"a de$an.

    8. (etode &lu"tering "angat e#ekti# dan e#i"ien

    dalam $emro"e"an datanya "ehingga

    mem$ermudah meda$atkan ha"ilnya.

    :. SAGANPenelitian ini menda$atkan 'umlanya data

    tia$ &lu"ter. Dihara$kan $ada $enelitian

     %erikutnya ledih detail dalam $em%agian data.

    U&apan $erima kasi%

    Penuli" mengu&a$kan terima ka"ih ke$ada

    ni?er"ita" 0ad'ah (ada yang telah mem%erikan

    #a"ilita" untuk melakukan $enelitian ini.

    DA)TAG  PSTA+A

    516 Ca"tleman, !aleh Ar"hadi, Amir Ho""ein ahangir.J4en#ordK"

    la> %eha?ior o# internet tra##i&J. ournal o# Net>ork and

    Com$uter A$$li&ation"./@18

    5/6 Iainuddin Ia"lina JPola Peman#aatan *nternet oleh (aha"i">a

    Program (agi"ter *lmu Hukum Program Pa"&a"ar'ana

    ni?er"ita Sumatra taraJ.$u"taha urnal StudiPer$u"takaan dan *n#orma"i, ol./, No.1, uni /@@<

    586 Shu-H"ien !iao, Pei-Hui Chu, Pei-Yuan H"iao. JData miningte&hniLue" and a$$li&ation" A de&ade re?ie> #rom

    /@@@ to /@11J.E$ert Sy"tem" >ith A$$li&ation" 8B

    /@1/

    596 Tahta Al#ina, 4udi Santo"a, dan Ali Gidho 4arak%ah.JAnali"a

    Per%andingan (etode Hierar&hi&al Clu"tering, +-mean"dan 0a%ungan +eduanya dalam Clu"ter Data Studi

    ka"u" Pro%lem +er'a Praktek uru"an Teknik *ndu"tri

    *TSJ.GNA! TE+N*+ *TS ol. 1, Se$t, /@1/ *SSN/8@1-B/1

    5:6 !inda>atiJ. DATA (*N*N0 DEN0AN TE+N*+ 

    C!STEG*N0 DA!A( PEN0+!AS*)*+AS*ANDATA (AHAS*SWA STD* +ASS PGED*+S*

    !A(A STD* (AHAS*SWA N*EGS*TAS 4*NA

     NSANTAGAJ.Seminar Na"ional *n#ormatika /@@;"emna"*) /@@; *SSN 1BB-/8/; PN MeteranM

    Yogyakarta, /9 (ei /@@;

    5ei Hany.JE##o&ient and E##e&ti?e

    Clu"tering (ethod" #or S$atial Data (iningJ.*EEE

    TGANSACT*7NS 7N +N7W!ED0E AND DATA

    EN0*NEEG*N0, 7!. 19, N7. :,SEPTE(4EGF7CT74EG /@@/

    56 Naeimeh DE!AAG*, Somnuk PH7N-A(NA*S+.JData(ining A$$li&ation in Higher !earning

    *n"titution"J.*n#ormati&" in Edu&ation, /@@;, ol. , No.

    1, 81:9

    5;6 +ohei Arai= and Ali Gidho 4arak%ah,JHierar&hi&al +-mean"

    an algorithm #or &entroid" initiali2ation #or +-

    mean"J.Ge$ort" o# the )a&ulty o# S&ien&e andEngineering, Saga ni?er"ity, ol. 8 E.

    +rumm&.JWho need" to do >hat >hereO "ing learningmanagement "y"tem" on re"idential ?". &ommuter 

    &am$u"e"J.Com$uter" Edu&ation :< /@11