penerapan knowledge management system di · pdf filetingkat kemiripan proposal dengan skripsi...
TRANSCRIPT
Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) ISSN: 2089-9815
Yogyakarta, 18-19 Maret 2016
PENERAPAN KNOWLEDGE MANAGEMENT SYSTEM DI DINAS
PERTANIAN CIANJUR MENGGUNAKAN
CF-IDF DAN VECTOR SPACE MODEL
Aditya Rakhmatullah
Program Studi Informatika, Fakultas MIPA, Universitas Jenderal Achmad Yani
Jl. Terusan Jendral Sudirman, Cimahi, Jawa Barat 40285
Telp. (022) 6652069
E-mail: [email protected]
ABSTRACT
Horticulture is a plant gardens and culture / Colere is cultivation, and cultivation can be interpreted as a
garden plant. Horticultural more widely used not only for cultivation in the garden. However hurtikultura
used in the types of crops cultivated. Hurtikultura field of work includes seeding, breeding, tissue culture,
production plants, pests and diseases, harvesting, packaging and distribution. Horticulture is one of the
modern methods of agricultural cultivation. Plant information is very important for farmers who focuses
his field. If the plant data was not well documented, users who search for information about the data it
difficult plants. Then it formed KMS plant data processing algorithms using CF-IDF and VSM. This
system uses the concept of KMS (Knowledge Management System) for managing knowledge in the form
of plant data, and also uses CF-IDF algorithm (Concept Frequency - Inverse Document Frequency) and
VSM (Vector Space Model). Then using the algorithm that allows users to search for information related
to the keywords entered in a search engine.
Keywords: KMS, CF-IDF, VSM, Horticulture
ABSTRAKS
Hortikultura (horticulture) adalah tanaman kebun dan cultura / colere merupakan budidaya, dan dapat
diartikan sebagai budidaya tanaman kebun. Hortikultura digunakan secara lebih luas bukan hanya untuk
budidaya di kebun. Akan tetapi hurtikultura digunakan pada jenis tanaman yang dibudidayakan. Bidang
kerja hurtikultura meliputi pembenihan, pembibitan, kultur jaringan, produksi tanaman, hama dan
penyakit, panen, pengemasan dan distribusi. Hortikultura merupakan salah satu metode budidaya
pertanian modern. Informasi Tanaman sangat penting bagi para petani yang berfokus dibidang nya.
Apabila data tanaman itu tidak terdokumentasi dengan baik para pengguna yang mencari informasi
mengenai data tanaman merasa kesulitan. Maka itu terbentuklah KMS pengolahan data tanaman
menggunakan algoritma CF-IDF dan VSM. Sistem ini menggunakan konsep KMS (Knowledge
Management System) untuk mengelola pengetahuan berupa data tanaman, dan juga menggunakan
algoritma CF-IDF (Concept Frequency - Inverse Document Frequency) dan VSM (Vector Space Model).
Maka menggunakan algoritma tersebut agar memudahkan pengguna dalam mencari informasi berkaitan
dengan kata kunci yang dimasukkan pada mesin pencarian.
Kata Kunci : KMS, CF-IDF, VSM, HORTICULTURE
1. PENDAHULUAN
1.1 Latar Belakang
Dinas pertanian tanaman pangan dan
hortikultura kabupaten Cianjur merupakan unsur
pelaksana otonomi daerah di bidang pertanian
tanaman pangan dan hortikultura yang bertugas
merumuskan kebijakan teknis bidang pertanian
dan melaksanakan tugas teknis oprasional bidang
pertanian.
Pada dinas pertanian tanaman pangan dan
hortikultura, memiliki aset pengetahuan tacit
knowledge dan explicit knowledge. Tacit
knowledge adalah pengetahuan yang bersifat
subyektif, cognitive, experiantal learning dan
kasat mata. Explicit knowledge adalah
pengetahuan yang berbentuk obyektif, rational,
dan teknis. Namun sayangnya, aset pengetahuan
yang ada di dinas ini belum berjalan dengan
baik, dimana tacit knowledge hanya dimiliki
oleh pegawai tertentu, dan explicit knowledge
berbentuk dokumen yang tersimpan dimana saja.
Apabila pengunjung yang mencari langsung
informasi mengenai tanaman ke dinas, pegawai
di dinaspun harus mencari dahulu informasi yang
telah di arsipkan, dan juga apabila informasi
yang telah di arsipkan itu tidak ada. Maka
624
Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) ISSN: 2089-9815
Yogyakarta, 18-19 Maret 2016
pegawai tersebut menanyakan langsung ke
pegawai lain yang memiliki pengetahuan
mengenai apa yang dicari oleh pengunjung, akan
tetapi pengetahuan yang dimiliki pegawai disana
sedang berhalanagan hadir, pada akhirnya
pengunjung yang mencari informasi tanaman
merasa kesulitan mendapatkan informasi yang
diharapkan. Sehingga dapat disimpulkan dari
permasalahan yang ada di dinas yaitu, tidak
adanya sharing knowledge dan sulit mengakses
dokumen yang ada.
Maka dari itu, diperlukan sebuah media
dokumentasi dengan memanfaatkan teknologi
informasi, sehingga dapat membantu untuk
mengelola pengetahuan mengenai data tanaman
pada dinas pertanian dan juga pengguna sistem
ini dalam mencari informasi dapat dengan
mudah. Media dokumentasi tersebut yaitu sistem
KMS (Knowledge Management System)
pengolahan data tanaman pada dinas pertanian
dengan menggunakan algoritma CF-IDF
(Concept Frequency – Inverse Document
Frequency) dan VSM (Vector Space Model).
Knowledge Management System digunakan
untuk memfasilitasi penangkapan, penyimpanan,
pencarian dan penggunaan kembali pengetahuan,
sedangkan CF-IDF (Concept Frequency –
Inverse Document Frequency) dan VSM (Vector
Space Model) digunakan untuk hasil pencarian
data yang berhubungan, sehingga ada lebih
banyak informasi berupa pengetahuan yang
ditampilkan dalam pencarian. Penelitian
sebelumnya yang berjudul “Penerapan Konsep
Knowledge Management System (KMS) Untuk
Pengelolaan Hasil Proyek Konsultasi
menggunakan Text Mining”, dalam penelitian
ini menjelaskan penerapan sebuah konsep
Knowledge Management System untuk
mengelola data hasil proyek konsultasi dengan
menggunakan TF-IDF dan VSM (Nursamsudin,
2006). Penelitian lain yang berjudul “pengukuran
tingkat kemiripan proposal dengan skripsi
terdahulu menggunakan CF-IDF dan VSM”.
Dalam penelitian ini membahas mengukur
tingkat kemiripan proposal untuk untuk
menghindari penelitian yang dirasa sama dengan
penelitian sebelum nya denagn CF-IDF untuk
memberikan pembobotan pada suatu dokeumen
dan VSM sebagai metode untuk mengukur
tingkat kemiripan antara suatu dokumen dengan
kata kunci (Candra, 2014).
Dalam penelitian yang akan dibuat ini,
menerapkan sebuah konsep Knowledge
Management dimana proses share knowledge
dapat berjalan dengan baik untuk mengelola
pengetahuan di dinas pertanian, dengan
perpaduan algoritma CF-IDF dan VSM. Dimana
proses perhitungan dengan perpaduan algoritma
tersebut dapat menghasilkan output yang akurat.
Dalam penelitian ini saaya menggunakan konsep
knowledge management, karena memang lebih
mendukung dengan masalah di dinas pertanian.
Sedangkan dalam penelitian ini menggunakan
perpaduan antara algoritma CF-IDF dan VSM
dimana dapat menghasilkan keluaran yang akurat
dalam hal pencarian juga keakurasian,
dibandingkan dengan algoritma pencarian lain
yang kurang efektif, sehingga penelitian ini
menggunakan perpaduan algoritma CF-IDF dan
VSM yang lebih mendukung.
1.2 Rumusan Masalah
Berdasarkan latar belakang yang sudah
dijelaskan di atas, dapat diidentifikasikan
masalah dalam penelitian ini adalah belum
adanya proses sharing knowledge yang
terkomputerisasi dengan baik antara pihak dinas
dan petani, sehingga membutuhkan teknologi
informasi untuk mencari pengetahuan budidaya
tanaman yang relevan.
1.3 Tujuan
Tujuan dari penelitian ini yaitu, untuk
membangun sistem yang dapat mengelola
pengetahuan yanga ada pada dinas pertanian,
dengan menerapakan konsep knowledge
management, yang didalam nya terdapat proses
pencarian data tanaman berdasarkan kata kunci
yang dicari menggunakan VSM, sebagai metode
untuk mencari tingkat kemiripan antara suatu
dokumen dengan kata kunci yang dicari.
1.4 Metode Penelitian
Sistem ini merupakann sistem yang dapat
merekomendasikan sebuah informasi atas
permasalahan yang ada, berdasarkan acuan dari
permasalahan sebelumnya. Terdapat dua proses
pada aplikasi ini yaitu proses pembelajaran dan
pencarian dokumen. Dimana nantinya akan
membandingkan kata kunci yang dicari dengan
basis pengetahuan yang ada, sehingga
menghasilkan rekomendasi informasi. Gambaran
umum dari sistem yang akan dibuat dapat dilihat
pada Gambar 1.
625
Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) ISSN: 2089-9815
Yogyakarta, 18-19 Maret 2016
Gambar 1 Metode penelitian
Keterangan :
Dalam metodologi penelitian ini ada 3
tahapan, yaitu :
1. Masukan
Terdapat dua data masukan yaitu
data tanaman serta pengolahannya, dan
kata kunci pencarian. Data tersebut
selanjutnya diproses pada tahap pre-
processing.
a. Input pertama dikelola oleh pihak
dinas, dimana pihak dinas
inputkan berbagai jenis data
tanaman dan cara pengolahannya.
b. Input kedua pengguna masukan
kata kunci yang dicari. 2. Proses
Dalam tahap ini, terdapat beberapa
langkah yang dilakukan, yaitu sebagai
berikut.
a. Tahap Pre-processing
Pada tahap ini dokumen melalui
tahap text mining yaitu proses case
folding, tokenizing,dan filtering.
1. Case folding adalah tahap
dimana untuk merubah semua
huruf dalam dokumen menjadi
huruf kecil.
2. Tokenizing adalah tahap
pemotongan kalimat inputan
menjadi kata perkata pada setiap
kata yang menyusunnya.
3. Filtering adalah tahap
mengambil kata – kata penting
dari hasil token menggunakan
algoritma stoplist (membuang
kata yang kurang penting).
b. Tahap Processing
Setelah melalui proses pada pre-
processing yang memfilter dokumen
berupa text itu selanjutnya adalah tahap
processing, pada tahap ini menghitung
CF, menghitung DF dan meghitung hasil
bobot dari suatu dokumen, dimana untuk
pemberian bobot terhadap dokumen.
Sedangkan proses vector space model
mencari sudut antara dua vector dengan
menghitung dua sudut antara bobot suatu
dokumen uji dan dokumen banding /
bobot kata kunci menggunakan VSM
dengan pendekatan cosine similarty. Pada
tahap dokumen banding telah dihitung
dan mendapatkan hasil bobot suatu
dokumen, hasil pembobotan nya masuk
kedalam database pengetahuan.
Sedangkan setelah perhitungan antara CF-
IDF kemudian dilakukan perihitungan
concept pada dokumen uji dengan
concept pada dokumen banding
menggunakan VSM, mendapat bobot dari
hasil perhitungan tersebut, dimana bobot
yang paling tinggi nilai nya, itu yang
paling mendekati kata kunci yang dicari
dengan dokumen.Keluaran
Keluaran yang dihasilkan yaitu
berupa hasil pencarian informasi tanaman,
berasarkan kata kunci yang dicari dari
proses perhitungan CF-IDF dan VSM.
2. PEMBAHASAN
2.1 Tanaman Pangan
Tanaman pangan adalah segala sesuatu yang
bersumber dari sumber hayati dan air baik yang
diolah maupun yang tidak diolah. Pangan
diperuntukan bagi konsumsi manusia sebagai
makanan atau minuman, termasuk bahan pangan,
bahan baku pangan dan bahan – bahan lain yang
digunakan dalam proses penyiapan, pengolahan
dan pembuatan makanan atau minuman.
Komuditas pangan harus mengandung zat
gizi yang terdiri atas karbohidrat, protein, lemat,
vitamin, dan mineral yang bermanfaat bagi
pertumbuhan dan kesehatan manusia. Secara
sempit, tanaman pangan biasanya dibatasi pada
kelompok tanam yang berumur semusim, adapun
Pel
aku
Per
tan
ian
Pih
ak D
inas
Metode Penelitian
Input Proses Output
Data
tanam
an &
cara
pengo
lahan
nya
Kata
kunci
penca
rian
Proses
text
mining
Proses
text
mining
Proses
CF-IDF
Proses
CF-IDF
Hasil
pembobotan
Dat
abas
e
pen
get
ahu
an
Rekomen
dasi
informasi
tanaman
VSM
626
Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) ISSN: 2089-9815
Yogyakarta, 18-19 Maret 2016
tanaman pangan yang berumur semusim dan
mengandung sumber hayati dan air yaitu padi,
jagung, kedelai, kacang tanah, ubi kayu
(singkong), dan ubi jalar.
2.2 Tanaman Hortikultura
Hortikultura secara bahasa diambil dari
bahasa latin yang terdiri dari kata “hortus” yang
berarti kebun, dan kata “culture” yang berarti
bercocok tanam. Jadi makna hortikultura adalah
cara atau teknik bercocok tanam yang
menggunakan media kebun atau pekarangan
rumah sebagai lahan. Tanaman yang termasuk
jenis tanaman hortikultura yaitu sayuran, buah-
buahan, tanaman hias, dan obat-obatan.
2.3 Tanaman Perkebunan
Perkebunan adalah segala kegiatan yang
mengusahakan tanaman tertentu pada tanah atau
media tumbuh lainnya dalam ekosistem yang
sesuai, mengolah, dan memasarkan barang atau
jasa hasil tanaman tersebut, dengan bantuaan
ilmu pengetahuan dan teknologi pemodelan serta
manajemen. Lahan perkebunan adalah lahan
usaha pertanian yang luas, biasanya terletak di
daerah tropis atau subtropis, yang digunakan
untuk menghasilkan komuditas perdagangan
(pertanian) dalam skala besar dipasarkan
ketempat yang jauh, bukan untuk konsumsi
lokal. Perkebunan dapat ditanami oleh tanaman
industri seperti kakao, kapas, karet, kelapa,
kelapa sawit, kina, kopi, sisasl, tarum, tebu, teh,
tembakau.
2.4 Knowledge Management
Knowledge Management adalah usaha untuk
meningkatkan pengetahuan yang berguna dalam
organisasi. Diantaranya membiasakan budaya
berkomunikasi antar personil, memberikan
kesempatan untuk belajar dan menggalakan
saling berbagi knowledge. Dimana usaha ini akan
menciptakan dan mempertahankan peningkatan
nilai dari inti kompetensi bisnis dengan
memanfaatkan teknologi informasi yang ada.
Nonaka dan Takeuchi (1995) mengemukakan
bahwa alasan fundamental mengapa perusahaan
jepang sukses, karena keterampilan dan
pengalaman mereka terdapat pada penciptaan
knowledge organisasi. Penciptaan knowledge
dicapai melalui pengenalan hubungan sinergik
antara tacit knowledge dan explicit knowledge.
Ikujiro Nonaka dan Hirotaka Takeuchi pada
tahun 1991 dan 1995, membedakan antara tacit
knowledge dan explicit knowledge dan membagi
model konversi knowledge menjadi 4 cara
sebagai berikut:
a. Tacit knowledge ke Tacit knowledge:
disebut proses Sosialization. Proses transfer
informasi diantara orang-orang dengan cara
percakapan.
b. Tacit knowledge ke Explicit knowledge:
disebut proses Externalization. Proses
eksternalisasi ini yaitu, proses merubah
pengetahuan tacit ke pengetahuan explicit
untuk menjadi konsep yang jelas.
c. Explicit knowledge ke Explicit
knowledge: disebut proses Combination.
Proses kombinasi ini yaitu,
mengkombinasikan berbagai pengetahuan
explicit yang berbeda untuk disusun
kedalam sistem knowledge management.
Media untuk proses ini dapat melalui
intranet (forum diskusi), database
organisasi dan internet untuk memperoleh
sumber eksternal.
d. Explicit knowledge ke Tacit knowledge:
disebut proses Interlization. Internalisasi
berarti memahami pengetahuan explicit.
Semua dokumen data, informasi, dan
pengetahuan yang sudah didokumentasikan
dapat dibaca oleh orang lain.
Knowledge Management System adalah
sistem yang diciptakan untuk memfasilitasi
penangkapan, penyimpanan, pencarian,
pemindahan dan penggunaan kembali
pengetahuan.
2.5 Text Mining
Text mining merupakan proses ekstraksi
pola berupa informasi dan pengetahuan yang
berguna dari sejumlah besar sumber data teks,
seperti dokumen Word, PDF, kutipan teks, dan lain-lain (Kurniawan & Sitompul, 2012). Dalam
proses text mining terdapat tahap pre-processing.
Tahapan pre-processing dilakukan untuk
membersihkan sumber data, dalam hal ini
dokumen pengelolaan, dari hai-hal yang bisa
mengacaukan hasil dari pengolahan pengetahuan
selanjutnya. Dengan dilakukannya pre-
processing, proses text mining akan memberikan
hasil yang lebih memuaskan. Terdapat beberapa
tahapan yang digunakan dalam pre-processing
ini, diantaranya adalah sebagai berikut:
a. Case folding adalah tahapan untuk mengubah
semua huruf dalam dokumen menjadi huruf
kecil. Hanya huruf “a” sampai “z” saja yang
dapat diterima.
b. Tokenizing adalah tahapan dimana adanya
pemotongan string masukan berdasarkan kata
yang menyusunnya. Semua kata pada bagia
sebelum tokenizing dipotong-potong sesuai
panjang huruf dalam setiap kata yang
ditandai dengan spasi.
c. Filtering adalah tahapan mengambil kata-
kata yang penting dari hasil token
627
Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) ISSN: 2089-9815
Yogyakarta, 18-19 Maret 2016
sebelumnya. Didalam tahapan ini dapat
digunakan algoritma pembuangan kata yang
kurang penting (stoplist) atau menyimpan
kata yang penting (wordlist).
2.6 CF-IDF (Concept Frequency – Invers
Document Frequency)
Pembobotan atau weighting merupakan
pemberian bobot terhadap kata/frase yang telah
dihasilkan. Pembobotan digunakan untuk
menentukan nilai kecocokan antara dokumen
pengetahuan dan keyword. Model pembobotan
tersebut dapat dengan pembobotan global, lokal
atau pun kombinasi dari keduanya. Salah satu
pembobotan kombinasi tersebut adalah CF-IDF
(Concept Frequency-Inverse Document
Frequency). Metode ini merupakan
pengembangan dari metode TF-IDF (Term
Frequency-Inverse Document Frequency) yang
lebih dahulu populer. Pada metode ini, tidak
melakukan perhitungan terhadap term (seperti
pada TF-IDF) namun dengan menghitung key
concept yang ditemukan dalam teks (Goossen
dkk, 2011).
Pada CF-IDF, dilakukan pendekatan
representasi isi dokumen dengan menggunakan
jaringan semantik yang disebut dokumen inti
semantik. Dokumen tersebut kemudian dipetakan
dalam jaringan semantik yang disebut WordNet
dan dikonversikan dari sekumpulan terms
menjadi sekumpulan konsep (concept).
Pendekatan ini membuat konsep CF-IDF terlihat
lebih cerdas dibandingkan TF-IDF. Concept
yang dimaksud dalam metode ini adalah kata
atau pun istilah majemuk yang kombinasi
katanya dapat memiliki banyak arti dan
menimbulkan ambiguitas dalam pembacaannya.
Dalam mendeteksi concept dari dokumen
dapat dilakukan dengan dua cara yaitu dengan
memproyeksikan ontology kedalam dokumen
dengan mengekstrak semua frase (istilah
majemuk) dari ontology kemudian
mengidentifikasikan kemunculanya dalam
dokumen. Cara yang kedua dalah dengan
memproyeksikan dokumen kedalam ontology,
untuk setiap calon frase yang terbentuk (yang
dideteksi dari kedekatan kata atau adjacent).
Dalam menghitung bobot cf-idf diperlukan
persamaan sebagai berikut:
a. Untuk perhitungan bobo cf digunakak
rumus sebagai berikut.
(2.1)
Keterangan :
= rasio frekuensi concept pada
dokumen.
= jumlah kemunculan concept dalam
dokumen.
= total kemunculan seluruh concept
dalam dokumen.
b. Untuk menghitung bobot idf digunakan
rumus sebagai berikut :
(2.2)
Keterangan :
= rasio frekuensi dokumen.
= jumlah total dokumen.
= jumlah dokumen yang
terdapat kemunculan concept.
c. Nilai idf itu akan digunakan untuk
perhitungan selanjutnya, yaitu
perhitungan nilai bobot CF-IDF dengan
rumus perhitungan sebagai berikut:
(2.3)
Keterangan :
= bobot CF-IDF.
= rasio frekuensi concept pada
dokumen.
= rasio frekuensi dokumen
2.7 Vector Space Model (VSM)
Model ruang vektor adalah suatu model yang
digunakan untuk mengukur kemiripan antara
suatu dokumen dengan suatu query. Pada model
ini, query dan dokumen dianggap sebagai vektor-
vektor pada ruang n-dimensi, dimana n adalah
jumlah dari seluruh term yang ada dalam
leksikon. Leksikon adalah daftar semua term
yang ada dalam indeks. Salah satu cara untuk
mengatasi hal tersebut dalam model ruang vector
adalah dengan cara melakukan perluasan vector.
Proses perluasan dapat dilakukan pada vektor
query, vektor dokumen, atau pada kedua vektor
tersebut. Pada algoritma vector space model
digunakan rumus untuk mencari nilai cosinus
sudut antara dua vector dari setiap bobot
dokumen (WD) dan bobot dari kata kunci (WK).
Cara kerja dari vector space model adalah
dengan menghitung nilai cosinus sudut dari
kedua vector yaitu vector kata kunci terhadap
vector tiap dokumen (Amin, 2012). Perhitungan
yang digunakan adalah sebagai berikut:
(2.4)
Keterangan
Q = query (kata kunci)
Di = dokumen ke-i
628
Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) ISSN: 2089-9815
Yogyakarta, 18-19 Maret 2016
(2.4)
Keterangan
Di = dokumen ke-i
Q = query (kata kunci)
J = kata diseluruh dokumen
3. IMPLEMENTASI
3.1 Proses Data Masukan
Data yang digunakan sebagai data masukan
yaitu: data jenis tanaman dan pengolahan nya.
data awal berasal dari analisa dokumen yang
menggunakan sample 3 dokumen dan 1 jenis
dokumen uji. Dapat dilihat dari tabel dibawah
ini.
Dok Deskripsi
D1 Syarat tumbuh kacang tanah
berdasarkan iklim
D2 Teknologi Budidaya pengendalian
hama dan penyakit pada kacang tanah
D3 Teknologi Budidaya Tanaman kacang
tanah berdasarkan cara tanam
DU Cara mengendalikan hama dan
penyakit pada kacang tanah
Tabel 3.1
3.2 Proses
Dalam tahap ini, terdapat beberapa langkah
yang dilakukan, yaitu sebagai berikut.
1. Tahap Pre-processing
Pada tahap ini dokumen melalui tahap
text mining yaitu proses case folding,
tokenizing,dan filtering.
a. Case folding adalah tahap dimana untuk
merubah semua huruf dalam dokumen
menjadi huruf kecil.
b. Tokenizing adalah tahap pemotongan
kalimat inputan menjadi kata perkata pada
setiap kata yang menyusunnya.
c. Filtering adalah tahap mengambil kata –
kata penting dari hasil token
menggunakan algoritma stoplist
(membuang kata yang kurang penting).
2. Tahap Processing
Setelah melalui proses pada pre-
processing yang memfilter dokumen berupa
text itu selanjutnya adalah tahap processing,
pada tahap ini menghitung CF, menghitung
DF dan meghitung hasil bobot dari suatu
dokumen, dimana untuk pemberian bobot
terhadap dokumen. Sedangkan proses vector
space model mencari sudut antara dua vector
dengan menghitung dua sudut antara bobot
suatu dokumen uji dan dokumen banding /
bobot kata kunci menggunakan VSM dengan
pendekatan cosine similarty. Pada tahap
dokumen banding telah dihitung dan
mendapatkan hasil bobot suatu dokumen,
hasil pembobotan nya masuk kedalam
database pengetahuan. Sedangkan setelah
perhitungan antara CF-IDF kemudian
dilakukan perihitungan concept pada
dokumen uji dengan concept pada dokumen
banding menggunakan VSM, mendapat bobot
dari hasil perhitungan tersebut, dimana bobot
yang paling tinggi nilai nya, itu yang paling
mendekati kata kunci yang dicari dengan
dokumen.
kata Concept
Syarat
tumbuh
kacang
tanah
dasar
iklim
Syarat
tumbuh
kacang
tanah
dasar
iklim
Tabel 3.2 pada dokumen 1
kata Concept
teknologi
pengendalian
hama
penyakit
kacang
tanah
teknologi
kendali
hama
penyakit
kacang
tanah
Tabel 3.3 pada dokumen 2
kata Concept
teknologi
budidaya
kacang
tanah
dasar
cara
tanam
teknologi
budidaya
kacang
tanah
dasar
cara
tanam
Tabel 3.4 pada dokumen 3
kata Concept
Syarat
tumbuh
kacang
tanah
dasar
iklim
Syarat
tumbuh
kacang
tanah
dasar
iklim
Tabel 3.5 pada dokumen uji
629
Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) ISSN: 2089-9815
Yogyakarta, 18-19 Maret 2016
Selanjutnya setelah mencari concept pada
tiap dokumen selanjutnya melakukan frequency
concept, dapat dilihat dengan hasil pada tabel
dibawah ini.
Concept F
D1 D2 D3
Syarat 1 0 0
tumbuh 1 0 0
Kacang 1 1 1
Tanah 1 1 1
Dasar 1 0 1
Iklim 1 0 0
teknologi 0 1 1
budidaya 0 1 1
kendali 0 1 0
hama 0 1 0
penyakit 0 1 0
dasar 1 0 1
Cara 0 0 1
tanam 0 0 1
Tabel 3.6 frequency concept (cf)
Setelah melakukan rasio kemunculan kata
pada tiap dokumen, selanjutnya melakukan
penjumlahan dokumen yang mengandung
kemunculan kata / conceept yang sama (df).
Dapat dilihat dengan hasil tabel dibawah ini.
Concept df
syarat 1
tumbuh 1
kacang 3
tanah 3
dasar 2
Iklim 1
teknologi 2
budidaya 2
kendali 1
hama 1
penyakit 1
dasar 1
Cara 1
tanam 1
Tabel 3.7 frequency jumlah dokumen (df)
Setelah tahap mencari jumlah dokumen
yang mengandung kemuncula kata / concept
yang sama maka selanjut nya proses cf-idf, dapat
dilihat dari persamaan dibawah ini.
perhitungan nilai CF, IDF, dan CF – IDF
pada kata / concept “pengolahan” dapat dilihat
sebagai berikut:
1. Hitung nilai CF dari kata / concept
a. dan
b. dan
c. dan
Sehingga nilai CF dari kata / concept
“pengolahan” berdasarkan persamaan 2.1 adalah
sebagai berikut:
a. CF D1 = = 0,14
b. CF D2 = = 0
c. CF D3 = = 0
2. Hitung nilai IDF dari kata / concept
“pengolahan” diketahui :
a. = 4 b. = 1
Maka Nilai IDF dari kata / concept
“pengolahan” berdasarkan persamaan 2.2 .
IDF = = 0,477
Setelah mendapat nilai yang dihasilkan bobot cf-
idf, tahap selanjutnya mencari kemiripan untuk
dokumen yang dibandingkan menggunakan
vector space model. Vector space model juga
digunakan rumus mencari nilai cosinus, sudut
antara dua vector dari setiap bobot dokumen
(wd) dan bobot dari kata kunci (wk). Untuk
mencari nilai cosinus sudut dua vector wd dan
wk, terlebih dahulu melakukan normalisasi dari
pembobotan cf-idf.
a. W2 dkk = 02 = 0
b. W2 d1 = 0,072 = 0,0049
c. W2 d2 = 02 = 0
d. W2 d3 = 02 = 0
perhitungan normalisasi pada kata /
conceept “pengolahan” dapat dilihat sebagai
berikut :
Kk*D1 = 0 x 0,07 = 0
Kk*D2 = 0 x 0 = 0
630
Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) ISSN: 2089-9815
Yogyakarta, 18-19 Maret 2016
Kk*D3 = 0 x 0 = 0
Kk*D4 = 0 x 0 = 0
Selanjutnya adalah menghitung nilai
cosinus sudut antara vector kata kunci pada
dokumen uji (Kk) dengan tiap dokumen, dapat
dilihat pada persamaan dibawah ini.
Similaritas (D1) = =
= 0
Similaritas (D2) = =
= 0,0424
Similaritas (D3) = =
= 0
Berdasarkan hasil perhitungan vector space
model diatas dapat diketahui dokumen uji (kk)
memiliki kemiripan terbesar terhadap D2.
3. Output (keluaran) Terdapat keluaran pada sistem yang akan
dibuat ini adalah hasil pencarian informasi
tanaman, berasarkan kata kunci yang dicari dari
proses perhitungan CF-IDF dan VSM.
Hasil dari penelitian dapat dilihat pada
gambar 3.3 dibawah ini.
Gambar 2 Output
4. KESIMPULAN
Setelah melakukan analisa, perancangan
implementasi beserta pengujian yang telah
dilakukan, maka dapat diperoleh kesimpulan
terhadap knowledege management system dinas
pertanian adalah sistem yang dapat mengelola
pengetahuan dinas, berbagi pengetahuan dan
membantu pelaku pertanian dalam mencari
informasi tanaman berdasarkan kata kunci yang
dicari. Sistem yang dibangun menggunakan
concept document – inverse document frequency
dan vector space model. Selain itu sistem ini juga
dapat menghasilkan tingkat keakuratan dalam
pencarian solusi. Hal ini sekaligus dapat
memberikan rekomendasi kepada pelaku
pertanian yang mencari informasi tanaman.
Sistem diuji terhadap fungsi-fungsi dari
perancangan sebelumnya, hasil dari 26 dokumen
yang menghasilkan akurasi 50 – 70 % dan
menghasilkan informasi terkait dengan rata-rata
waktu proses yaitu 10 – 15 detik. Dimana tingkat
akurasi di dapat dari proses VSM yang memang
menghitung bobot dokumen dan kata kunci yang
dicari, sedangkan untuk waktu proses di dapat
dari kecepatan prosesor untuk meng-eksekusi
data dari perpaduan reload browser sama proses
algoritma VSM dan text mining.
PUSTAKA
Amin, F. Semarang, (2012). Sistem Temu
Kembali Informasi Dengan Metode Vector
Space Model, Jurnal Sistem Informasi
Bisnis, vol 2.
Candra, S. (2014). Pengukran tingkat kemiripan
dengan skripsi terdahulu menggunakan
VSM. Skripsi Informatika. Universitas
Jendral Achmad Yani.
Goossen, F. Ijntema, W. Frasincar, F.
Hogenboom, F. Kaymak, U. 2011. News
Personalization Using The CF-IDF Semantic
Recommender. Erasmus University
Rotterdam.
Kurniawan, B. Efendi, S. Sitompul, O. (2012).
Klasifikasi Konten Berita Dengan Metode
Text mining. Jurnal Teknologi Informasi, vol
1.
Nonaka, Ikujiro and Takeuchi, Hirotaka. (1995).
The knowledge-creating company: How
JapaneseCompanies Create the
Dinammmic of Innovation. Oxford
University Press.
Nursamsudin, A. (2006). Penerapan Konwledge
Management System (KMS) Untuk
Pengelolaan Hasil Proyek Konsultasi
Menggunakan Algoritma Text Mining.
Skripsi Informatika. Universitas Jenderal
Achmad Yani.
631