penerapan knowledge management system di · pdf filetingkat kemiripan proposal dengan skripsi...

8
Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) ISSN: 2089-9815 Yogyakarta, 18-19 Maret 2016 PENERAPAN KNOWLEDGE MANAGEMENT SYSTEM DI DINAS PERTANIAN CIANJUR MENGGUNAKAN CF-IDF DAN VECTOR SPACE MODEL Aditya Rakhmatullah Program Studi Informatika, Fakultas MIPA, Universitas Jenderal Achmad Yani Jl. Terusan Jendral Sudirman, Cimahi, Jawa Barat 40285 Telp. (022) 6652069 E-mail: [email protected] ABSTRACT Horticulture is a plant gardens and culture / Colere is cultivation, and cultivation can be interpreted as a garden plant. Horticultural more widely used not only for cultivation in the garden. However hurtikultura used in the types of crops cultivated. Hurtikultura field of work includes seeding, breeding, tissue culture, production plants, pests and diseases, harvesting, packaging and distribution. Horticulture is one of the modern methods of agricultural cultivation. Plant information is very important for farmers who focuses his field. If the plant data was not well documented, users who search for information about the data it difficult plants. Then it formed KMS plant data processing algorithms using CF-IDF and VSM. This system uses the concept of KMS (Knowledge Management System) for managing knowledge in the form of plant data, and also uses CF-IDF algorithm (Concept Frequency - Inverse Document Frequency) and VSM (Vector Space Model). Then using the algorithm that allows users to search for information related to the keywords entered in a search engine. Keywords: KMS, CF-IDF, VSM, Horticulture ABSTRAKS Hortikultura (horticulture) adalah tanaman kebun dan cultura / colere merupakan budidaya, dan dapat diartikan sebagai budidaya tanaman kebun. Hortikultura digunakan secara lebih luas bukan hanya untuk budidaya di kebun. Akan tetapi hurtikultura digunakan pada jenis tanaman yang dibudidayakan. Bidang kerja hurtikultura meliputi pembenihan, pembibitan, kultur jaringan, produksi tanaman, hama dan penyakit, panen, pengemasan dan distribusi. Hortikultura merupakan salah satu metode budidaya pertanian modern. Informasi Tanaman sangat penting bagi para petani yang berfokus dibidang nya. Apabila data tanaman itu tidak terdokumentasi dengan baik para pengguna yang mencari informasi mengenai data tanaman merasa kesulitan. Maka itu terbentuklah KMS pengolahan data tanaman menggunakan algoritma CF-IDF dan VSM. Sistem ini menggunakan konsep KMS (Knowledge Management System) untuk mengelola pengetahuan berupa data tanaman, dan juga menggunakan algoritma CF-IDF (Concept Frequency - Inverse Document Frequency) dan VSM (Vector Space Model). Maka menggunakan algoritma tersebut agar memudahkan pengguna dalam mencari informasi berkaitan dengan kata kunci yang dimasukkan pada mesin pencarian. Kata Kunci : KMS, CF-IDF, VSM, HORTICULTURE 1. PENDAHULUAN 1.1 Latar Belakang Dinas pertanian tanaman pangan dan hortikultura kabupaten Cianjur merupakan unsur pelaksana otonomi daerah di bidang pertanian tanaman pangan dan hortikultura yang bertugas merumuskan kebijakan teknis bidang pertanian dan melaksanakan tugas teknis oprasional bidang pertanian. Pada dinas pertanian tanaman pangan dan hortikultura, memiliki aset pengetahuan tacit knowledge dan explicit knowledge. Tacit knowledge adalah pengetahuan yang bersifat subyektif, cognitive, experiantal learning dan kasat mata. Explicit knowledge adalah pengetahuan yang berbentuk obyektif, rational, dan teknis. Namun sayangnya, aset pengetahuan yang ada di dinas ini belum berjalan dengan baik, dimana tacit knowledge hanya dimiliki oleh pegawai tertentu, dan explicit knowledge berbentuk dokumen yang tersimpan dimana saja. Apabila pengunjung yang mencari langsung informasi mengenai tanaman ke dinas, pegawai di dinaspun harus mencari dahulu informasi yang telah di arsipkan, dan juga apabila informasi yang telah di arsipkan itu tidak ada. Maka 624

Upload: dangnhan

Post on 06-Feb-2018

214 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: PENERAPAN KNOWLEDGE MANAGEMENT SYSTEM DI  · PDF filetingkat kemiripan proposal dengan skripsi ... dan pembuatan makanan atau minuman. ... usaha pertanian yang luas,

Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) ISSN: 2089-9815

Yogyakarta, 18-19 Maret 2016

PENERAPAN KNOWLEDGE MANAGEMENT SYSTEM DI DINAS

PERTANIAN CIANJUR MENGGUNAKAN

CF-IDF DAN VECTOR SPACE MODEL

Aditya Rakhmatullah

Program Studi Informatika, Fakultas MIPA, Universitas Jenderal Achmad Yani

Jl. Terusan Jendral Sudirman, Cimahi, Jawa Barat 40285

Telp. (022) 6652069

E-mail: [email protected]

ABSTRACT

Horticulture is a plant gardens and culture / Colere is cultivation, and cultivation can be interpreted as a

garden plant. Horticultural more widely used not only for cultivation in the garden. However hurtikultura

used in the types of crops cultivated. Hurtikultura field of work includes seeding, breeding, tissue culture,

production plants, pests and diseases, harvesting, packaging and distribution. Horticulture is one of the

modern methods of agricultural cultivation. Plant information is very important for farmers who focuses

his field. If the plant data was not well documented, users who search for information about the data it

difficult plants. Then it formed KMS plant data processing algorithms using CF-IDF and VSM. This

system uses the concept of KMS (Knowledge Management System) for managing knowledge in the form

of plant data, and also uses CF-IDF algorithm (Concept Frequency - Inverse Document Frequency) and

VSM (Vector Space Model). Then using the algorithm that allows users to search for information related

to the keywords entered in a search engine.

Keywords: KMS, CF-IDF, VSM, Horticulture

ABSTRAKS

Hortikultura (horticulture) adalah tanaman kebun dan cultura / colere merupakan budidaya, dan dapat

diartikan sebagai budidaya tanaman kebun. Hortikultura digunakan secara lebih luas bukan hanya untuk

budidaya di kebun. Akan tetapi hurtikultura digunakan pada jenis tanaman yang dibudidayakan. Bidang

kerja hurtikultura meliputi pembenihan, pembibitan, kultur jaringan, produksi tanaman, hama dan

penyakit, panen, pengemasan dan distribusi. Hortikultura merupakan salah satu metode budidaya

pertanian modern. Informasi Tanaman sangat penting bagi para petani yang berfokus dibidang nya.

Apabila data tanaman itu tidak terdokumentasi dengan baik para pengguna yang mencari informasi

mengenai data tanaman merasa kesulitan. Maka itu terbentuklah KMS pengolahan data tanaman

menggunakan algoritma CF-IDF dan VSM. Sistem ini menggunakan konsep KMS (Knowledge

Management System) untuk mengelola pengetahuan berupa data tanaman, dan juga menggunakan

algoritma CF-IDF (Concept Frequency - Inverse Document Frequency) dan VSM (Vector Space Model).

Maka menggunakan algoritma tersebut agar memudahkan pengguna dalam mencari informasi berkaitan

dengan kata kunci yang dimasukkan pada mesin pencarian.

Kata Kunci : KMS, CF-IDF, VSM, HORTICULTURE

1. PENDAHULUAN

1.1 Latar Belakang

Dinas pertanian tanaman pangan dan

hortikultura kabupaten Cianjur merupakan unsur

pelaksana otonomi daerah di bidang pertanian

tanaman pangan dan hortikultura yang bertugas

merumuskan kebijakan teknis bidang pertanian

dan melaksanakan tugas teknis oprasional bidang

pertanian.

Pada dinas pertanian tanaman pangan dan

hortikultura, memiliki aset pengetahuan tacit

knowledge dan explicit knowledge. Tacit

knowledge adalah pengetahuan yang bersifat

subyektif, cognitive, experiantal learning dan

kasat mata. Explicit knowledge adalah

pengetahuan yang berbentuk obyektif, rational,

dan teknis. Namun sayangnya, aset pengetahuan

yang ada di dinas ini belum berjalan dengan

baik, dimana tacit knowledge hanya dimiliki

oleh pegawai tertentu, dan explicit knowledge

berbentuk dokumen yang tersimpan dimana saja.

Apabila pengunjung yang mencari langsung

informasi mengenai tanaman ke dinas, pegawai

di dinaspun harus mencari dahulu informasi yang

telah di arsipkan, dan juga apabila informasi

yang telah di arsipkan itu tidak ada. Maka

624

Page 2: PENERAPAN KNOWLEDGE MANAGEMENT SYSTEM DI  · PDF filetingkat kemiripan proposal dengan skripsi ... dan pembuatan makanan atau minuman. ... usaha pertanian yang luas,

Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) ISSN: 2089-9815

Yogyakarta, 18-19 Maret 2016

pegawai tersebut menanyakan langsung ke

pegawai lain yang memiliki pengetahuan

mengenai apa yang dicari oleh pengunjung, akan

tetapi pengetahuan yang dimiliki pegawai disana

sedang berhalanagan hadir, pada akhirnya

pengunjung yang mencari informasi tanaman

merasa kesulitan mendapatkan informasi yang

diharapkan. Sehingga dapat disimpulkan dari

permasalahan yang ada di dinas yaitu, tidak

adanya sharing knowledge dan sulit mengakses

dokumen yang ada.

Maka dari itu, diperlukan sebuah media

dokumentasi dengan memanfaatkan teknologi

informasi, sehingga dapat membantu untuk

mengelola pengetahuan mengenai data tanaman

pada dinas pertanian dan juga pengguna sistem

ini dalam mencari informasi dapat dengan

mudah. Media dokumentasi tersebut yaitu sistem

KMS (Knowledge Management System)

pengolahan data tanaman pada dinas pertanian

dengan menggunakan algoritma CF-IDF

(Concept Frequency – Inverse Document

Frequency) dan VSM (Vector Space Model).

Knowledge Management System digunakan

untuk memfasilitasi penangkapan, penyimpanan,

pencarian dan penggunaan kembali pengetahuan,

sedangkan CF-IDF (Concept Frequency –

Inverse Document Frequency) dan VSM (Vector

Space Model) digunakan untuk hasil pencarian

data yang berhubungan, sehingga ada lebih

banyak informasi berupa pengetahuan yang

ditampilkan dalam pencarian. Penelitian

sebelumnya yang berjudul “Penerapan Konsep

Knowledge Management System (KMS) Untuk

Pengelolaan Hasil Proyek Konsultasi

menggunakan Text Mining”, dalam penelitian

ini menjelaskan penerapan sebuah konsep

Knowledge Management System untuk

mengelola data hasil proyek konsultasi dengan

menggunakan TF-IDF dan VSM (Nursamsudin,

2006). Penelitian lain yang berjudul “pengukuran

tingkat kemiripan proposal dengan skripsi

terdahulu menggunakan CF-IDF dan VSM”.

Dalam penelitian ini membahas mengukur

tingkat kemiripan proposal untuk untuk

menghindari penelitian yang dirasa sama dengan

penelitian sebelum nya denagn CF-IDF untuk

memberikan pembobotan pada suatu dokeumen

dan VSM sebagai metode untuk mengukur

tingkat kemiripan antara suatu dokumen dengan

kata kunci (Candra, 2014).

Dalam penelitian yang akan dibuat ini,

menerapkan sebuah konsep Knowledge

Management dimana proses share knowledge

dapat berjalan dengan baik untuk mengelola

pengetahuan di dinas pertanian, dengan

perpaduan algoritma CF-IDF dan VSM. Dimana

proses perhitungan dengan perpaduan algoritma

tersebut dapat menghasilkan output yang akurat.

Dalam penelitian ini saaya menggunakan konsep

knowledge management, karena memang lebih

mendukung dengan masalah di dinas pertanian.

Sedangkan dalam penelitian ini menggunakan

perpaduan antara algoritma CF-IDF dan VSM

dimana dapat menghasilkan keluaran yang akurat

dalam hal pencarian juga keakurasian,

dibandingkan dengan algoritma pencarian lain

yang kurang efektif, sehingga penelitian ini

menggunakan perpaduan algoritma CF-IDF dan

VSM yang lebih mendukung.

1.2 Rumusan Masalah

Berdasarkan latar belakang yang sudah

dijelaskan di atas, dapat diidentifikasikan

masalah dalam penelitian ini adalah belum

adanya proses sharing knowledge yang

terkomputerisasi dengan baik antara pihak dinas

dan petani, sehingga membutuhkan teknologi

informasi untuk mencari pengetahuan budidaya

tanaman yang relevan.

1.3 Tujuan

Tujuan dari penelitian ini yaitu, untuk

membangun sistem yang dapat mengelola

pengetahuan yanga ada pada dinas pertanian,

dengan menerapakan konsep knowledge

management, yang didalam nya terdapat proses

pencarian data tanaman berdasarkan kata kunci

yang dicari menggunakan VSM, sebagai metode

untuk mencari tingkat kemiripan antara suatu

dokumen dengan kata kunci yang dicari.

1.4 Metode Penelitian

Sistem ini merupakann sistem yang dapat

merekomendasikan sebuah informasi atas

permasalahan yang ada, berdasarkan acuan dari

permasalahan sebelumnya. Terdapat dua proses

pada aplikasi ini yaitu proses pembelajaran dan

pencarian dokumen. Dimana nantinya akan

membandingkan kata kunci yang dicari dengan

basis pengetahuan yang ada, sehingga

menghasilkan rekomendasi informasi. Gambaran

umum dari sistem yang akan dibuat dapat dilihat

pada Gambar 1.

625

Page 3: PENERAPAN KNOWLEDGE MANAGEMENT SYSTEM DI  · PDF filetingkat kemiripan proposal dengan skripsi ... dan pembuatan makanan atau minuman. ... usaha pertanian yang luas,

Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) ISSN: 2089-9815

Yogyakarta, 18-19 Maret 2016

Gambar 1 Metode penelitian

Keterangan :

Dalam metodologi penelitian ini ada 3

tahapan, yaitu :

1. Masukan

Terdapat dua data masukan yaitu

data tanaman serta pengolahannya, dan

kata kunci pencarian. Data tersebut

selanjutnya diproses pada tahap pre-

processing.

a. Input pertama dikelola oleh pihak

dinas, dimana pihak dinas

inputkan berbagai jenis data

tanaman dan cara pengolahannya.

b. Input kedua pengguna masukan

kata kunci yang dicari. 2. Proses

Dalam tahap ini, terdapat beberapa

langkah yang dilakukan, yaitu sebagai

berikut.

a. Tahap Pre-processing

Pada tahap ini dokumen melalui

tahap text mining yaitu proses case

folding, tokenizing,dan filtering.

1. Case folding adalah tahap

dimana untuk merubah semua

huruf dalam dokumen menjadi

huruf kecil.

2. Tokenizing adalah tahap

pemotongan kalimat inputan

menjadi kata perkata pada setiap

kata yang menyusunnya.

3. Filtering adalah tahap

mengambil kata – kata penting

dari hasil token menggunakan

algoritma stoplist (membuang

kata yang kurang penting).

b. Tahap Processing

Setelah melalui proses pada pre-

processing yang memfilter dokumen

berupa text itu selanjutnya adalah tahap

processing, pada tahap ini menghitung

CF, menghitung DF dan meghitung hasil

bobot dari suatu dokumen, dimana untuk

pemberian bobot terhadap dokumen.

Sedangkan proses vector space model

mencari sudut antara dua vector dengan

menghitung dua sudut antara bobot suatu

dokumen uji dan dokumen banding /

bobot kata kunci menggunakan VSM

dengan pendekatan cosine similarty. Pada

tahap dokumen banding telah dihitung

dan mendapatkan hasil bobot suatu

dokumen, hasil pembobotan nya masuk

kedalam database pengetahuan.

Sedangkan setelah perhitungan antara CF-

IDF kemudian dilakukan perihitungan

concept pada dokumen uji dengan

concept pada dokumen banding

menggunakan VSM, mendapat bobot dari

hasil perhitungan tersebut, dimana bobot

yang paling tinggi nilai nya, itu yang

paling mendekati kata kunci yang dicari

dengan dokumen.Keluaran

Keluaran yang dihasilkan yaitu

berupa hasil pencarian informasi tanaman,

berasarkan kata kunci yang dicari dari

proses perhitungan CF-IDF dan VSM.

2. PEMBAHASAN

2.1 Tanaman Pangan

Tanaman pangan adalah segala sesuatu yang

bersumber dari sumber hayati dan air baik yang

diolah maupun yang tidak diolah. Pangan

diperuntukan bagi konsumsi manusia sebagai

makanan atau minuman, termasuk bahan pangan,

bahan baku pangan dan bahan – bahan lain yang

digunakan dalam proses penyiapan, pengolahan

dan pembuatan makanan atau minuman.

Komuditas pangan harus mengandung zat

gizi yang terdiri atas karbohidrat, protein, lemat,

vitamin, dan mineral yang bermanfaat bagi

pertumbuhan dan kesehatan manusia. Secara

sempit, tanaman pangan biasanya dibatasi pada

kelompok tanam yang berumur semusim, adapun

Pel

aku

Per

tan

ian

Pih

ak D

inas

Metode Penelitian

Input Proses Output

Data

tanam

an &

cara

pengo

lahan

nya

Kata

kunci

penca

rian

Proses

text

mining

Proses

text

mining

Proses

CF-IDF

Proses

CF-IDF

Hasil

pembobotan

Dat

abas

e

pen

get

ahu

an

Rekomen

dasi

informasi

tanaman

VSM

626

Page 4: PENERAPAN KNOWLEDGE MANAGEMENT SYSTEM DI  · PDF filetingkat kemiripan proposal dengan skripsi ... dan pembuatan makanan atau minuman. ... usaha pertanian yang luas,

Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) ISSN: 2089-9815

Yogyakarta, 18-19 Maret 2016

tanaman pangan yang berumur semusim dan

mengandung sumber hayati dan air yaitu padi,

jagung, kedelai, kacang tanah, ubi kayu

(singkong), dan ubi jalar.

2.2 Tanaman Hortikultura

Hortikultura secara bahasa diambil dari

bahasa latin yang terdiri dari kata “hortus” yang

berarti kebun, dan kata “culture” yang berarti

bercocok tanam. Jadi makna hortikultura adalah

cara atau teknik bercocok tanam yang

menggunakan media kebun atau pekarangan

rumah sebagai lahan. Tanaman yang termasuk

jenis tanaman hortikultura yaitu sayuran, buah-

buahan, tanaman hias, dan obat-obatan.

2.3 Tanaman Perkebunan

Perkebunan adalah segala kegiatan yang

mengusahakan tanaman tertentu pada tanah atau

media tumbuh lainnya dalam ekosistem yang

sesuai, mengolah, dan memasarkan barang atau

jasa hasil tanaman tersebut, dengan bantuaan

ilmu pengetahuan dan teknologi pemodelan serta

manajemen. Lahan perkebunan adalah lahan

usaha pertanian yang luas, biasanya terletak di

daerah tropis atau subtropis, yang digunakan

untuk menghasilkan komuditas perdagangan

(pertanian) dalam skala besar dipasarkan

ketempat yang jauh, bukan untuk konsumsi

lokal. Perkebunan dapat ditanami oleh tanaman

industri seperti kakao, kapas, karet, kelapa,

kelapa sawit, kina, kopi, sisasl, tarum, tebu, teh,

tembakau.

2.4 Knowledge Management

Knowledge Management adalah usaha untuk

meningkatkan pengetahuan yang berguna dalam

organisasi. Diantaranya membiasakan budaya

berkomunikasi antar personil, memberikan

kesempatan untuk belajar dan menggalakan

saling berbagi knowledge. Dimana usaha ini akan

menciptakan dan mempertahankan peningkatan

nilai dari inti kompetensi bisnis dengan

memanfaatkan teknologi informasi yang ada.

Nonaka dan Takeuchi (1995) mengemukakan

bahwa alasan fundamental mengapa perusahaan

jepang sukses, karena keterampilan dan

pengalaman mereka terdapat pada penciptaan

knowledge organisasi. Penciptaan knowledge

dicapai melalui pengenalan hubungan sinergik

antara tacit knowledge dan explicit knowledge.

Ikujiro Nonaka dan Hirotaka Takeuchi pada

tahun 1991 dan 1995, membedakan antara tacit

knowledge dan explicit knowledge dan membagi

model konversi knowledge menjadi 4 cara

sebagai berikut:

a. Tacit knowledge ke Tacit knowledge:

disebut proses Sosialization. Proses transfer

informasi diantara orang-orang dengan cara

percakapan.

b. Tacit knowledge ke Explicit knowledge:

disebut proses Externalization. Proses

eksternalisasi ini yaitu, proses merubah

pengetahuan tacit ke pengetahuan explicit

untuk menjadi konsep yang jelas.

c. Explicit knowledge ke Explicit

knowledge: disebut proses Combination.

Proses kombinasi ini yaitu,

mengkombinasikan berbagai pengetahuan

explicit yang berbeda untuk disusun

kedalam sistem knowledge management.

Media untuk proses ini dapat melalui

intranet (forum diskusi), database

organisasi dan internet untuk memperoleh

sumber eksternal.

d. Explicit knowledge ke Tacit knowledge:

disebut proses Interlization. Internalisasi

berarti memahami pengetahuan explicit.

Semua dokumen data, informasi, dan

pengetahuan yang sudah didokumentasikan

dapat dibaca oleh orang lain.

Knowledge Management System adalah

sistem yang diciptakan untuk memfasilitasi

penangkapan, penyimpanan, pencarian,

pemindahan dan penggunaan kembali

pengetahuan.

2.5 Text Mining

Text mining merupakan proses ekstraksi

pola berupa informasi dan pengetahuan yang

berguna dari sejumlah besar sumber data teks,

seperti dokumen Word, PDF, kutipan teks, dan lain-lain (Kurniawan & Sitompul, 2012). Dalam

proses text mining terdapat tahap pre-processing.

Tahapan pre-processing dilakukan untuk

membersihkan sumber data, dalam hal ini

dokumen pengelolaan, dari hai-hal yang bisa

mengacaukan hasil dari pengolahan pengetahuan

selanjutnya. Dengan dilakukannya pre-

processing, proses text mining akan memberikan

hasil yang lebih memuaskan. Terdapat beberapa

tahapan yang digunakan dalam pre-processing

ini, diantaranya adalah sebagai berikut:

a. Case folding adalah tahapan untuk mengubah

semua huruf dalam dokumen menjadi huruf

kecil. Hanya huruf “a” sampai “z” saja yang

dapat diterima.

b. Tokenizing adalah tahapan dimana adanya

pemotongan string masukan berdasarkan kata

yang menyusunnya. Semua kata pada bagia

sebelum tokenizing dipotong-potong sesuai

panjang huruf dalam setiap kata yang

ditandai dengan spasi.

c. Filtering adalah tahapan mengambil kata-

kata yang penting dari hasil token

627

Page 5: PENERAPAN KNOWLEDGE MANAGEMENT SYSTEM DI  · PDF filetingkat kemiripan proposal dengan skripsi ... dan pembuatan makanan atau minuman. ... usaha pertanian yang luas,

Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) ISSN: 2089-9815

Yogyakarta, 18-19 Maret 2016

sebelumnya. Didalam tahapan ini dapat

digunakan algoritma pembuangan kata yang

kurang penting (stoplist) atau menyimpan

kata yang penting (wordlist).

2.6 CF-IDF (Concept Frequency – Invers

Document Frequency)

Pembobotan atau weighting merupakan

pemberian bobot terhadap kata/frase yang telah

dihasilkan. Pembobotan digunakan untuk

menentukan nilai kecocokan antara dokumen

pengetahuan dan keyword. Model pembobotan

tersebut dapat dengan pembobotan global, lokal

atau pun kombinasi dari keduanya. Salah satu

pembobotan kombinasi tersebut adalah CF-IDF

(Concept Frequency-Inverse Document

Frequency). Metode ini merupakan

pengembangan dari metode TF-IDF (Term

Frequency-Inverse Document Frequency) yang

lebih dahulu populer. Pada metode ini, tidak

melakukan perhitungan terhadap term (seperti

pada TF-IDF) namun dengan menghitung key

concept yang ditemukan dalam teks (Goossen

dkk, 2011).

Pada CF-IDF, dilakukan pendekatan

representasi isi dokumen dengan menggunakan

jaringan semantik yang disebut dokumen inti

semantik. Dokumen tersebut kemudian dipetakan

dalam jaringan semantik yang disebut WordNet

dan dikonversikan dari sekumpulan terms

menjadi sekumpulan konsep (concept).

Pendekatan ini membuat konsep CF-IDF terlihat

lebih cerdas dibandingkan TF-IDF. Concept

yang dimaksud dalam metode ini adalah kata

atau pun istilah majemuk yang kombinasi

katanya dapat memiliki banyak arti dan

menimbulkan ambiguitas dalam pembacaannya.

Dalam mendeteksi concept dari dokumen

dapat dilakukan dengan dua cara yaitu dengan

memproyeksikan ontology kedalam dokumen

dengan mengekstrak semua frase (istilah

majemuk) dari ontology kemudian

mengidentifikasikan kemunculanya dalam

dokumen. Cara yang kedua dalah dengan

memproyeksikan dokumen kedalam ontology,

untuk setiap calon frase yang terbentuk (yang

dideteksi dari kedekatan kata atau adjacent).

Dalam menghitung bobot cf-idf diperlukan

persamaan sebagai berikut:

a. Untuk perhitungan bobo cf digunakak

rumus sebagai berikut.

(2.1)

Keterangan :

= rasio frekuensi concept pada

dokumen.

= jumlah kemunculan concept dalam

dokumen.

= total kemunculan seluruh concept

dalam dokumen.

b. Untuk menghitung bobot idf digunakan

rumus sebagai berikut :

(2.2)

Keterangan :

= rasio frekuensi dokumen.

= jumlah total dokumen.

= jumlah dokumen yang

terdapat kemunculan concept.

c. Nilai idf itu akan digunakan untuk

perhitungan selanjutnya, yaitu

perhitungan nilai bobot CF-IDF dengan

rumus perhitungan sebagai berikut:

(2.3)

Keterangan :

= bobot CF-IDF.

= rasio frekuensi concept pada

dokumen.

= rasio frekuensi dokumen

2.7 Vector Space Model (VSM)

Model ruang vektor adalah suatu model yang

digunakan untuk mengukur kemiripan antara

suatu dokumen dengan suatu query. Pada model

ini, query dan dokumen dianggap sebagai vektor-

vektor pada ruang n-dimensi, dimana n adalah

jumlah dari seluruh term yang ada dalam

leksikon. Leksikon adalah daftar semua term

yang ada dalam indeks. Salah satu cara untuk

mengatasi hal tersebut dalam model ruang vector

adalah dengan cara melakukan perluasan vector.

Proses perluasan dapat dilakukan pada vektor

query, vektor dokumen, atau pada kedua vektor

tersebut. Pada algoritma vector space model

digunakan rumus untuk mencari nilai cosinus

sudut antara dua vector dari setiap bobot

dokumen (WD) dan bobot dari kata kunci (WK).

Cara kerja dari vector space model adalah

dengan menghitung nilai cosinus sudut dari

kedua vector yaitu vector kata kunci terhadap

vector tiap dokumen (Amin, 2012). Perhitungan

yang digunakan adalah sebagai berikut:

(2.4)

Keterangan

Q = query (kata kunci)

Di = dokumen ke-i

628

Page 6: PENERAPAN KNOWLEDGE MANAGEMENT SYSTEM DI  · PDF filetingkat kemiripan proposal dengan skripsi ... dan pembuatan makanan atau minuman. ... usaha pertanian yang luas,

Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) ISSN: 2089-9815

Yogyakarta, 18-19 Maret 2016

(2.4)

Keterangan

Di = dokumen ke-i

Q = query (kata kunci)

J = kata diseluruh dokumen

3. IMPLEMENTASI

3.1 Proses Data Masukan

Data yang digunakan sebagai data masukan

yaitu: data jenis tanaman dan pengolahan nya.

data awal berasal dari analisa dokumen yang

menggunakan sample 3 dokumen dan 1 jenis

dokumen uji. Dapat dilihat dari tabel dibawah

ini.

Dok Deskripsi

D1 Syarat tumbuh kacang tanah

berdasarkan iklim

D2 Teknologi Budidaya pengendalian

hama dan penyakit pada kacang tanah

D3 Teknologi Budidaya Tanaman kacang

tanah berdasarkan cara tanam

DU Cara mengendalikan hama dan

penyakit pada kacang tanah

Tabel 3.1

3.2 Proses

Dalam tahap ini, terdapat beberapa langkah

yang dilakukan, yaitu sebagai berikut.

1. Tahap Pre-processing

Pada tahap ini dokumen melalui tahap

text mining yaitu proses case folding,

tokenizing,dan filtering.

a. Case folding adalah tahap dimana untuk

merubah semua huruf dalam dokumen

menjadi huruf kecil.

b. Tokenizing adalah tahap pemotongan

kalimat inputan menjadi kata perkata pada

setiap kata yang menyusunnya.

c. Filtering adalah tahap mengambil kata –

kata penting dari hasil token

menggunakan algoritma stoplist

(membuang kata yang kurang penting).

2. Tahap Processing

Setelah melalui proses pada pre-

processing yang memfilter dokumen berupa

text itu selanjutnya adalah tahap processing,

pada tahap ini menghitung CF, menghitung

DF dan meghitung hasil bobot dari suatu

dokumen, dimana untuk pemberian bobot

terhadap dokumen. Sedangkan proses vector

space model mencari sudut antara dua vector

dengan menghitung dua sudut antara bobot

suatu dokumen uji dan dokumen banding /

bobot kata kunci menggunakan VSM dengan

pendekatan cosine similarty. Pada tahap

dokumen banding telah dihitung dan

mendapatkan hasil bobot suatu dokumen,

hasil pembobotan nya masuk kedalam

database pengetahuan. Sedangkan setelah

perhitungan antara CF-IDF kemudian

dilakukan perihitungan concept pada

dokumen uji dengan concept pada dokumen

banding menggunakan VSM, mendapat bobot

dari hasil perhitungan tersebut, dimana bobot

yang paling tinggi nilai nya, itu yang paling

mendekati kata kunci yang dicari dengan

dokumen.

kata Concept

Syarat

tumbuh

kacang

tanah

dasar

iklim

Syarat

tumbuh

kacang

tanah

dasar

iklim

Tabel 3.2 pada dokumen 1

kata Concept

teknologi

pengendalian

hama

penyakit

kacang

tanah

teknologi

kendali

hama

penyakit

kacang

tanah

Tabel 3.3 pada dokumen 2

kata Concept

teknologi

budidaya

kacang

tanah

dasar

cara

tanam

teknologi

budidaya

kacang

tanah

dasar

cara

tanam

Tabel 3.4 pada dokumen 3

kata Concept

Syarat

tumbuh

kacang

tanah

dasar

iklim

Syarat

tumbuh

kacang

tanah

dasar

iklim

Tabel 3.5 pada dokumen uji

629

Page 7: PENERAPAN KNOWLEDGE MANAGEMENT SYSTEM DI  · PDF filetingkat kemiripan proposal dengan skripsi ... dan pembuatan makanan atau minuman. ... usaha pertanian yang luas,

Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) ISSN: 2089-9815

Yogyakarta, 18-19 Maret 2016

Selanjutnya setelah mencari concept pada

tiap dokumen selanjutnya melakukan frequency

concept, dapat dilihat dengan hasil pada tabel

dibawah ini.

Concept F

D1 D2 D3

Syarat 1 0 0

tumbuh 1 0 0

Kacang 1 1 1

Tanah 1 1 1

Dasar 1 0 1

Iklim 1 0 0

teknologi 0 1 1

budidaya 0 1 1

kendali 0 1 0

hama 0 1 0

penyakit 0 1 0

dasar 1 0 1

Cara 0 0 1

tanam 0 0 1

Tabel 3.6 frequency concept (cf)

Setelah melakukan rasio kemunculan kata

pada tiap dokumen, selanjutnya melakukan

penjumlahan dokumen yang mengandung

kemunculan kata / conceept yang sama (df).

Dapat dilihat dengan hasil tabel dibawah ini.

Concept df

syarat 1

tumbuh 1

kacang 3

tanah 3

dasar 2

Iklim 1

teknologi 2

budidaya 2

kendali 1

hama 1

penyakit 1

dasar 1

Cara 1

tanam 1

Tabel 3.7 frequency jumlah dokumen (df)

Setelah tahap mencari jumlah dokumen

yang mengandung kemuncula kata / concept

yang sama maka selanjut nya proses cf-idf, dapat

dilihat dari persamaan dibawah ini.

perhitungan nilai CF, IDF, dan CF – IDF

pada kata / concept “pengolahan” dapat dilihat

sebagai berikut:

1. Hitung nilai CF dari kata / concept

a. dan

b. dan

c. dan

Sehingga nilai CF dari kata / concept

“pengolahan” berdasarkan persamaan 2.1 adalah

sebagai berikut:

a. CF D1 = = 0,14

b. CF D2 = = 0

c. CF D3 = = 0

2. Hitung nilai IDF dari kata / concept

“pengolahan” diketahui :

a. = 4 b. = 1

Maka Nilai IDF dari kata / concept

“pengolahan” berdasarkan persamaan 2.2 .

IDF = = 0,477

Setelah mendapat nilai yang dihasilkan bobot cf-

idf, tahap selanjutnya mencari kemiripan untuk

dokumen yang dibandingkan menggunakan

vector space model. Vector space model juga

digunakan rumus mencari nilai cosinus, sudut

antara dua vector dari setiap bobot dokumen

(wd) dan bobot dari kata kunci (wk). Untuk

mencari nilai cosinus sudut dua vector wd dan

wk, terlebih dahulu melakukan normalisasi dari

pembobotan cf-idf.

a. W2 dkk = 02 = 0

b. W2 d1 = 0,072 = 0,0049

c. W2 d2 = 02 = 0

d. W2 d3 = 02 = 0

perhitungan normalisasi pada kata /

conceept “pengolahan” dapat dilihat sebagai

berikut :

Kk*D1 = 0 x 0,07 = 0

Kk*D2 = 0 x 0 = 0

630

Page 8: PENERAPAN KNOWLEDGE MANAGEMENT SYSTEM DI  · PDF filetingkat kemiripan proposal dengan skripsi ... dan pembuatan makanan atau minuman. ... usaha pertanian yang luas,

Seminar Nasional Teknologi Informasi dan Komunikasi 2016 (SENTIKA 2016) ISSN: 2089-9815

Yogyakarta, 18-19 Maret 2016

Kk*D3 = 0 x 0 = 0

Kk*D4 = 0 x 0 = 0

Selanjutnya adalah menghitung nilai

cosinus sudut antara vector kata kunci pada

dokumen uji (Kk) dengan tiap dokumen, dapat

dilihat pada persamaan dibawah ini.

Similaritas (D1) = =

= 0

Similaritas (D2) = =

= 0,0424

Similaritas (D3) = =

= 0

Berdasarkan hasil perhitungan vector space

model diatas dapat diketahui dokumen uji (kk)

memiliki kemiripan terbesar terhadap D2.

3. Output (keluaran) Terdapat keluaran pada sistem yang akan

dibuat ini adalah hasil pencarian informasi

tanaman, berasarkan kata kunci yang dicari dari

proses perhitungan CF-IDF dan VSM.

Hasil dari penelitian dapat dilihat pada

gambar 3.3 dibawah ini.

Gambar 2 Output

4. KESIMPULAN

Setelah melakukan analisa, perancangan

implementasi beserta pengujian yang telah

dilakukan, maka dapat diperoleh kesimpulan

terhadap knowledege management system dinas

pertanian adalah sistem yang dapat mengelola

pengetahuan dinas, berbagi pengetahuan dan

membantu pelaku pertanian dalam mencari

informasi tanaman berdasarkan kata kunci yang

dicari. Sistem yang dibangun menggunakan

concept document – inverse document frequency

dan vector space model. Selain itu sistem ini juga

dapat menghasilkan tingkat keakuratan dalam

pencarian solusi. Hal ini sekaligus dapat

memberikan rekomendasi kepada pelaku

pertanian yang mencari informasi tanaman.

Sistem diuji terhadap fungsi-fungsi dari

perancangan sebelumnya, hasil dari 26 dokumen

yang menghasilkan akurasi 50 – 70 % dan

menghasilkan informasi terkait dengan rata-rata

waktu proses yaitu 10 – 15 detik. Dimana tingkat

akurasi di dapat dari proses VSM yang memang

menghitung bobot dokumen dan kata kunci yang

dicari, sedangkan untuk waktu proses di dapat

dari kecepatan prosesor untuk meng-eksekusi

data dari perpaduan reload browser sama proses

algoritma VSM dan text mining.

PUSTAKA

Amin, F. Semarang, (2012). Sistem Temu

Kembali Informasi Dengan Metode Vector

Space Model, Jurnal Sistem Informasi

Bisnis, vol 2.

Candra, S. (2014). Pengukran tingkat kemiripan

dengan skripsi terdahulu menggunakan

VSM. Skripsi Informatika. Universitas

Jendral Achmad Yani.

Goossen, F. Ijntema, W. Frasincar, F.

Hogenboom, F. Kaymak, U. 2011. News

Personalization Using The CF-IDF Semantic

Recommender. Erasmus University

Rotterdam.

Kurniawan, B. Efendi, S. Sitompul, O. (2012).

Klasifikasi Konten Berita Dengan Metode

Text mining. Jurnal Teknologi Informasi, vol

1.

Nonaka, Ikujiro and Takeuchi, Hirotaka. (1995).

The knowledge-creating company: How

JapaneseCompanies Create the

Dinammmic of Innovation. Oxford

University Press.

Nursamsudin, A. (2006). Penerapan Konwledge

Management System (KMS) Untuk

Pengelolaan Hasil Proyek Konsultasi

Menggunakan Algoritma Text Mining.

Skripsi Informatika. Universitas Jenderal

Achmad Yani.

631