bab 2 landasan teori - bina nusantara | library...

66
7 BAB 2 LANDASAN TEORI 2.1 Data Data adalah sebuah representasi penyimpanan dari obyek-obyek dan kejadian-kejadian yang berarti dan penting di lingkungan pemakai. (Hoffer, Prescott, dan McFadden, 2005, hal5). Data merupakan sesuatu yang belum mempunyai arti bagi penerimanya dan masih memerlukan adanya suatu pengolahan. Data bisa berwujud suatu keadaan, gambar, suara, huruf, angka, matematika, bahasa ataupun simbol-simbol lainnya yang bisa kita gunakan sebagai bahan untuk melihat lingkungan, obyek, kejadian ataupun suatu konsep. (http://kuliah.dinus.ac.id). Data adalah bentuk jamak dari datum, berasal dari bahasa Latin yang berarti "sesuatu yang diberikan". Dalam penggunaan sehari-hari data berarti suatu pernyataan yang diterima secara apa adanya. Pernyataan ini adalah hasil pengukuran atau pengamatan suatu variabel yang bentuknya dapat berupa angka, kata-kata, atau citra. (http://id.wikipedia.org) Menurut Hoffer, Prescott, dan McFadden (Hoffer, Prescott, dan McFadden, 2005, hal5), informasi adalah data yang telah diproses melalui beberapa cara untuk meningkatkan pengetahuan dari orang yang menggunakan data. Informasi merupakan hasil pengolahan dari sebuah model, formasi, organisasi, ataupun suatu perubahan bentuk dari data yang memiliki nilai tertentu, dan bisa digunakan untuk menambah pengetahuan bagi yang menerimanya. Dalam hal ini, data bisa dianggap sebagai obyek dan informasi adalah suatu subyek yang bermanfaat bagi penerimanya. Informasi juga bisa disebut sebagai hasil pengolahan ataupun pemrosesan data. (http://kuliah.dinus.ac.id)

Upload: phunghanh

Post on 25-Mar-2019

213 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

7

BAB 2

LANDASAN TEORI

2.1 Data

Data adalah sebuah representasi penyimpanan dari obyek-obyek dan kejadian-kejadian yang

berarti dan penting di lingkungan pemakai. (Hoffer, Prescott, dan McFadden, 2005, hal5).

Data merupakan sesuatu yang belum mempunyai arti bagi penerimanya dan masih

memerlukan adanya suatu pengolahan. Data bisa berwujud suatu keadaan, gambar, suara, huruf,

angka, matematika, bahasa ataupun simbol-simbol lainnya yang bisa kita gunakan sebagai bahan

untuk melihat lingkungan, obyek, kejadian ataupun suatu konsep. (http://kuliah.dinus.ac.id).

Data adalah bentuk jamak dari datum, berasal dari bahasa Latin yang berarti "sesuatu yang

diberikan". Dalam penggunaan sehari-hari data berarti suatu pernyataan yang diterima secara apa

adanya. Pernyataan ini adalah hasil pengukuran atau pengamatan suatu variabel yang bentuknya

dapat berupa angka, kata-kata, atau citra. (http://id.wikipedia.org)

Menurut Hoffer, Prescott, dan McFadden (Hoffer, Prescott, dan McFadden, 2005, hal5),

informasi adalah data yang telah diproses melalui beberapa cara untuk meningkatkan pengetahuan

dari orang yang menggunakan data.

Informasi merupakan hasil pengolahan dari sebuah model, formasi, organisasi, ataupun

suatu perubahan bentuk dari data yang memiliki nilai tertentu, dan bisa digunakan untuk

menambah pengetahuan bagi yang menerimanya. Dalam hal ini, data bisa dianggap sebagai obyek

dan informasi adalah suatu subyek yang bermanfaat bagi penerimanya. Informasi juga bisa

disebut sebagai hasil pengolahan ataupun pemrosesan data. (http://kuliah.dinus.ac.id)

Page 2: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

8

2.2 Database dan DBMS (Database Management System )

2.2.1 Definisi Database

Menurut Conolly dan Begg (Conolly dan Begg 2005, hal15), database merupakan suatu

kumpulan data logikal yang terhubung satu sama lain dan mendeskripsikan suatu data yang

dirancang sebagai informasi yang dibutuhkan oleh organisasi, sedangkan menurut McLeod dan

Schell (McLeod dan Schell 2004, hal196), database adalah kumpulan seluruh sumber data

berbasis komputer milik organisasi.

Database yang dikendalikan oleh sebuah sistem manajemen adalah satu set catatan data

yang berhubungan dan saling menjelaskan. Database adalah kumpulan informasi yang disimpan

di dalam komputer secara sistematis sehingga dapat diperiksa menggunakan suatu program

komputer untuk memperoleh informasi dari database tersebut. Perangkat lunak yang digunakan

untuk mengelola dan memanggil query basis data disebut sistem manajemen basis data (Database

Management System/DBMS). Database system dipelajari dalam ilmu informasi. (http

://id.wikipedia.org)

Dari teori-teori di atas dapat disimpulkan bahwa sistem database adalah sekelompok

elemen yang berupa data, saling terintegrasi dan berhubungan untuk mencapai tujuan tertentu.

2.2.2 Definisi DBMS ( Database Management System )

Conolly dan Begg (Conolly dan Begg 2005, hal16) mengemukakan bahwa DBMS adalah suatu

system software yang memungkinkan user dapat mengidentifikasikan, membuat, memelihara, dan

mengatur akses dari database.

McLeod dan Schell (McLeod dan Schell 2004, hal196) menyimpulkan, DBMS adalah

aplikasi perangkat lunak yang menyimpan struktur database, hubungan antar-data dalam

Page 3: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

9

database , serta berbagai formulir dan laporan yang berkaitan dengan database tersebut.

Sedangkan menurut Hoffer, Prescott, dan McFadden (Hoffer, Prescott, dan McFadden

2005, hal7), DBMS merupakan sebuah system software yang digunakan untuk menciptakan,

memelihara dan menyediakan akses kontrol untuk pengguna database.

2.2.3 Kelebihan DBMS (Database Management System)

Conolly dan Begg (Conolly dan Begg 2005, hal26-29) menguraikan beberapa kelebihan

penggunaan DBMS, yaitu:

1. Kontrol terhadap pengulangan data

2. Data yang dihasilkan konsisten

3. Pada beberapa data yang sama akan semakin banyak informasi yang diperoleh

4. Data dapat dipakai secara bersama-sama

5. Meningkatkan integritas data

6. Meningkatkan keamanan

7. Penetapan standarisasi

8. Perbandingan skala ekonomi

9. Mengatasi konflik kebutuhan

10. Memperbaiki pengaksesan data secara bersama-sama

11. Meningkatkan produktivitas

12. Memperbaiki pemeliharaan data melalui data yang tidak tergantung dari data lain

13. Memiliki backup data dan recovery

Page 4: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

10

2.2.4 Kekurangan DBMS (Database Management System)

Sedangkan kekurangan penggunaan DBMS menurut Conolly dan Begg (Conolly dan Begg 2005,

hal29-30) adalah:

1. Memiliki sistem yang kompleks

2. Karena sistem yang kompleks mengakibatkan DBMS memiliki ukuran yang semakin

besar

3. DBMS memiliki harga yang bervariasi tergantung fungsi dan kebutuhan

4. Penambahan biaya untuk perangkat keras yang dibutuhkan

5. Penambahan biaya konversi

6. Karena DBMS dirancang untuk mengakses lebih dari satu aplikasi sehingga

performasinya menurun

7. Kegagalan DBMS mengakibatkan operasi tidak dapat berjalan

2.2.5 Fasilitas yang disediakan DBMS (Database Management System)

Menurut Connolly dan Begg (Connolly dan Begg 2005, hal40) DBMS menyediakan fasilitas-

fasilitas sebagai berikut:

1. DDL (Data Definition Language) adalah suatu bahasa yang memperbolehkan DBA

(Database Administrator) atau user untuk mendeskripsikan nama dari suatu entitas,

atribut, dan relasi data yang diminta oleh aplikasi, bersamaan dengan integritas data dan

batasan keamanan datanya.

2. DML (Data Manipulation Language) adalah jenis bahasa yang memberikan user

kemampuan untuk mengoperasikan dan memanipulasi data yang ada. Misalnya: insert,

edit, delete dan update.

Page 5: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

11

3. DCL (Data Control Language) adalah jenis bahasa yang memberikan Administrator user

kemampuan untuk member atau mencabut hak akses user lainnya. Bahasa ini meliputi

sintaks Grant dan Revoke.

2.3 Data Warehouse

2.3.1 Definisi Data Warehouse

Data Warehouse merupakan istilah yang sangat akrab didengar dalam lingkungan yang

berhubungan dengan basis data. Hal ini bisa terjadi karena Data Warehouse itu sendiri merupakan

suatu bentuk dari basis data yang memiliki perbedaan volume dan karakteristik yang lebih

spesifik. Data Warehouse adalah kumpulan atau koleksi penyimpanan data yang menampung

koleksi data perusahaan yang sudah lama dan tidak diperbaharui, dan data tersebut disimpan

dalam jangka waktu yang lama (Connoly dan Begg, 2002,hal1047).

Data Warehouse digunakan sebagai dasar dari sistem penunjang keputusan yang

diciptakan untuk menyelesaikan masalah yang muncul pada sebuah organisasi dengan

menggunakan basis data yang dihasilkan melalui OLTP. Menurut W. H. Inmon, pengertian umum

dari Data Warehouse adalah sekumpulan data yang berorientasi subjek, terintegrasi, tidak mudah

berubah atau konsisten, dan dikumpulkan berdasarkan variasi waktu yang dapat digunakan untuk

mendukung keputusan manajemen (Connoly dan Begg, 2002,hal1047).

Sedangkan menurut IBM, Data Warehouse adalah sebuah gudang informasi yang menjadi

suatu solusi untuk mengakses data yang tersimpan dalam sistem dengan sifat non-relasi.

Pengaksesan data dalam Data Warehouse dilakukan untuk melakukan analisa kompleks,

penemuan pengetahuan dan pembuatan keputusan. Secara umum, dapat dijelaskan juga bahwa

Data Warehouse adalah “sekumpulan teknologi penunjang keputusan, yang digunakan oleh

Page 6: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

12

tenaga kerja dengan tingkat pengetahuan yang lebih tinggi, seperti eksekutif, manajer, analis,

untuk membuat keputusan yang lebih baik dan lebih cepat.”

Menurut McLeod dan Schell (McLeod dan Schell 2004, hal205), data warehouse adalah

perkembangan dari konsep database yang menyediakan suatu sumber data, data yang lebih baik

bagi para pemakai dan memungkinkan pemakai untuk memanipulasi dan menggunakan data

tersebut secara intuitif. Data warehouse berukuran sangat besar, kualitas datanya tinggi, dan

sangat mudah diambil datanya. Beberapa data warehouse berisi sebanyak 200 gigabyte atau 200

juta byte data, tetapi ukuran besar tidak menyebabkan kualitas data tidak bagus. Karena data

cleaning yang ekstensif, penghilangan data yang salah dan data yang tidak konsisten dapat

mentransformasi data menjadi data dengan kualitas yang lebih tinggi daripada yang terdapat

dalam database komersial.

2.3.2 Keuntungan Data Warehouse

Sistem OLTP yang umum memiliki karakteristik jumlah pengguna yang sangat besar dan nereka

dapat melakukan manipulasi terhadap data secara serentak. Tetapi penyimpanan data OLTP

dalam jumlah besar bisa membebani suatu organisasi. Saat database berkembang semakin besar

dengan data yang kompleks, waktu respon bisa menjadi semakin lama, karena adanya perebutan

sumber-sumber daya yang tersedia.

Data Warehouse merupakan pendekatan untuk menyimpan data dimana sumber-sumber

data yang heterogen (yang biasa tersebar pada beberapa database OLTP) dimigrasikan ke dalam

penyimpan data yang homogen. Data Warehouse menyediakan keuntungan di bawah ini untuk

para pengguna dalam melakukan analisa (Jose Ramalho, 2001,hal203-206):

1. Data diorganisir dengan baik dengan tujuan query analysis, bukan untuk pemrosesan

Page 7: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

13

transaksi.

2. Perbedaan di antara struktur data pada beberapa database yang heterogen bisa diatasi.

3. Aturan untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data

apabila data dipindahkan dari database OLTP ke Data Warehouse.

4. Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu mengubah sistem produksi.

2.3.2.1 Pengertian OLTP (Online Transaction Processing)

Menurut Connolly and Begg (Connolly and Begg 2005, hal1153), sebuah organisasi menerapkan

beberapa sistem OLTP yang berbeda untuk menjalankan proses bisnis seperti kendali inventori,

invoicing, dan point-of-sale. Sistem ini menghasilkan data operasional yang mendetil, up-to-date,

dan dapat diubah-ubah. Data di dalam OLTP diorganisir berdasarkan kebutuhan transaksi yang

berhubungan dengan aplikasi bisnis serta mendukung pengambilan keputusan operasional harian.

2.3.3 Karakteristik Data Warehouse

Dari definisi oleh Connolly dan Begg (Connolly dan Begg 2005, hal1151), karakteristik dari data

warehouse yaitu:

1. Subject-oriented artinya data warehouse harus berorientasi pada subyek yaitu data

warehouse dibuat berdasarkan subjek-subjek utama di dalam bisnis (seperti pelanggan,

produk, dan penjualan) dibandingkan dengan area-area aplikasi utama (seperti bon

pembayaran pelanggan, kontrol stok, dan produk penjualan).

2. Integrated artinya data warehouse harus terintegrasi karena sumber-sumber data

warehouse berasal dari berbagai lingkungan bisnis dengan sistem aplikasi yang berbeda.

Sumber data yang terintegrasi harus dibuat konsisten untuk menampilkan tampilan data

Page 8: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

14

kepada user.

3. Time variant berarti data warehouse hanya akurat dan valid pada beberapa poin dalam

waktu atau dalam interval waktu tertentu.

4. Non-volatile yaitu data tidak di-update dalam waktu nyata (real time) tetapi data di-

refresh dari sistem operasional. Data baru selalu ditambahkan sebagai sebuah suplemen ke

dalam database, dibandingkan sebagai pergantian data. Database data warehouse akan

selalu mengambil data baru, dan secara berkala diintegrasi dengan data yang sudah ada.

2.3.4 Perancangan Basis Data Data Warehouse

Menurut Connolly (Connoly dan Begg 2002, hal1078-1082), dalam merancang basis data sebuah

Data Warehouse sangatlah kompleks. Untuk memulai proyek Data Warehouse lakukan langkah-

langkah berikut:

1. Identifikasi dan kumpulkan kebutuhan pengguna. Pengidentifikasian tersebut dilakukan

dengan wawancara para pengguna, mempelajari kebutuhan para pengguna dan

menemukan informasi apa yang diperlukan untuk mendukung kesuksesan bisnis.

2. Tentukan sumber data mana yang akan dipakai dalam Data Warehouse.

3. Rancang data tersebut untuk menghasilkan informasi yang dapat mendukung dalam

pengambilan keputusan bisnis.

Komponen basis data dalam sebuah Data Warehouse digambarkan dengan menggunakan sebuah

teknik yang disebut model dimensional.

2.3.5 Model Data Warehouse

Menurut Connoly dan Begg (Connoly dan Begg 2002, hal1182), setiap model data warehouse

Page 9: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

15

(model dimensional) terdiri dari sebuah tabel dengan primary key composite yang disebut fact

table, dan sebuah kumpulan tabel-tabel kecil yang disebut dimension table. Model dimensional

merupakan suatu teknik desain logical yang bertujuan untuk menampilkan data dalam bentuk

standar dan intuitif, yang memungkinkan akses ke performansi yang tinggi. Model dimensional

untuk desain data warehouse yaitu:

1. Star schema

Star schema merupakan struktur logical yang memiliki sebuah tabel fakta (fact table)

yang berisi data faktual yang diletakkan di tengah (pusat), dikelilingi oleh tabel-tabel

dimensi yang berisi data referensi (dimana dapat didenormalisasi).

Gambar 2. 1 : Star Schema

2. Snowflake schema

Snowflake schema merupakan variasi dari star schema dimana tabel dimensi tidak

mengandung data denormalisasi yang memungkinkan sebuah dimensi untuk

mempunyai dimensi lagi.

Page 10: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

16

Gambar 2.2 : Snowflake Schema

Suatu skema disebut snowflake jika satu atau lebih tabel dimensi tidak berhubungan langsung

dengan tabel fakta, tetapi harus berhubungan dengan tabel dimensi lain.

2.3.5.1 Denormalisasi

Denormalisasi adalah suatu prosedur yang mengelompokkan kembali normalisasi data untuk

suatu susunan yang lebih spesifik dari suatu proses dengan tujuan membuat proses ini lebih

efisien (Adelman, Sid dan Moss, 2000, hal244) :

1. Untuk mengurangi jumlah hubungan yang terjadi antar tabel-tabel yang harus mengalami

proses pada waktu dilakukan pencarian. Dengan inilah penampilan basis data dapat

ditingkatkan.

2. Untuk membuat struktur fisik dari basis data yang semakin mendekati model dimensi dari

pemakai. Membuat struktur tabel sesuai dengan yang ingin ditanyakan oleh pemakai,

memungkinkan terjadinya akses langsung, yang sekali lagi akan meningkatkan

penampilan.

Page 11: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

17

2.3.6 Data Mart

Di beberapa implementasi Data Warehouse, data mart merupakan miniatur dari Data Warehouse.

Data mart merupakan suatu subset dari Data Warehouse yang dapat mendukung keperluan

departemen atau fungsi bisnis (Connoly dan Begg, 2002, hal1067). Data mart biasanya

digunakan untuk menyediakan informasi dalam suatu segmen organisasi. Beberapa karakteristik

yang membedakan data mart dengan Data Warehouse antara lain:

1. Data mart hanya difokuskan pada keperluan pengguna yang berhubungan dengan satu

departemen atau satu fungsi bisnis.

2. Data mart biasanya tidak berisi detail operasional data, berbeda dengan Data Warehouse.

3. Data mart berisi data yang lebih sedikit dibanding dengan Data Warehouse sehingga

data mart lebih mudah dimengerti dan dijalankan.

2.4 Data Mining

2.4.1 Definisi Data Mining

Menurut Conolly dan Begg (Conolly dan Begg 2005, hal1233), data mining adalah suatu

proses ekstraksi atau penggalian data dan informasi yang besar, yang belum diketahui

sebelumnya, namun dapat dipahami dan berguna dari database yang besar serta digunakan untuk

membuat suatu keputusan bisnis yang sangat penting.

Menurut Berson dan Smith (Berson dan Smith 2001, hal333) Data mining

menggambarkan sebuah pengumpulan teknik-teknik dengan tujuan untuk menemukan pola-pola

yang tidak diketahui pada data yang telah dikumpulkan. Data mining memungkinkan pemakai

"menemukan pengetahuan" dalam database yang tidak mungkin diketahui keberadaannya oleh

pemakai.

Page 12: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

18

Beberapa pengertian data mining yang berhasil disimpulkan dari beberapa pendapat

adalah sebagai berikut:

1. Secara sederhana dapat didefinisikan bahwa data mining adalah suatu proses ekstraksi dari

informasi atau pola yang penting atau menarik dari data yang ada di database yang besar

sehingga menjadi informasi yang sangat berharga. (http://ikc.cbn.net.id)

2. Data mining merupakan proses penemuan yang efisien sebuah pola terbaik yang dapat

menghasilkan sesuatu yang bernilai dari suatu koleksi data yang sangat besar.

(http://www.thearling.com)

3. Data mining adalah suatu pola yang menguntungkan dalam melakukan search pada

sebuah database yang terdapat pada sebuah model. Proses ini dilakukan berulang-ulang

(iterasi) hingga didapat satu set pola yang memuaskan yang dapat berfungsi sesuai yang

diharapkan (http://www.db.cs.ucdavis.edu).

Berdasarkan beberapa pengertian diatas dapat ditarik kesimpulan bahwa data mining

adalah suatu algoritma di dalam menggali informasi berharga yang terpendam atau tersembunyi

pada suatu koleksi data (database) yang sangat besar sehingga ditemukan suatu pola yang

menarik yang sebelumnya tidak diketahui dan dapat digunakan untuk meramalkan kejadian yang

akan dating.

2.4.2 Fungsi Data Mining

Data mining mengidentifikasikan fakta-fakta atau kesimpulan-kesimpulan yang disarankan

berdasarkan penyaringan melalui data untuk menjelajahi pola-pola atau anomali-anomali data.

Menurut Turban, Rainer, dan Potter (Turban, Rainer, dan Potter 2005, hal265), data mining

Page 13: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

19

mempunyai lima fungsi yaitu:

1. Classification

Classification yaitu menyimpulkan definisi-definisi karakteristik dari sebuah grup.

Contoh: pelanggan-pelanggan perusahaan yang telah berpindah ke saingan perusahaan

yang lain.

2. Clustering

Clustering yaitu mengidentifikasikan kelompok-kelompok dari barang-barang atau

produk-produk yang berbagi karakteristik yang khusus (clustering berbeda dengan

classification dimana pada clustering tidak terdapat definisi-definisi karakteristik awal

yang diberikan pada waktu classification).

3. Association

Association yaitu mengidentifikasikan hubungan antara kejadian-kejadian yang terjadi

pada suatu waktu seperti isi-isi dari keranjang belanja.

4. Sequencing

Hampir sama dengan association, sequencing mengidentifikasikan hubungan-hubungan

yang berada pada suatu periode waktu tertentu seperti pelanggan-pelanggan yang

mengunjungi supermarket secara berulang-ulang.

5. Forecasting

Forecasting memperkirakan nilai pada masa yang akan datang berdasarkan pola-pola

dengan sekumpulan data yang besar seperti peramalan permintaan pasar.

2.4.3 Tujuan Data Mining

Tujuan dari data mining menurut Hoffer, Prescott, dan McFadden (Hoffer, Prescott, dan

Page 14: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

20

McFadden 2005, hal482) antara lain:

1. Explanatory

Untuk menjelaskan beberapa kondisi penelitian, seperti mengapa penjualan truk pick-up

meningkat di Colorado.

2. Confirmatory

Untuk mempertegas hipotesis, seperti halnya dua kali pendapatan keluarga lebih suka

dipakai untuk membeli peralatan keluarga dibandingkan dengan satu kali pendapatan

keluarga.

3. Exploratory

Untuk menganalisa data untuk hubungan yang baru dan tidak diharapkan, seperti halnya

pola apa yang cocok untuk kasus penggelapan kartu kredit.

2.4.4 Penerapan Data Mining

Menurut Berson dan Smith (Berson dan Smith 2001, hal123), banyak perusahaan-perusahaan

menggunakan data mining untuk:

1. Correct data

Pada saat proses menggabungkan basis data secara besar-besaran, banyak perusahaan

menemukan data yang digabungkan tersebut tidak lengkap, dan terdiri dari informasi yang

salah dan bertentangan. Dengan menggunakan teknik data mining, dapat membantu untuk

mengidentifikasi dan membetulkan kesalahan dengan cara yang konsisten.

2. Discover Knowledge

Proses mencari pengetahuan bertujuan untuk menentukan dengan jelas relationship,

pattern atau correlations yang tersembunyi dari berbagai tempat penyimpanan data di

Page 15: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

21

dalam basis data.

3. Visualize Data

Seorang analis harus bisa merasakan sebuah informasi yang besar yang disimpan di dalam

basis data. Tujuannya untuk “memanusiakan” data yang banyak dan menemukan cara

yang terbaik untuk menampilkan data.

2.4.5 Metodologi Data Mining

Sebagai salah satu bagian dari sistem informasi, data mining menyediakan perencanaan dari ide

hingga implementasi akhir. Komponen-komponen dari perencanaan data mining menurut

Seidman (Seidman 2001, hal9) adalah sebagai berikut:

1. Analisa Masalah (Analyzing the Problem)

Data asal atau data sumber harus bisa ditaksir untuk dilihat apakah data tersebut

memenuhi kriteria data mining. Kualitas kelimpahan data adalah faktor utama untuk

memutuskan apakah data tersebut cocok dan tersedia sebagai tambahan. Hasil yang

diharapkan dari dampak data mining harus dengan hati-hati dimengerti dan dipastikan

bahwa data yang diperlukan membawa informasi yang bisa diekstrak.

2. Mengekstrak dan Membersihkan data (Extracting and Cleansing The Data) Data

pertama kali diekstrak dari data aslinya, seperti dari OLTP basis data, text file, Microsoft

Access Database, dan bahkan dari spreadsheet, kemudian data tersebut diletakkan dalam

data warehouse yang mempunyai struktur yang sesuai dengan data model secara khas.

Data Transformation Services (DTS) dipakai untuk mengekstrak dan membersihkan data

dari tidak konsistennya dan tidak kompatibelnya data dengan format yang sesuai.

Page 16: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

22

3. Validitas Data (Validating The Data)

Setelah data diekstrak dan dibersihkan, data diberikan latihan untuk menelusuri model

yang telah kita ciptakan untuk memastikan bahwa semua data yang ada adalah data

sekarang dan tetap.

4. Membuat dan melatih model (Creating and Training The Model)

Ketika algoritma diterapkan pada model, struktur telah dibangun. Hal ini sangatlah

penting pada saat ini untuk melihat data yang telah dibangun untuk memastikan bahwa

data tersebut menyerupai fakta di dalam data sumber.

5. Melakukan Query terhadap model data (Querying the Model Data)

Ketika model yang cocok telah ditetapkan, data yang telah dibuat tersedia untuk

mendukung keputusan. Hal ini biasanya melibatkan penulisan front end query dengan

menggunakan program aplikasi/suatu program basis data.

6. Memelihara validitas dari mining model (Maintaining The Validity of The Data

Mining Model)

Setelah model data mining terkumpul, lewat beberapa waktu karakteristik data awal

seperti granularitas dan validitas mungkin berubah. Karena model data mining dapat

terus berubah seiring perkembangan waktu.

2.4.6 Pengertian OLAP ( Online Analytical Processing )

Menurut Connolly dan Begg (Connoly dan Begg 2005, hal1205), OLAP adalah sebuah perangkat

yang menggambarkan teknologi menggunakan gambaran multidimensi sejumlah data untuk

menyediakan akses yang lebih cepat bagi strategi informasi dengan tujuan mempercepat analisis.

Menurut McLeod dan Schell (McLeod dan Schell 2004, hal204), OLAP makin menjadi

Page 17: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

23

fitur umum dalam perangkat lunak sistem manajemen database. Para penjual memasukkan fitur

ini untuk memungkinkan analisis data yang serupa dengan tabulasi silang statistik. OLAP adalah

teknologi yang memperbolehkan para user untuk menganalisa basis data yang besar untuk

mendapatkan setiap informasi yang lebih spesifik. Basis data untuk sistem OLAP disusun

terstruktur agar lebih efisien dalam penyimpanan data statis. Karena penyimpanan OLAP adalah

multidimensi, biasanya disebut cube, yang berlawanan dengan tabel. Yang membuat OLAP unik

yaitu kemampuannya untuk menyimpan kumpulan data secara hirarki. Dimensi-dimensi ini

memberikan informasi secara kontekstual dalam bentuk bilangan atau perhitungan yang diteliti.

OLAP (On-Line Analytical Processing) adalah suatu pernyataan yang bertolak belakang

atau kontras dengan OLTP (On-Line Transaction Processing).OLAP menggambarkan sebuah

kelas teknologi yang dirancang untuk analisa dan akses data secara khusus. Apalabila pada proses

transaksi pada umumnya semata-mata adalah pada relational database, OLAP muncul dengan

sebuah cara pandang multidimensi data. Cara pandang multimensi ini didukung oleh teknologi

multidimensi database. Cara ini memberikan teknik dasar untuk kalkulasi dan analisa oleh sebuah

aplikasi bisnis. (http://www.informatika.lipi.go.id )

OLAP adalah sebuah perangkat yang bagus untuk memberikan pengertian tentang

bagaimana cara menghitung yang baik yang terhubung dengan dimensi. Karena perhitungan yang

telah dikalkulasi terlebih dahulu, maka OLAP membuat navigasi melalui data dengan segera. Ada

dua poin penting dalam data relasional dan OLAP. Pertama adalah OLAP cenderung

memindahkan bagian-bagian yang kecil dari sebuah data di level manapun. Yang kedua adalah

OLAP cenderung memerlukan definisi yang sukar dari struktur data, dibandingkan dengan apa

yang telah dikerjakan oleh basis data relasional.OLAP memungkinkan untuk digunakan sebagai

penunjang keputusan tentang tindakan apa yang akan diambil selanjutnya dan sistem OLAP juga

Page 18: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

24

banyak dipergunakan dalam bidang bisnis untuk menghasilkan suatu keputusan yang efektif. Di

dalam model data OLAP, informasi digambarkan secara konseptual seperti kubus (cube), yang

terdiri dari kategori deskriptif (dimensions) dan nilai kuantitif (measures). Dimensi

menggambarkan atribut dari setiap ukuran, biasanya berupa text dan mempunyai ciri-ciri

tersendiri. Sedangkan measure merupakan suatu data, biasanya berupa numerik, yang menjadi

tolak ukuran suatu kejadian bisnis.

Empat kategori OLAP menurut Conolly dan Begg (Conolly dan Begg 2005, hal1214-

1216) :

1. Multidimension l On-Line Analytical Processing (MOLAP)

MOLAP digunakan untuk membangun cube multidimensional dari data yang disimpan

dalam data warehouse. Metode ini sering dipilih jika data set awal terlalu besar sehingga

pemrosesan cube dari data warehouse asli memerlukan proses batch. Alasan utama

menggunakan metode ini adalah karena mekanisme penyimpanan MOLAP sangat efektif

dalam me-retrieve data secara cepat.

2. Relational On-Line Analytical Processing (ROLAP)

Mekanisme penyimpanan ROLAP menggunakan DBMS orisinil, seperti SQL Server

2000, untuk menyimpan agregasi dalam bentuk tabung yang kemudian dapat digunakan

oleh mesin OLAP. Metode penyimpanan ini memiliki beberapa kekurangan. Struktur

tabung ROLAP tidak cukup efisien bagi mesin OLAP untuk melakukan query.

Ketidakefisienan itu memicu performansi yang buruk pada sistem.

3. Hybrid On-Line Analytical Processing (HOLAP)

HOLAP didesain dengan mengkombinasikan keuntungan MOLAP dan ROLAP dengan

menyimpan agregasi level tinggi pada cube MOLAP dan menyimpan agregasi level

Page 19: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

25

rendah dan line item pada table relational database. Karena HOLAP membuat tabel jauh

dari kompleks untuk mengatur bagian relational database, data lebih mudah dioptimasi

melalui indexing.

4. Desktop On-Line Analytical Processing (DOLAP)

Peningkatan kategor i yang terkenal dari OLAP adalah DOLAP (Desktop OLAP). System

DOLAP menyimpan data OLAP di dalam filevberbasis klien dan mendukung proses multi

dimensi menggunakan sebuah sistem multi dimensi klien. Kebutuhan-kebutuhan ekstrak

data untuk DOLAP relatif kecil yang berada pada mesin klien.

2.4.7 OLAP vs Data Mining

Baik data mining maupun OLAP merupakan komponen dari Microsoft Analysis Services.

Keduanya menyediakan decision support tool, namun masing- masing didesain untuk penggunaan

yang berbeda. OLAP pada dasarnya didesain untuk menyimpan data dalam tabel yang ringkas

untuk memfasilitasi retrieve dan navigasi data tersebut oleh end user. OLAP dapat digunakan

untuk mencoba menemukan data baru, namun sejak penemuan data telah dilakukan oleh end user,

dengan bantuan tool OLAP, penemuan data menjadi berantakan dan tidak kompeten. Data mining

secara otomatis menemukan pola baru dan aturan yang dapat diterapkan untuk mendapatkan hasil

yang akan datang.

Intinya, OLAP adalah tempat penyimpanan dan mekanisme retrieval yang efisien,

sedangkan data mining adalah alat untuk menemukan knowledge. Teknologi yang ada di data

warehouse dan OLAP dimanfaatkan penuh untuk melakukan data mining .

Page 20: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

26

Dapat disimpulkan bahwa teknologi data warehouse untuk melakukan OLAP, sedangkan data

mining digunakan untuk melakukan information discovery yang informasinya lebih ditujukan

untuk seorang Data Analyst dan Business Analyst (dengan ditambah visualisasi tentunya).

Dalam prakteknya, data mining juga mengambil data dari data warehouse. Hanya saja aplikasi

dari data mining lebih khusus dan lebih spesifik dibandingkan OLAP mengingat database bukan

satu-satunya bidang ilmu yang mempengaruhi data mining. Dengan memadukan teknologi

OLAP dengan data mining diharapkan pengguna dapat melakukan hal-hal yang biasa dilakukan

di OLAP seperti drilling / rolling untuk melihat data lebih dalam atau lebih umum, pivoting,

slicing dan dicing. Semua hal tersebut dapat diharapkan nantinya dapat dilakukan secara

interaktif dan dilengkapi dengan visualisasi. (http://computing.edu.au).

2.4.8 Proses Data Mining

Fase-fase dimulai dari data mentah dan berakhir dengan pengetahuan atau informasi yang telah

diolah yang didapatkan sebagai hasil dari tahapan-tahapan berikut :

1. Data Cleansing, juga dikenal sebagai data cleansing , ini adalah sebuah fase dimana data

tidak lengkap, mengandung error dan tidak konsisten dibuang dari koleksi data, sehingga

data yang telah bersih dan relevan dapat digunakan untuk diproses ulang untuk penggalian

pengetahuan (discovery knowledge).

2. Data Integration, pada tahap ini terjadi integrasi data, dimana sumber-sumber data yang

berulang ( multiple data), file- file yang berulang ( multiple file), dapat dikombinasikan

dan digabungkan kedalam suatu sumber.

3. Data Selection, pada langkah ini, data yang relevan terhadap analisis dapat dipilih dan

diterima dari koleksi data yang ada.

Page 21: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

27

4. Data Transformation, juga dikenal sebagai data consolidation. Pada tahap ini, dimana

data yang telah terpilih, ditransformasikan kedalam bentuk-bentuk yang cocok untuk

prosedur penggalian (mining procedure) dengan cara melakukan normalisasi dan agregasi

data

5. Data mining, tahap ini adalah tahap yang paling penting, dengan menggunakan teknik-

teknik yang diaplikasikan untuk mengekstrak pola-pola potensial yang berguna.

6. Pattern Evaluation, pada tahap ini, pola-pola menarik dengan jelas merepresentasikan

pengetahuan telah diidentifikasi berdasarkan measure yang telah diberikan

7. Knowledge representation, ini merupakan tahap terakhir dimana pengetahuan yang telah

ditemukan secara visual ditampilkan kepada user. Tahap penting ini menggunakan teknik

visualisasi untuk membantu user dalam mengerti dan menginterpretasikan hasil dari data

mining.

2.5 Teknik Data Mining

Menurut Connolly dan Begg (Connoly dan Begg 2005, hal1233-1239), sebelum mengetahui

teknik-teknik yang dapat digunakan dalam data mining , terdapat empat operasi yang dapat

dihubungkan dengan data mining , yaitu:

1. Predictive modeling

Predictive modeling merupakan penjelajahan manusia dalam mengadakan observasi atau

penelitian untuk membentuk sebuah model dari karakteristik-karakteristik yang penting

dari beberapa fenomena. Predictive modeling dapat digunakan untuk menganalisa

database yang sudah ada untuk menentukan beberapa karakteristik esensial pada data

set. Ada dua teknik yang dapat dilakukan dalam predictive modeling yaitu:

Page 22: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

28

a. Classification

Classification digunakan untuk membuat dugaan awal tentang class yang

spesifik untuk setiap record dalam database dari satu set nilai class yang

mungkin.

b. Value Prediction

Value prediction digunakan untuk memperkirakan nilai numerik yang kontinu

yang terasosiasi dengan record database. Teknik ini menggunakan teknik statistik

klasik dari linear regression dan nonlinear regression .

2. Database segmentation

Tujuan database segmentation adalah untuk mempartisi database menjadi sejumlah

segmen, cluster, atau record yang sama, dimana, record tersebut berbagi sejumlah

properti dan karenanya record - record tersebut diharapkan homogen.

3. Link analysis

Tujuan link analysis adalah untuk membuat hubungan antara record yang individual atau

sekumpulan record dalam database. Aplikasi pada link analysis meliputi product

affinity analysis, direct mark eting, dan stock price movement .

4. Deviation detection

Teknik ini seringkali merupakan sumber dari penemuan yang benar karena teknik ini

mengidentifikasi outlier yang mengekspresikan deviasi dari ekspektasi yang telah

diketahui sebelumnya. Operasi ini dapat ditampilkan dengan menggunakan teknik statistik

dan visualisasi. Aplikasi deviation detection misalnya pada deteksi penipuan dalam

penggunaan kartu kredit dan klaim asuransi, quality control, dan defect tracing.

Page 23: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

29

Menurut Berson dan Smith (Berson dan Smith 2001, hal336-378) dalam data mining terdapat dua

tipe teknik antara lain :

2.5.1 Teknik Klasik ( Classical Technique )

2.5.1.1 Statistik

Menurut McClave dan Sincich (McClave dan Sincich 2003, hal2), statistik adalah ilmu

pengetahuan atau ilmiah tentang data, atau ilmu yang mempelajari tentang data. Hal ini meliputi

pengumpulan, pengklarifikasian, perangkuman, pengorganisasian, penganalisaan, dan

penterjemahan informasi tentang perhitungan atau numerik.

Menurut Kvanli, Pavur, dan Keeling (Kvanli, Pavur, dan Keeling 2003, hal2), Statistik

adalah ilmu yang terdiri dari peraturan-peraturan dan ketentuan-ketentuan dalam hal

mengumpulkan, menjelaskan, menganalisa dan menterjemahkan data numerik.

Menurut Berson dan Smith (Berson dan Smith 2001, hal291), Statistik adalah cabang ilmu

matematika yang mempelajari tentang sekumpulan dan deskripsi data yang akan digunakan dalam

membuat laporan tentang informasi yang penting agar seseorang dapat membuat keputusan yang

berguna. Salah satu keuntungan statistik adalah menampilkan database dalam tampilan ber-level

tinggi yang menyediakan informasi-informasi yang berguna tanpa perlu mengerti setiap record

secara detil.

2.5.1.2 Nearest Neighbour

Teknik prediksi pengelompokan dan nearest neighbour merupakan teknik tertua yang digunakan

dalam data mining. Nearest neighbour merupakan teknik prediksi yang hampir sama dengan

pengelompokan, untuk memperkirakan apakah nilai prediksi ada dalam satu record, mencari

Page 24: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

30

kesamaan nilai prediktor di dalam basis data historis dan menggunakan nilai prediksi dari record

yang “terdekat” untuk tidak membagi-bagikan record.

2.5.1.3 Pengelompokan (Clustering)

Pengelompokan merupakan metode yang mengklasifikasikan data ke dalam kelompok-kelompok

berdasarkan kriteria dari masing-masing data. Biasanya, teknik ini dipakai

Gambar 2.3 : Grafik Teknik Pengelompokkan

untuk memberikan pengguna akhir sebuah gambaran level atas dari apa yang telah terjadi di

dalam basis data. Pengelompokan terkadang digunakan untuk segmentasi.

Page 25: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

31

2.5.2 Teknik Generasi Selanjutnya ( The Next generation Technique )

2.5.2.1 Decision Tree (Pohon Keputusan)

Pohon keputusan merupakan model prediktif yang dapat digambarkan seperti pohon, dimana

setiap node di dalam struktur pohon tersebut mewakili sebuah pertanyaan yang digunakan untuk

menggolongkan data. Struktur ini dapat digunakan untuk membantu memperkirakan

kemungkinan nilai dari setiap atribut data.

Gambar 2.4 : Contoh Pohon Keputusan

Beberapa hal menarik tentang tree :

Tree ini membagi data pada setiap cabangnya tanpa kehilangan data sedikitpun. Jumlah total

record pada node parent sama dengan jumlah total record yang ada pada node children. Sangat

mudah dimengerti bagaimana sebuah model dibangun, kebalikan dengan model dari neural

network atau dari statistik standar. Mudah untuk menggunakan model ini jika kita mempunyai

target pelanggan yang sepertinya tertarik dengan penawaran marketing.

Page 26: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

32

Dari perspektif bisnis, decision tree dapat dilihat sebagai pembuatan segmentasi dari data

set yang orisinil. Segmentasi ini dilakukan untuk beberapa alasan tertentu, misalnya untuk

prediksi dari beberapa potong informasi yang penting. Meskipun decision tree sendiri dan

algoritma yang membuat decision tree itu mungkin saja sangat kompleks, namun hasil yang

ditampilkan dengan cara yang mudah dimengerti sangat membantu untuk pengguna bisnis.

Decision tree seringkali dikembangkan untuk statistician untuk mengotomatisasi proses

menentukan field mana dari database mereka yang benar-benar berguna atau terkorelasi dengan

masalah tertentu yang sedang mereka usahakan untuk mengerti. Karena itu, algoritma decision

tree cenderung mengotomatisasi seluruh proses pembuatan hipotesis dan kemudian melakukan

validasi yang lebih komplit dalam cara yang lebih terintegrasi dibanding dengan teknik data

mining lainnya.

Decision tree biasanya digunakan untuk berbagai kebutuhan:

1. Eksplorasi

Teknologi decision tree dapat digunakan untuk eksplorasi data set dan masalah bisnis. Hal

ini biasanya dilakukan dengan mencari predictor dan nilai yang dipilih untuk setiap

bagian / cabang dari tree tersebut.

2. Preprocessing data

Teknologi ini juga dapat digunakan untuk mengolah dan memproses data yang dapat

digunakan pada algoritma lain, misalnya neural network, nearest neighbour, dll. Hal itu

dikarenakan algoritma lain memerlukan waktu yang relatif lama untuk dijalankan jika

terdapat jumlah predictor dalam jumlah besar untuk digunakan sebagai model, sehingga

teknik decision tree biasanya digunakan pada tahap pertama data mining untuk

menciptakan subset yang berguna dari predictor baru kemudian hasil tersebut akan

Page 27: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

33

dapat dimasukkan pada teknik data mining yang lain.

3. Prediksi

Para analis menggunakan teknologi ini untuk membangun sebuah model prediktif yang

efektif.

Decision tree mempunyai beberapa keuntungan sebagai berikut (http://en.wikipedia.org):

1. Decision tree mudah dimengerti dan diinterpretasikan. Orang dapat mengerti model

decision tree setelah penjelasan yang singkat.

2. Penyiapan data untuk decision tree adalah utama dan tidak dibutuhkan. Teknik lain

seringkali membutuhkan normalisasi data, variabel kosong perlu dibuat, dan nilai yang

kosong harus dihapus.

3. Decision tree dapat mengatasi baik data nominal maupun kategorial. Teknik lain biasanya

dispesialisasi di analisis data set yang hanya mempunyai satu tipe variabel, contohnya

relation rule yang hanya dapat digunakan dengan variabel nominal atau neural network

yang hanya dapat digunakan dengan variabel numerik.

4. Decision tree merupakan model white box . Jika situasi yang diberikan kelihatan dalam

model, penjelasan untuk kondisi tersebut dapat dengan mudah dijelaskan dengan boolean

logic. Contoh black box adalah artificial neural network karena penjelasan untuk hasilnya

sangat kompleks.

5. Decision tree dapat melakukan validasi terhadap model dengan menggunakan tes statistik.

Hal itu akan memungkinkan untuk menghitung reliabilitas model.

6. Decision tree merupakan teknik yang kuat, dapat bekerja baik dengan data yang besar

dalam waktu yang singkat. Sejumlah besar data dapat dianalisis dengan menggunakan

personal computer dalam waktu yang cukup pendek yang memungkinkan pemegang

Page 28: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

34

saham mengambil keputusan berdasarkan analisis tersebut. Karena nilai decision tree

yang sangat tinggi pada banyak faktor kritis pada data mining, teknik ini dapat digunakan

pada berbagai macam masalah bisnis, baik eksplorasi maupun prediksi.

2.5.2.1.1 Implementasi sederhana dari Decision Trees

Algoritma Decision Tree biasanya dibuat berdasarkan konsep dari klasifikasi. Suatu

algoritma membuat suatu tree yang dapat memprediksi nilai yang berdasar kepada kolom-kolom.

Maka itu setiap node dari tree menampilkan suatu kasus partikular untuk suatu kolom.

Keputusan untuk menentukan di mana letak node-node tersebut ditentukan oleh algoritma.

Berikut merupakan contoh training table

Tabel 2.1 : Tabel Training

Customer ID

Debt level Income level Employment type Credit risk

1 High High Self-employed Bad 2 High High Salaried Bad 3 High Low Salaried Bad 4 Low Low Salaried Good 5 Low Low Self-employed Bad 6 Low High Self-employed Good 7 Low High Salaried Good

Page 29: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

35

Gambar 2.5 : Training Decision Tree

Kita dapat lihat bahwa faktor paling penting dari para calon peminjam uang dapat diputuskan

sebagai credit risk yang good atau bad dari debt level-nya. Untuk para calon peminjam yang

tidak memilki high debt level maka faktor selanjutnya yang dilihat ialah apakah ia self-employed

atau salaried. Seorang calon peminjam yang self-employed mempunyai kemungkinan bad credit

risk yang lebih tinggi. Ini merupakan ilustrasi singkat tentang penggunaan decision tree dalam

suatu proses bisnis.

Contoh script sederhana dalam java code untuk membuat decision tree seperti di atas :

class CustomerInfo{

public int customerID;

public boolean hasHighDebt;

public boolean hasHighIncome;

public boolean isSalaried;

}

boolean isGoodRisk(CustomerInfo customer){

if(!customer.hasHighDebt){

Page 30: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

36

if(customer.hasHighIncome || customer.isSalaried){

return true;

}

}

return false; }

Jalan yang ditunjukkan pada decision tree merupakan aturan yang relatif mudah untuk

dimengerti oleh manusia. Berikut merupakan beberapa sistem komersial yang mengimplementasi

metode decision tree :

• PolyAnalyst (Megaputer Intelligence)

• C5.0 (Rule Quest)

• Clementine (Integral Solutions)

• SIPINA (University of Lyon)

• IDIS (Information Discovery)

2.5.2.2 Neural Network (Jaringan Neural)

Jaringan Neural merupakan teknik model prediktif yang paling kuat. Teknik ini dapat membuat

model yang sangat kompleks yang hampir tidak mungkin untuk mengerti secara benar, meskipun

seorang ahli. Model ini disajikan dalam nilai numerik dengan perhitungan yang kompleks dan

hasil akhir dari teknik ini juga berupa numerik dan perlu untuk diterjemahkan jika nilai prediksi

aktual berupa kategori.

2.5.2.3 Rule Induction (Aturan Induksi)

Aturan induksi merupakan bentuk umum dari data mining dan merupakan bentuk yang sama

Page 31: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

37

untuk penemuan pengetahuan di dalam sistem pembelajaran unsupervised. Teknik ini dalam basis

data dapat menjadi sebuah usaha besar-besaran dimana semua kemungkinan pola-pola secara

sistematis keluar dari data, dan kemudian akurasi dan arti ditambahkan kedalam aturan tersebut

untuk memberitahukan pengguna betapa kuat pola dan bagaimana dapat terjadi lagi.

2.6 Customer Relationship Management (CRM)

2.6.1 Definisi CRM

Menurut Kolakota dan Robinson dalam buku E-Business Roadmap for Success (Kolakota dan

Robinson 1999, hal117), CRM adalah kombinasi dari proses bisnis dan teknologi untuk

memperoleh informasi agar dapat memahami pelanggan-pelanggan perusahaan dari berbagai

sudut pandang: siapa mereka, apa yang mereka lakukan, dan apa yang mereka suka. CRM

didefinisikan sebagai suatu integrasi antara strategi penjualan, pemasaran, dan pelayanan yang

tidak melihat keputusan masing-masing departemen dalam perusahaan dan bergantung pada

tindakan-tindakan terkoordinasi perusahaan.

2.6.2 Mengapa CRM?

Kunci utama dalam mempertahankan stabilitas ruang lingkup pemasaran, khususnya yang

bergerak dalam bidang e-commerce, saat ini adalah dengan menciptakan suatu hubungan jangka

panjang dengan para pelanggan.

Pelanggan ( customer ) dapat dibedakan ke dalam tiga zona:

1. Zone of defection , di mana para pelanggan merasa tidak puas akan pelayanan yang

ditawarkan dan memiliki kemungkinan besar untuk berpindah ke perusahaan lain.

2. Zone of indifference, di mana para pelanggan bersikap tidak begitu pasti dan memiliki

Page 32: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

38

tingkat kepuasan dan loyalitas terhadap perusahaan yang medium.

3. Zone of affection, di mana para pelanggan merasa puas akan pelayanan yang ditawarkan

dan menempatkan loyalitas yang tinggi pada perusahaan.

Pelanggan menuntut adanya kustomisasi pelayanan yang semakin beragam seiring

berjalannya waktu. Hal ini menyebabkan perusahaan-perusahaan memindahkan fokus mereka dari

“mass production” ke “mass customization”. Hal yang perlu diperhatikan oleh perusahaan-

perusahaan e-commerce saat ini adalah tentang penerapan strategi multi-channels dengan tujuan

untuk meningkatkan kepuasan dan loyalitas para pelanggan.

Berdasarkan hasil studi IT Consulting Firm Aberdeen, perusahaan-perusahaan yang

mengimplentasikan CRM dan mengubah bisnis mereka menjadi e-business memiliki

kemungkinan yang lebih besar dalam menarik perhatian para pelanggan. Pengorganisasian bisnis

untuk memuaskan para pelanggan seperti pada pengimplemtasian CRM menuntut adanya

pengorganisasian atau penyederhanaan fungsi-fungsi internal dalam suatu perusahaan. Dengan

CRM, suatu perusahaan dapat mengurangi alur kerja, cycle time, dan alur informasi tentang

pelanggan yang tidak penting dapat dieliminasi.

2.6.3 Tujuan dan Manfaat CRM

Tujuan CRM adalah untuk mengoptimalkan keuntungan perusahaan dengan membuat perusahaan

lebih efisien dalam menggunakan sumber daya yang ada untuk melayani pelanggan yang

diinginkan dan memelihara hubungan dengan pelanggan. (Kalakota dan Robinson, 1999, hal117).

Pendapat lain tentang tujuan diterapkannya konsep CRM adalah (Seybold, Maret 2002,

hal5):

Page 33: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

39

1. Mendapatkan pelanggan baru (Acquire)

Memulai hal baru merupakan pengalaman yang penting bagi pelanggan. Perusahaan dapat

melakukan promosi dengan memasang iklan pada beberapa media massa juga pemberian

potongan harga untuk menarik pelanggan baru.

2. Mempertahankan pelanggan untuk selamanya (Retain)

Fokus pada kemampuan untuk mengadaptasi pada pelayanan apa yang diperlukan dan

sesuai untuk pelanggan serta memberikan layanan yang bersifat one-stop-service untuk

semua hal yang berhubungan dengan pelanggan.

3. Meningkatkan nilai transaksi pelanggan (Enhance)

Tujuan pada enhance adalah pengembangan relasi ke arah peningkatan nilai transaksi

penjualan yang bersifat cross-selling (produk komplemen) maupun up-selling (produk

yang bermutu lebih baik).

Kunci keberhasilan pelaksanaan CRM tergantung pada tiga hal yang harus saling

mendukung satu dengan yang lain, yaitu:

1. People (sumber daya manusia)

Adalah keseluruhan anggota perusahaan, dari manajemen sampai staf terendah.

a. Budaya kerja.

Adanya kesamaan visi CRM, pemahaman konsep “customer-focused” dalam

pelaksanaan praktek kerja, kerja sama dan kekompakan tim, antara pihak

manajemen dan staf. Hal ini dapat diperoleh dengan diadakannya pelatihan

(training) dan penanaman konsep CRM dan “customer-focused” bagi staf dan

manajemen.

Page 34: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

40

b. Keterampilan

Keterampilan staf dan pihak manajemen dalam menjalin hubungan dengan

pelanggan, dalam memperoleh informasi yang dibutuhkan tentang pelanggan, serta

kemampuan menganalisis dan menarik kesimpulan dari keseluruhan informasi

pelanggan.

2. Process (proses bisnis yang dilakukan)

Adalah proses bisnis perusahaan yang berorientasi pada “customer-focused”, yang lebih

difokuskan pada sisi penjualan, pemasaran, dan pelayanan pelanggan.

3. Technology (teknologi informasi yang digunakan)

Adalah teknologi informasi yang digunakan sebagai piranti pembantu yang mendukung

unsur people dan process .

Kombinasi antara ketiganya disimbolkan dengan:

Technology ( People + Process )

artinya:

1. Jika ( People + Process ) < adequate (memadai), maka penggunaan teknologi

informasi akan memperbesar kesalahan pada inisiatif CRM.

2. Jika ( People + Process ) > adequate (memadai), maka penggunaan teknologi informasi

akan mempercepat kesuksesan dan memperbesar keuntungan yang dapat diraih

perusahaan.

Beberapa manfaat yang dapat diperoleh dari penggunaan CRM dijabarkan sebagai berikut:

Page 35: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

41

1. Meningkatkan pendapatan.

2. Mendorong loyalitas pelanggan.

3. Menekan biaya.

4. Meningkatkan efisiensi operasional.

5. Meningkatkan time to market.

2.6.4 Arsitektur dan Komponen CRM

Dalam arsitektur CRM (gambar 2.2), dapat dilihat sejumlah customer touch-points dan delivery

channels yang menghasilkan dan menggunakan informasi. Yang dimaksud dengan customer

touch-points (Berson dan Smith, 1999, hal46) adalah points of contact dimana perusahaan dapat

berinteraksi dan “ touch ” pelanggan dan begitu pula sebaliknya. Informasi ini perlu

diintegrasikan dan dianalisis untuk mendapatkan sebuah gambaran yang lengkap dan akurat

tentang preferensi, kebutuhan, keluhan, dan atribut lainnya dari pelanggan yang dapat

menjadikannya menjadi pelanggan jangka panjang sebagai pelanggan produk atau jasa

perusahaan.

Komponen-komponen yang menjadi bagian dari CRM tidak hanya data warehouse dan

data marts , tetapi juga meliputi data mining , reporting , OLAP engines , dan penyimpanan

metadata.

Page 36: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

42

Gambar 2.6 : Business Rules and Meta Data Management

Page 37: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

43

2.6.5 Jenis-Jenis CRM

Secara garis besar, CRM dapat diklasifikasikan dalam 3 jenis, yaitu (Berson dan Smith, 1999,

hal45):

1. Operational CRM

Mencakup otomatisasi yang terintegrasi dari keseluruhan proses bisnis, termasuk di

dalamnya customer touch-points dan customer channels dan integrasi front office-back

office .

2. Analytical CRM

Merupakan proses analisis dari data yang dihasilkan pada Operational CRM.

3. Collaborative CRM

Aplikasi pelayanan yang terkolaborasi, seperti e-mail, personalized publishing, e-

communities , forum diskusi, dan sarana lainnya yang dirancang untuk memfasilitasi

interaksi antara pelanggan dan pihak perusahaan.

CRM yang terdiri dari ketiga komponen di atas memiliki tujuan secara umum yaitu untuk

memaksimumkan keuntungan perusahaan sejalan dengan meningkatkan dan

memelihara kepuasan pelanggan. Operational CRM mengoptimasi proses bisnis yang

berinteraksi secara langsung dengan pelanggannya (Beck dan Summer, 2001, hal1-2). CRM

memiliki berbagai macam aplikasi yang diterapkan dalam pemasaran, penjualan, dan pelayanan

yang mendukung proses bisnis. Aplikasi proses bisnis yang menerapkan hal di atas tergolong

dalam aplikasi operasional.

Page 38: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

44

Aplikasi operational CRM dibedakan menjadi dua, yaitu:

1. Customer-Facing Applications

Faktor utama dari aplikasi CRM Customer-Facing adalah contact center, Sales Force

Automation , dan field service . Disebut Customer-Facing karena pada kenyataannya,

pihak perusahaan ini langsung berhubungan dengan pelanggannya.

2. Customer-Touching Applications

Faktor utama dari aplikasi CRM Customer-Touching Applications adalah Campaign

management , e-commerce , dan Self-Service Customer Support. Disebut Customer-

Touching karena pelanggan berhubungan langsung dengan aplikasi sistem daripada

berhubungan dengan perwakilan perusahaan.

Strategi operational CRM ini memfasilitasi traditional CRM, yang berfokuskan

bagaimana membuat pelayanan, penjualan, dan/atau departemen pemasaran lebih efisien dan

meningkatkan profitabilitas perusahaan dan pelanggan. Sedangkan infrastruktur dan servis dari

Collaborative CRM membuat perusahaan dapat berinteraksi dengan channel-nya, yakni semua

pihak yang memungkinkan berhubungan dengan perusahaan.

2.6.6 Analytical CRM

Tantangan bagi perusahaan sekarang ini adalah untuk mengerti apa yang menjadi permintaan

pelanggan dan memberikan respon, secara lebih baik, mengantisipasi kebutuhan mereka. Namun,

banyak perusahaan hanya berfokus untuk mengimplementasikan penggunaan CRM hanya sebatas

untuk “mendengar” kebutuhan dan keluhan dari pelanggan, yang pada praktisnya hanya

berkonsentrasi pada komponen Operational dan Collaborative CRM, sehingga analisis akan

Page 39: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

45

pemahaman dan pengenalan terhadap pelanggan yang sebenarnya belum terjadi. Diperlukan

komponen Analytical CRM untuk mengoptimalkan hubungan perusahaan dengan pelanggannya.

Analytical CRM memungkinkan perusahaan untuk mendapatkan suatu pengetahuan akan

pelanggan dan melakukan penaksiran atau estimasi terhadap pelanggan berdasarkan data analisis

yang dipakai. Pengetahuan yang didapat perusahaan adalah tentang nilai pelanggan, yang dapat

mendukung channel pelayanan interaksi dengan lebih baik dan mendukung berbagai keputusan

dalam mensinergi penerapan Operational dan/atau Collaborative CRM dalam proses penjualan

dan pemasaran produk, sehingga kedudukannya menjadi sangat esensial bagi komponen CRM

lainnya (Beck dan Summer , 2001, hal2).

2.6.6.1 Pengertian Analytical CRM

Analytical CRM merupakan feedback loop antara interaksi pelanggan yang real-time yang

terjadi pada front-end atau back-end scorecard untuk menganalisa apa yang telah terjadi dan

bagaimana meningkatkan cara perusahaan berinteraksi di kemudian hari. (Beck dan Summer,

2001, hal5) mengatakan bahwa analytical CRM adalah penggunaan data pelanggan untuk

analisis, pemodelan, dan evaluasi yang ditujukan untuk mendukung perusahaan untuk membentuk

suatu hubungan yang profitable antara perusahaan dan pelanggannya. Analytical CRM terdiri

dari semua programming yang menganalisis data tentang pelanggan perusahaan, sehingga

keputusan yang lebih cepat dan lebih baik dapat dihasilkan

Berdasarkan sebuah artikel dalam Info World analytical CRM dapat menyediakan hal-hal

sebagai berikut:

1. Kelompok segmentasi pelanggan.

2. Analisa profitabilitas, mengetahui pelanggan mana yang profitable selama kurun waktu

Page 40: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

46

tertentu.

3. Personalisasi, kemampuan untuk memasarkan kepada pelanggan secara personal

berdasarkan data yang ada tentang pelanggan itu.

4. Event monitoring , yaitu segala aktifitas yang dilakukan pelanggan yang berkaitan dengan

perusahaan dan begitu pula sebaliknya tindakan perusahaan terhadap segala yang

berhubungan dengan pelangannya, seperti promosi, transaksi, dsb.

Analytical CRM mampu melakukan segmentasi pelanggan, membedakan pelanggan

yang memiliki profitabilitas tinggi dengan tingkat akurasi yang lebih matang, maka Return On

Investment (ROI) akan suatu pelanggan dapat diprediksi dengan baik (Meta Group, 2000, hal1).

Dengan pengetahuan tersebut maka penawaran yang tepat, harga yang tepat dapat ditawarkan

pada saat yang tepat, kepada pelanggan yang memang berpotensi untuk membelinya, hal ini akan

mengoptimasi pelanggan dan perusahaan. Dengan kombinasi informasi tentang pelanggan dari

semua sumber dan sarana informasi vital lainnya yang berinteraksi dengan pelanggan, maka

perusahaan dapat memperoleh gambaran yang pasti tentang pelanggan dan perilakunya. Dengan

demikian mendukung perusahaan dalam melakukan personalisasi terhadap pelanggan dan

menyesuaikan diri seiring dengan kemungkinan perubahan-perubahan yang terjadi dari

permintaan pelanggan.

Analytical CRM digunakan juga sebagai alat untuk mengevaluasi profitabilitas pelanggan,

berdasarkan segmentasi dari hasil analisa yang kuat, dan meningkatkan ROI dari pelanggan

perusahaan. Dengan menganalisa profitabilitas pelanggan, perusahaan dapat melakukan

segmentasi pelanggannya berdasarkan tingkat profitabilitasnya sehingga dapat menetapkan target

tingkat penjualannya terhadap masing-masing pelanggan. Langkah selanjutnya adalah

Page 41: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

47

menindaklanjuti feedback loop dari hasil analisa yang telah dilakukan untuk menentukan

interaksi selanjutnya yang akan dibangun dengan pelanggan (Meta Group, 2000, hal2).

2.6.6.2 Perbedaan Operational CRM dan Analytical CRM

Tabel berikut ini menjelaskan perbedaan antara Operational CRM dan Analytical

CRM.

Tabel 2.2 Perbedaaan Operational CRM dan Analytical CRM

Operational CRM Analytical CRM Dibuat untuk menyediakan respon yang cepat kepada banyak user

Didesain untuk proses yang kompleks dan memerlukan waktu proses yang lama dan hanya digunakan untuk beberapa user saja

User mengakses dan meng update data. Selama pemrosesan, jumlah data yang diproses banyak dan biasanya hanya dapat di retrieve ( read-only ), dengan menggunakan query yang kompleks.

User melakukan proses transaksi dalam waktu yang singkat.

2.7 Pelanggan

2.7.1 Definisi Pelanggan

Pelanggan adalah semua orang yang menurut perusahaan memenuhi suatu standard kualitas

tertentu, dan karena itu akan memberikan pengaruh kepada performa organisasi (Gaprez, 1997,

hal73).

Piramida pelanggan di atas (Gambar 2.5) menjelaskan tentang tahapan secara umum seorang

pelanggan organisasi. Unsur-unsur dari piramida pelanggan adalah sebagai berikut :

Page 42: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

48

1. Pelanggan Aktif ( Active Customer)

Adalah orang atau perusahaan yang telah melakukan pembelian barang atau jasa dari

perusahaan dalam periode tertentu, katakanlah dalam 12 bulan terakhir.

2. Pelanggan yang tidak aktif (Inactive Customer)

Adalah orang-orang atau perusahaan yang telah membeli barang atau jasa pada masa lalu,

akan tetapi tidak dalam periode tertentu. Pelanggan yang tidak aktif merupakan sumber

yang penting untuk pendapatan potensial dan juga merupakan sumber informasi tentang

apa yang perlu perusahaan lakukan untuk mencegah pelanggan aktif menjadi pelanggan

tidak aktif.

3. Prospects

Adalah orang atau perusahaan yang mempunyai suatu hubungan dengan perusahaan kita,

akan tetapi sampai sekarang mereka belum membeli barang atau jasa perusahaan. Contoh

prospects adalah orang yang telah meminta brosur perusahaan, orang-orang yang telah

melakukan kontak lewat pameran dagang. Prospects merupakan orang-orang atau

perusahaan yang diharapkan akan meningkat menjadi status pelanggan aktif dalam waktu

dekat.

4. Suspects

Adalah orang-orang atau perusahaan yang sanggup kita layani dengan produk atau jasa

dari suatu perusahaan, akan tetapi sampai sekarang belum memiliki hubungan dengan

perusahaan. Biasanya perusahaan memulai hubungan dengan suspects dan

mengkualifikasikan mereka sebagai Prospects, dengan tujuan jangka panjang untuk

mengkonversikannya menjadi pelanggan aktif.

Page 43: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

49

5. The Rest of the World

Adalah orang-orang atau perusahaan yang memang tidak mempunyai keperluan atau

keinginan untuk membeli atau menggunakan produk atau jasa perusahaan.

2.7.2 Model Segmentasi Pelanggan

Seringkali perusahaan mengalokasikan sebagian besar pemasarannya dibelanjakan untuk non-

customers. Piramida pelanggan merupakan alat yang berguna untuk memvisualisasikan,

menganalisis, dan memperbaiki perilaku dan profitabilitas pelanggan. (Curry, 2000, hal9). Nilai

dari piramida pelanggan meningkat apabila perusahaan mensegmentasikan pelanggan aktif ke

dalam kategori perilaku yang kritikal terhadap keberhasilan perusahaan, seperti pendapatan

penjualan. Namun ini akan disesuaikan dengan perusahaan masing-masing yang menentukan

tolak ukurnya.

CRM terbentuk untuk memungkinkan setiap pelanggan diperlakukan secarapersonal

selama proses pemasaran. Segmentasi adalah kunci langkah pertama. Dengan mengelompokan

pelanggan ke dalam segmen-segmen berdasarkan profitabilitas, kontribusi penghasilan bagi

perusahaan, perilaku dan faktor lainnya, maka setiap segmen akan mendapatkan perlakuan yang

berbeda-beda. Dengan demikian, maka memperlakukan pelanggan secara personalisasi dapat

diwujudkan dan dilakukan dengan tepat.

2.7.3 Membangun Model Pengukuran Profitabilitas Pelanggan

Adalah sesuatu yang sangat efektif bagi perusahaan jika dapat mengetahui pelanggan mana yang

berpotensi meningkatkan profitabilitas perusahaan dan berapa lama pelanggan tersebut akan

memberikan nilai bagi perusahaan, dan sebaliknya mengetahui mana yang menjadi beban

Page 44: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

50

perusahaan dan tidak memberikan kontribusi yang berarti bagi perusahaan. Sangat penting bagi

perusahaan memiliki kemampuan untuk mengetahui pengetahuan ini, sehingga perusahaan dalam

hal ini pimpinan dapat membuat keputusan dengan lebih baik dengan mengetahui bagaimana,

kapan, dan apa yang harus ditawarkan pada setiap pelanggan. Hal ini akan mendukung dan

mampu meningkatkan efektifitas pelayanan dan interaksi dengan pelanggan.

Ada beberapa faktor yang dapat mempengaruhi profitabilitas seorang pelanggan,

antara lain :

1. Nilai Pelanggan ( Customer Value )

2. Perilaku Pelanggan ( Customer Behavior )

3. Kepuasan Pelanggan ( Customer Satisfaction )

4. Masa Umur Pelanggan ( Customer Lifetime )

5. Return on Investment (ROI)

2.7.3.1 Nilai Pelanggan ( Customer Value )

Secara garis besar, Customer Value atau nilai pelanggan digambarkan sebagai suatu pemahaman

tentang nilai yang sebenarnya terhadap produk atau jasa yang diberikan perusahaan (Childers,

2003, hal25). Value berbicara tentang apa yang akan pembeli bayar untuk sebuah produk atau

jasa. Penting untuk mengetahui bagaimana untuk mengelola customer value secara konsisten,

karena hal tersebut dapat merupakan investasi yang terbaik yang dapat dilakukan oleh

perusahaan.

Customer value secara langsung dihubungkan dengan benefit yang dapat diperoleh dari

produk dan jasa yang diberikan kepada masing–masing pelanggan yang mengkonsumsi barang

dan jasa. Pemahaman akan nilai pelanggan merupakan salah satu competitive advantage

Page 45: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

51

perusahaan untuk menghadapi pesaingnya (Childers, 2003, hal37)

Variabel-variabel yang digunakan untuk mengukur tingkat customer value antara

lain:

1. Product Value

Nilai yang didapat pelanggan dari produk yang ditawarkan perusahaan.

2. Service Value

Nilai yang diperoleh pelanggan dari tingkat pelayanan yang diberikan kepada pelanggan

baik pelayanan secara langsung maupun tidak langsung.

3. Personnel Value

Nilai yang diperoleh pelanggan dari pelayanan serta tingkah laku karyawan perusahaan.

4. Image Value

Nilai yang diperoleh pelanggan dari merek produk yang ditawarkan/yang dibeli dari

perusahaan.

Dapat dipastikan bahwa pelanggan pasti memperhitungkan penawaran mana yang akan

memberikan nilai tertinggi. Para pelanggan membentuk suatu harapan akan nilai dan bertindak

berdasarkan hal itu. Pada praktisnya, penawaran yang memenuhi harapan nilai pelanggan

mempengaruhi kepuasan dan kemungkinan pelanggan membeli kembali (Tunggal, 2000, p18).

2.7.3.2 Perilaku Pelanggan ( Customer Behaviour )

Dalam hubungannya dengan perusahaan, identifikasi perilaku pelanggan dapat diukur dengan

beberapa parameter berikut (Tunggal, 2000, hal20-21) :

Page 46: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

52

1. Penghasilan ( Revenue )

Tingkat profitabilitas seorang pelanggan dapat dilihat dari tingkat penghasilan yang

dikontribusikan oleh pelanggan tersebut kepada perusahaan. Ini dapat diukur dalam

jumlah rupiah atau volume produk yang dipesan selama suatu periode tertentu.

Penghasilan yang dimaksud adalah penghasilan kotor yang diperoleh perusahaan atas

transaksi penjualan yang dilakukan pelanggan. Semakin tinggi kontribusi seorang

pelanggan bagi perusahaan dalam hal penghasilan yang perusahaan terima, maka semakin

tinggi tingkat profitabilitas pelanggan. Perusahaan akan mengalihkan pelayanannya dan

mengoptimalkan penawarannya bagi seorang atau perusahaan pelanggan yang

memberikan keuntungan yang tinggi bagi perusahaan. Tentu saja hal ini dapat

mengefektifkan dan mengefisiensikan praktek pemasaran dan servis lainnya yang

diberikan perusahaan untuk pelanggan.

2. Customer Lifeture

Customer Lifeture dapat diukur dari rata-rata lamanya waktu, diukur dalam bulanan atau

tahunan, yaitu rata-rata pelanggan melakukan transaksi dengan perusahaan dalam

memenuhi produk atau jasa yang dibutuhkan.

3. Customer Share

Customer Share yaitu sejauh mana seorang pelanggan memenuhi kebutuhannya atas

produk atau jasa yang diinginkan pelanggan dengan berbisnis dengan perusahaan kita.

Page 47: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

53

4. Corporate Value

Corporate value ini diukur berdasarkan sejauh mana seorang pelanggan dapat

bekerjasama dengan baik dengan perusahaan, yang dilihat dari ketepatan dalam

melakukan pembayaran yang telah ditargetkan (khusus untuk pembayaran kredit) serta

seberapa sering giro yang dikeluarkan pelanggan ditolak oleh pihak bank.

2.7.3.3 Kepuasan Pelanggan ( Customer Satisfaction )

Secara umum kepuasan adalah perasaan senang atau kecewa seseorang yang berasal dari

perbandingan antara kesannya terhadap kinerja (atau hasil) suatu produk dan harapannya.

Kepuasan merupakan fungsi dari kesan kinerja dan harapan. Jika kinerja produk atau jasa

perusahaan berada dibawah harapan, maka pelanggan tidak puas. Jika kinerja memenuhi harapan,

maka pelanggan akan merasa puas. Jika kinerja melebihi harapan, maka pelanggan amat puas dan

senang (Tunggal, 2000, hal21).

Perusahaan harus mulai berfokus untuk memberikan kepuasan yang lebih tinggi kepada

pelanggannya, karena hanya para pelanggan yang merasa tidak puas yang mudah untuk berubah

pikiran bila mendapat tawaran yang lebih baik. Pelanggan yang puas akan memenuhi target

perusahaan akan penjualan produk atau jasa kepada pelanggan yang dituju, bahkan melebihi dari

yang diharapkan. Pelanggan yang puas akan mempengaruhi perilakunya terhadap perusahaan,

sebagai hasilnya adalah kesetiaan pelanggan yang tinggi. Para pembeli akan membeli dari

perusahaan yang mereka anggap menawarkan customer delivered value yang tertinggi. C ustomer

delivered value ini yang nantinya menjadi faktor untuk mengetahui tingkat kepuasan pelanggan

yang sebenarnya terhadap pelayanan dan produk perusahaan yang telah diberikan. Beberapa

metode berikut dapat digunakan untuk melacak kepuasan pelanggan (Kotler , 2000, hal30-35):

Page 48: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

54

1. Sistem Keluhan dan Saran ( Complaint and Suggestion Systems )

Sistem keluhan dan saran mempermudah pelanggannya memberikan keluhan dan

sarannya. Contohnya restoran dan hotel menyediakan formulir bagi tamu untuk

melaporkan hal-hal yang disukai dan tidak disukai. Ada pula perusahaan yang

menyediakan layanan hot-lines bagi pelanggan dengan nomor telepon gratis sehingga

memudahkan pelanggan dalam menyampaikan keluhannya.

2. Survei Kepuasan Pelanggan ( Customer Satisfaction Surveys )

Perusahaan-perusahaan yang responsif memperoleh ukuran kepuasan pelanggan secara

langsung biasanya dilakukan dengan cara ini. Perusahaan dapat membuat daftar

pertanyaan yang kemudian dibagikan atau menelepon pelanggan sebagai sampel acak

untuk menanyakan apakah mereka puas, biasa saja, kurang puas, atau amat tidak puas

dengan berbagai aspek kinerja perusahaan. Perusahaan juga dapat meminta tanggapan

pelanggan tentang kinerja para pesaing perusahaan. Selain itu juga berguna untuk

mengajukan pertanyaan tambahan untuk mengukur keinginan pelanggan untuk membeli

kembali. Nilai positif tinggi dari pelanggan menunjukkan bahwa perusahaan

menghasilkan kepuasan yang tinggi bagi pelanggannya. Pelanggan akan membeli dari

perusahaan yang dianggap menawarkan customer delivered value yang tertinggi.

Customer delivered value (Nilai yang diterima pelanggan) adalah selisih antara total

customer value (jumlah nilai bagi pelanggan) dan total customer cost (biaya total

pelanggan).

Page 49: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

55

3. Belanja Siluman ( Ghost Shopping )

Cara ini biasa dilakukan dengan membayar orang-orang bertindak sebagai pembeli

potensial untuk melaporkan temuan-temuan tentang kekuatan dan kelemahan yang

ditemui dalam membeli produk perusahaan dan produk pesaing, dan juga kinerja

pelayanan dari staf perusahaan yang terlibat dalam transaksi operasional perusahaan

dengan pelanggan.

4. Analisis Kehilangan Pelanggan ( Lost Customer Analysis )

Perusahaan dapat menganalisis kehilangan pelanggan dengan mengidentifikasi sejumlah

pelanggan yang dimiliki yang dikategorikan sebagai inactive customer, yaitu orang-orang

atau perusahaan yang telah membeli barang atau jasa pada masa lalu, akan tetapi tidak

dalam periode tertentu. Penting bagi perusahaan untuk mempelajari kegagalannya yang

biasa diakibatkan karena perusahaan gagal memuaskan pelanggannya. Pelanggan yang

hilang berdampak terhadap penurunan pendapatan perusahaan, perusahaan dapat

menghitung berapa pendapatan yang hilang pertahunnya dikarenakan kehilangan satu

pelanggan. Contoh kasusnya : penjualan rata-rata pelanggan tahun lalu (2003) adalah Rp

400 Juta. Margin laba perusahaan adalah 5%, berapa biaya kehilangan pelanggan ? Maka

perhitungannya adalah :

a. Katakanlah perusahaan mempunyai 100 pelanggan.

b. Perusahaan kehilangan 5% dari pelanggannya tahun 2003 karena pelayanannya

Page 50: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

56

yang buruk. Hal ini berarti perusahaan kehilangan 5 pelanggan (5% x 100).

c. Rata-rata penurunan pelanggan yang hilang mencerminkan Rp 400 juta penurunan

pendapatan bagi perusahaan. Oleh karenanya, perusahaan kehilangan 2 milyar

pendapatan pada tahun ini (5 x Rp 400 juta). Margin laba perusahaan adalah 5%.

Oleh karenanya, perusahaan kehilangan Rp100 juta pada tahun 2004 (5% x Rp 2

Milyar).

Total Customer value (jumlah nilai bagi pelanggan) diperoleh dari nilai yang didapatkan dari

customer value (nilai pelanggan) yang telah dijelaskan sebelumnya. Total Customer Value ini

merupakan benefit yang diterima pelanggan dari melakukan bisnis dengan perusahaan.

Total Customer Cost (total biaya pelanggan) ini merupakan akumulasi dari empat jenis

biaya, yaitu : Physic Cost, Energy Cost, Time Cost, Monetary Cost.

1. Physic cost

Physic Cost = Biaya PBB + biaya sewa prasarana

2. Energy Cost, dihitung berdasarkan biaya yang dikeluarkan dalam mendapatkan produk

perusahaan secara langsung.

3. Time Cost, merupakan nilai atau jumlah biaya atas waktu yang dihabiskan pelanggan

dalam mendapatkan produk yang diinginkan.

4. Monetary cost :

Monetary cost = Production cost + Marketing cost + Operational cost

a. Perhitungan Production cost

Production cost = Raw material cost+ electric cost + biaya penyusutan mesin

+ biaya tenaga kerja

Page 51: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

57

b. Perhitungan marketing cost didapat dari biaya promosi yang dikeluarkan seperti

biaya iklan, brosur, reklame, spanduk, katalog, promosi umum, dsb.

c. Perhitungan operational cost :

Operational Cost = Gaji karyawan + biaya peralatan + biaya perlengkapan

Rumus untuk menghitung customer delivered value ( Nilai yang diterima pelanggan)

yang menggambarkan nilai kepuasan pelanggan yaitu :

CUSTOMER DELIVERED VALUE = CUSTOMER BENEFIT - CUSTOMER COST

Gambar 2.7 Penentu Nilai yang Diterima Pelanggan

Page 52: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

58

2.7.3.4 Masa Umur Pelanggan ( Customer Lifetime )

Model lifetime value ini digunakan untuk mengestimasi jangka waktu keuntungan yang

diharapkan perusahaan dari setiap pelanggan. Dengan mengetahui ini, memungkinkan servis atau

produk yang khusus ditawarkan untuk pelanggan yang memiliki nilai yang tinggi. (Kotler , 2000,

hal30-35).

2.7.3.5 Return on Investment (ROI)

Perusahaan melakukan penanaman modal untuk mencari tingkat pengembalian yang memuaskan.

Untuk menentukan tingkat pengembaliannya tergantung dari jumlah biaya yang terpakai, dan

faktor lainnya. Tingkat pengembalian yang perlu didapatkan harus sama atau melebihi dari

besarnya modal. Perhitungan tingkat ROI mengkalkulasi tingkat pengembalian modal yang telah

diinvestasikan dengan menyesuaikan pemasukan dari modal yang dikeluarkan termasuk

depresiasi. ROI dapat dihitung dengan menghitung rata-rata dari keuntungan bersih.Keuntungan

bersih ini dibagi dengan total investasi awal untuk mendapatkan ROI.

Rumusnya adalah :

Net Benefit = ROI

Net Investment

Lemahnya tingkat ROI dapat mempengaruhi lemahnya time value of money . ROI

dapat memodifikasi/mengubah keuntungan di masa yang akan datang. Keuntungan dengan

melakukan perhitungan ROI adalah :

Page 53: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

59

1. Perbandingan dalam menghitung keuntungan.

2. Memudahkan penghitungan dari tahun tertentu yang khusus.

2.7.4 Customer Churn dalam Industri Telepon Selular

Masalah terbesar yang sedang dihadapi industri telepon selular saat ini adalah fenomena

yang menunjukkan perpindahan/pergerakan pelanggan dari satu provider ke provider lainnya.

Fenomena ini yang dikenal dengan istilah customer churn (Mutanen, Teemu. 2006, hal4).

Customer churn dapat disebabkan oleh banyak hal, mulai dari tarif yang kompetitif antar

operator, fitur dan fasilitas yang kompetitif, sampai bagaimana provider melayani, berinteraksi,

dan mengelola hubungannya dengan pelanggan-pelanggannya.

Customer churn di industri telekomunikasi merupakan masalah yang sangat besar. Jika

pada industri lain, sebut saja misalnya industri kartu kredit, nilai customer churn yang terjadi

sekitar 0,4% tiap bulan, di industri telekomunikasi dapat terjadi sampai 2,2% per bulan. Dapat

dikatakan bahwa sekitar 27% pelanggan provider churn setiap tahunnya.

Mengapa masalah ini menjadio begitu krusial? Karena biaya yang dikeluarkan untuk

mendapatkan pelanggan baru, untuk iklan, marketing, komisi, dan lain-lain akan jauh lebih besar

dibandingkan biaya yang harus dikeluarkan untuk menjaga pelanggan yang sudah ada. Ditambah

lagi, belum kebanyakan pelanggan baru cenderung tidak lebih menghasilkan keuntungan

dibandingkan pelanggan yang sudah lama dan bertahan.

Page 54: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

60

2.8 Text Mining

2.8.1 Definisi Text Mining

Menurut Weigo Fan (Fan, Weiguo. 2005. hal3-10), Text Mining didefinisikan sebagai penemuan

informasi baru yang belum diketahui sebelumnya secara terkomputerisasi dengan mengekstrak

informasi dari beberapa sumber tertulis yang berbeda. Text Mining mirip dengan data mining,

perbedaan ialah data mining dibuat untuk menangani data terstruktur dari database atau file

XML, tetapi text mining dapat bekerja dalam data yang tidak terstruktur seperti email, dokumen

full-text, file HTML, dan lain-lain. Sebagai hasilnya, text mining merupakan solusi yang lebih

baik untuk perusahaan-perusahaan dimana sejumlah besar informasi yang berbeda-beda harus

disatukan dan diatur.

Masalah pada text mining sudah jelas, natural language diciptakan oleh manusia untuk

berkomunikasi satu sama lain dan mencatat informasi. Oleh karena itu, komputer sangat sulit

untuk memahami natural language. Manusia mempunyai kemampuan untuk membedakan dan

memakai pola bahasa pada teks dan dapat dengan mudah mengatasi masalah seperti bahasa

slang, kesalahan eja, dan pengertian konstektual. Akan tetapi, walaupun kapabilitas bahasa kita

membiarkan kita untuk memahami data yang tidak terstruktur, kita mengalami kesulitan pada

kemampuan komputer untuk memproses teks pada volume yang besar dengan kecepatan yang

tinggi. Di sini tertera kunci untuk text mining, yaitu membuat teknologi yang dapat

mengkombinasikan kapabilitas bahasa manusia dengan kecepatan dan akurasi yang tinggi pada

komputer.

Gambar 2.8 : Schema Text Mining

Page 55: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

61

Di atas merupakan contoh proses text mining Pertama-tama dilakukan pengumpulan

dokumen setelah itu text mining tool akan mendapatkan dokumen tertentu dan melakukan

tahapan preprocess dengan mengecek format dan set karakter. Lalu akan masuk ke tahapan

analisis teks yang dapat dilakukan berulang-ulang sampai informasi dapat diekstrak. Pada

gambar, ada tiga bagian proses di dalam analisis teks, namun pada kenyataannya banyak

kombinasi teknik yang dapat digunakan tergantung pada hasil yang diinginkan oleh

organisasinya. Setelah diekstrak, informasi akan dimasukkan dalam Management Information

System, yang nantinya akan menghasilkan pengetahuan yang banyak untuk user dari system

tersebut

2.8.2 Teknologi Text Mining

Walaupun perbedaan dalam bahasa manusia dengan bahasa komputer cukup besar,

namun ada teknologi yang dapat menutup celah perbedaan itu. Pemrosesan natural language

telah memproduksi teknologi yang dapat mengajarkan natural language kepada komputer

sehingga mereka dapat menganalisa, mengerti dan bahkan men-generate teks. Beberapa

teknologi yang telah dibuat dan bisa digunakan yaitu teknologi information extraction, Topic

Extraction, summarization, categorization, clustering, concept linkage, information visualization

dan question answering.

2.8.2.1 Information Extraction

Titik permulaan untuk komputer menganalisa teks yang tidak terstruktur ialah dengan

menggunakan extraction information. Software information extraction mengidentifikasi frasa

Page 56: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

62

kunci dan hubungan dalam teks. Ini dilakukan dengan mencari urutan yang telah didefinisakan

sebelumnya di dalam teks, sebuah proses yang disebut pattern matching. Software ini dapat

menyimpulkan hubungan di antara objek yang telah terdefinisi untuk memberikan user informasi

yang bermakna. Teknologi ini sangat berguna untuk volume data yang besar. Hampir semua

software text mining menggunakan information extraction karena ini merupakan dasar dari

semua teknologi text mining yang ada.

1. Topic Extraction

Sistem Topic Extraction bekerja dengan menyimpan profil user dan berdasarkan

dokumen yang user lihat, lalu memprediksi dokumen lain yang memiliki daya tarik

untuk user tersebut. Teknologi Topic Extraction mempunyai keterbatasan pada tingkatan

akurasinya. Beberapa text mining tool yang baik memungkinkan user untuk memilih

kategori tertentu atau software secara otomatis dapat menarik kesimpulan dari

ketertarikan user berdasarkan sejarah bacaan user dan informasi yang dicari user melalui

penekanan tombol mouse.

2. Summarization

Text summarization sangat membantu untuk mengetahui apakah sebuah dokumen yang

panjang termasuk dalam kriteria yang dibutuhkan oleh user dan cocok untuk terus

dibaca. Kunci dari summarization ialah mengurangi panjang dan detail dari dokumen

namun tetap menjaga maksud inti dan keseluruhan. Tantangannya terletak di sana,

walaupun komputer mampu untuk menentukan pelaku, tempat, dan waktu, namun tetap

sulit untuk mengajarkan software untuk menganalisa kata-kata dan menerjemahkan

Page 57: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

63

maknanya. Secara umum, ketika manusia menyimpulkan bacaan, kita membaca secara

keseluruhan untuk memahaminya, lalu menuliskan kesimpulannya dengan mengambil

intinya. Karena komputer belum mempunyai kapabilitas bahasa manusia, metode

alternatif harus dipertimbangkan.

Salah satu strategi yang sering digunakan pada text summarization tool ialah

sentence extraction, mengekstrak kalimat penting dari sebuah artikel dengan mengukur

kalimat tersebut secara statistik. Summarization dapat bekerja dengan topic tracking tool

atau categorization tool dalam proses untuk merangkum dokumen yang diinginkan pada

topik-topik tertentu. Jika user diberikan ratusan dokumen yang berhubungan dengan

topic yang mereka inginkan, maka summarization tool dapat digunakan untuk

mengurangi waktu pencarian mereka untuk menyortir dokumen-dokumennya.

3. Categorization

Categorization mengidentifikasi topik utama dari dokumen dengan menempatkan

dokumen ke dalam suatu set topik yang telah didefinisikan sebelumnya. Ketika

mengkategorikan suatu dokumen, program komputer akan memperlakukan dokumen

sebagai bag of words. Categorization tidak melakukan proses pada informasi aktual

seperti pada information extraction lakukan. Categorization hanya menghitung kata-kata

yang muncul dan mengidentifikasi topik utama dari judul dokumen. Categorization

biasanya bergantung pada kosakata pada topik yang telah ditentukan sebelumnya dan

hubungan didefinisikan dengan mencari broad terms, narrower terms, sinonim dan

related terms. Categorization tool secara normal mempunyai metode untuk membuat

ranking pada dokumen berdasarkan isi yang paling sesuai dengan topik yang ditentukan.

Page 58: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

64

4. Clustering

Clustering ialah teknik yang sering digunakan untuk mengelompokkan dokumen-

dokumen yang memiliki kemiripan tertentu, namun berbeda dari categorization,

clustering tidak menentukan topik sebelum melakukan proses. Keuntungan teknik

clustering bahwa dokumen-dokumen tersebut dapat dimunculkan dalam beberapa

subtopik. Hal ini memastikan bahwa sebuah dokumen yang berharga tidak akan

dihilangkan dari hasil pencarian. Algoritma dasar Clustering menciptakan vektor dari

topik untuk setiap dokumen dan mengukur berat dari seberapa baik dokumen itu cocok

untuk setiap cluster.

5. Concept Linkage

Teknik concept linkage menghubungkan dokumen-dokumen yang berhubungan dengan

cara mengidentifikasi kemiripan mereka dan membantu user untuk menemukan

informasi yang mereka tidak dapatkan ketika mereka menggunakan metode pencarian

tradisional. Metode ini memungkinkan penjelajahan informasi dibandingkan pencarian

informasi. Concept linkage adalah konsep yang berharga di dalam text mining,

khususnya dalam aspek biomedical dimana begitu banyak riset yang telah dilakukan

sehingga tidak mungkin jika si peneliti harus membaca seluruh materi dan

menghubungkan materi-materi tersebut dengan risetnya yang lain.

Page 59: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

65

6. Information Visualization

Visual text mining atau information visualization menempatkan sumber besar yang

berupa teks ke dalam hirarki visual atau peta dan menyediakan kapabilitas penjelajahan,

dalam penambahan untuk pencarian sederhana. User dapat berinteraksi dengan peta

dokumen dengan memperbesar, menskala dan membuat peta kecil lain. Information

visualization sangat berguna ketika user butuh untuk mempersempit dokumen dan

menjelajah topik yang berhubungan.

7. Question Answering

Aplikasi lain dari natural language processing adalah natural language queries atau

question answering yang menangani bagaimana menemukan jawaban terbaik untuk

pertanyaan yang diberikan. Banyak websites yang dilengkapi dengan teknologi question

answering, memungkingkan end user untuk “bertanya” pada computer sebuah

pertanyaan dan diberikan jawaban.

2.9 Analisis SWOT

Menurut Rangkuti (2000, p18) analisis SWOT adalah pengidentifikasian dari factor-faktor yang

ada secara sistematis. Untuk merumuskan strategi perusahaan, analisa ini didasarkan pada logika

yang dapat memaksimalkan kekuatan dan peluang, namun secara bersamaan dapat

meminimalkan kelemahan dan ancaman. Proses pengambilan keputusan strategis selalu

berkaitan dengan pengembangan misi, tujuan, strategi dan kebijakan perusahaan, dengan

demikian perencanaan strategi harus menganalisa factor-faktor strategis perusahaan dalam

kondisi yang ada pada saat ini. SWOT merupakan kependekan dari kekuatan (Strength),

Page 60: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

66

kelemahan (Weakness), kesempatan (Opportunity), dan ancaman (Threat). Analisis ini dapat

mengindentifikasi factor-faktor tersebut secara sistematis dan dapat menunjukkan strategi yang

cocok bagi perusahaan untuk dijadikan solusi.

2.9.1 Strength

Strength merupakan faktor yang memperbesar daya tawar dalam menghadapi pelanggan,

menghindari persaingan dengen perusahaan sejenis dan memungkinkan biaya rendah dalam

kelompok strategi.

2.9.2 Weakness

Weakness merupakan faktor yang dapat memperlemah posisi perusahaan dalam persaingan

bisnisnya, menyebabkan biaya yang tinggi untuk melaksanakan strategi dan mengurangi daya

tawar dalam menghadapi pelanggan. Kelangkaan dalam sumber daya yang memungkinkan

perusahaan mengatasi rintangan yang ada juga termasuk dalam Weakness.

2.9.3 Opportunity

Opportunity merupakan faktor luar yang dapat memungkinkan terciptanya strategi bisnis baru

atau memperkuat posisi struktural perusahaan yang telah ada.

2.9.4 Threat

Threat merupakan faktor luar yang dapat memungkinkan timbulnya hambatan dan rintangan

bagi bisnis perusahaan, seperti inflasi, munculnya perusahaan sejenis, peraturan pemerintah dan

lain-lain.

Page 61: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

67

2.9.5 Matriks Faktor Strategi Internal

Menurut Rangkuti (2002, hal 24), factor-faktor strategis internal adalah kekuatan dan kelamahan

perusahaan.Didalam strategi internal ini membahas tentang keunggulan perusahaan yang tidak

dimiliki perusahaan pesaing, sehingga harus mengintegrasikan keunggulan itu kedalam budaya

organisasi. Dengan demikian perusahaan lain tidak akan mudah meniru keunggulan perusahaan.

Cara-cara penentuan faktor strategis internal :

1. Tentukan factor-faktor yang menjadi kekuatan dan kelamahan perusahaan.

2. Beri bobot masing-masing factor tersebut dengan skala mulai dari 0,0 (tidak penting) sampai

1,0 (paling penting), berdasarkan pengaruh factor tersebut terhadap posisi strategis perusahaan (

semua bobot tersebut tidak boleh melebihi skor total 1,00).

3. Hitung rating untuk masing-masing factor dengan skala mulai dari 1 ( di bawah rata-rata )

sampai 4 ( sangat baik ), berdasarkan pengaruh factor tersebut terhadap kondisi perusahaan yang

bersangkutan. Variabel yang bersifat positif ( semua variable yang masuk kategori kekuatan )

diberi nilai mulai dari 1 sampai 4 dengan membandingkannya dengan rata-rata industri dengan

pesaing utama. Sedangkan untuk kelemahan yang dimiliki diberi rating 1 jika efek yang

ditimbulkan kelemahan tersebut tidak terlalu berdampak besar bagi perusahaan. Semakin besar

dampak yang timbulkan, rating dinilai semakin tinggi sampai batas maksimal 4.

4. Kalikan bobot dengan rating untuk memperoleh faktor pembobotan.hasilnya berupa skor

pembobotan untuk masing-masing faktor yang nilainya mulai dari 1,0 sampai 4,0.

5. Jumlahkan skor factor kekuatan dan jumlahkan skor factor kelemahan. Kemudian hitung

selisihnya untuk mendapatkan skor total Internal Factor Analysis Summary (IFAS).

Page 62: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

68

2.9.6 Matriks Faktor Strategi Eksternal

Menurut Rangkuti (2002, hal 24), factor-faktor strategis eksternal adalah peluang dan ancaman,

perencanaan strategi dilakukan untuk menganalisa lingkungan eksternal sehingga dapat

mengetahui berbagai kemungkinan peluang dan ancaman pada perusahaan. Cara-cara penentuan

faktor strategis eksternal:

1. susunlah faktor-faktor yang menjadi peluang dan ancaman yang dimiliki perusahaan.

2. Beri bobot masing-masing faktor tersebut dengan skala mulai dari 0,0 (tidak penting) sampai

1,0 (paling penting). Factor-faktor tersebut kemungkinan dapat memberikan dampak pada factor

strategis.

3. Hitung rating untuk masing-masing factor dengan skala mulai dari 1 (di bawah rata-rata)

sampai 4 (sangat baik), berdasarkan pengaruh faktor tersebut terhadap kondisi perusahaan yang

bersangkutan. Variabel yang bersifat positif (semua variable yang masuk kategori peluang)

diberi nilai mulai dari 1 sampai 4 dengan membandingkannya dengan rata-rata industri dengan

pesaing utama. Sedangkan untuk ancaman yang dimiliki diberi rating 1 jika ancaman tersebut

dapat berdampak besar bagi perusahaan. Semakin besar dampak yang mungkin ditimbulkan,

rating dinilai semakin tinggi sampai batas maksimal 4.

4. Kalikan bobot dengan rating untuk memperoleh faktor pembobotan.hasilnya berupa skor

pembobotan untuk masing-masing faktor yang nilainya mulai dari 1,0 sampai 4,0.

5. Jumlahkan skor faktor peluang dan jumlahkan skor faktor ancaman. Kemudian hitung

selisihnya untuk mendapatkan skor total External Factor Analysis Summary (EFAS).

Page 63: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

69

2.9.7 Diagram Analisis SWOT

Diagram Analisis SWOT adalah diagram yang digunakan untuk mengidentifikasi posisi dan

situasi yang dihadapi perusahaan pada persaingan bisnis, berdasar pada faktor strategi internal

perusahaan (IFAS) dan factor-faktor strategi eksternal (EFAS) yang dihadapi perusahaan.

Diagram Analisis SWOT menunjukkan titik koordinat dari posisi SWOT seperti yang

ditunjukkan pada gambar berikut :

Gambar 2.9 : Diagram SWOT

Kuadran 1 : merupakan situasi yang sangat menguntungkan perusahaan. Perusahaan tersebut

memiliki peluang dan kekuatan sehingga dapat memanfaatkan peluang yang ada.

Kuadran 2 : meskipun menghadapi berbagai macam ancaman, perusahaan ini masih memiliki

kekuataan dari segi internal.

Kuadran 3 : perusahaan menghadapi peluang pasar yang sangat besar. Tetapi di lain pihak

perusahaan menghadapi beberapa kendala atau kelemahan internal.

Kuadran 2

Kuadran 1 Kuadran 3

Kuadran 4

Page 64: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

70

Kuadran 4 : merupakan situasi yang sangat tidak menguntungkan bagi perusahaan. Perusahaan

tersebut menghadapi berbagai macam ancaman dan memiliki kelemahan internal.

2.9.8 Matrik SWOT

Alat yang digunakan untuk menyusun factor-faktor strategis perusahaan adalah matrik SWOT.

Matriks ini dapat menggambarkan secara jelas bagaimana peluang dan ancaman eksternal yang

dihadapi perusahaan dapat disesuaikan dengan kekuatan dan kelemahan yang dimilikinya.

Matrik inidapat menghasilkan 4 (empat) set kemungkinan strategi (Rangkuti, 2000, hal31), yaitu:

1. Strategi Strength – Opportunity

Strategi ini dibuat berdasarkan jalan pikiran perusahaan yaitu dengan memanfaatkan seluruh

kekuatan untuk merebut dan memanfaatkan peluang sebesar-besarnya.

2. Strategi Strength –Threat

Strategi ini diterapkan dalam menggunakan kekuatan yang dimiliki perusahaan untuk mengatasi

ancaman eksternal.

3. Strategi Weakness – Opportunity

Strategi ini diterapkan berdasarkan pemanfaatan peluang yang ada dengan cara meminimalkan

kelemahan yang ada.

4. Strategi Weakness – Threat

Strategi ini didasarkan pada kegiatan yang bersifat defensive dan berusaha meminimalkan

kelemahan yang ada serta menghindari ancaman.

Page 65: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

71

2.10 Analisis Critical Success Factor (CSF)

Menurut Rockart (Ward, 2002, hal209), CSF adalah area tertentu dalam perusahaan dimana jika

hasil dari area tersebut memuaskan, maka akan menjamin keberhasilan perusahaan dalam

bersaing. Area tersebut adalah area kunci dimana ‘sesuatu harus berjalan dengan baik dan benar’,

sehingga keberhasilan bisnis dapat dicapai dan terus berkembang.

Manfaat dari analisis CSF menurut Ward (2002, p209) adalah sebagai berikut:

1. analisis CSF merupakan teknik yang paling efektif dalam melibatkan manajemen senior

dalam mengembangkan strategi Sistem Informasi. Karena CSF secara keseluruhan telah

berakar pada bisnis dan memberikan komitmen bagi manajemen puncak dalam

menggunakan sistem informasi yang diselaraskan dengan pencapaian tujuan perusahaan

melalui area bisnis yang kritis.

2. analisis CSF menghubungkan proyek sistem informasi yang akan diimplementasikan

dengan tujuannya, dengan demikian sistem informasi nantinya akan dapat direalisasikan

agar sejalan dengan strategi bisnis perusahaan.

3. dalam wawancara dengan manajemen senior, analisis CSF dapat menjadi perantara yang

baik dalam mengetahui informasi apa yang diperlukan oleh setiap individu.

4. dengan menyediakan suatu hubungan antara tujuan dengan kebutuhan informasi, analisis

CSF memegang peranan penting dalam memprioritaskan investasi modal yang potensial.

5. analisa CSF sangat berguna dalam perencanaan sistem informasi pada strategi bisnis

tidak berjalan sesuai dengan tujuan perusahaan, dengan memfokuskan pada masalah-

masalah tertentu yang paling kritis.

Page 66: BAB 2 LANDASAN TEORI - BINA NUSANTARA | Library ...library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00121-IF bab 2.pdf · memelihara dan menyediakan akses kontrol untuk pengguna

72

6. analisis CSF sangat berguna apabila digunakan sejalan dengan analisis value chain dalam

mengidentifikasi proses yang paling kritis, serta memberikan focus pada pencapaian

tujuan melalui kegiatan-kegiatan yang paling tepat untuk dilaksanakan.