bab 2. landasan teori -...

45
7 BAB 2 LANDASAN TEORI 2.1 Dasar-Dasar Data Warehouse 2.1.1 Pengertian Sistem Informasi 2.1.1.1 Pengertian Sistem Menurut McLeod ( 1998, p11 ), sistem merupakan sekelompok elemen-elemen yang terintegrasi dengan maksud yang sama untuk mencapai suatu tujuan. Menurut O’Brien ( 2005, p22 ), sistem merupakan sekelompok komponen-komponen yang saling berhubungan satu sama lain dan bekerja bersama-sama untuk mencapai suatu tujuan dengan menerima input dan menghasilkan output yang melalui proses transformasi. Menurut O’Brien, dalam sistem terdapat 3 komponen-komponen yang saling berinteraksi, diantaranya adalah : 1. input, meliputi penangkapan elemen-elemen yang masuk ke dalam sistem untuk diproses. 2. proccessing, meliputi proses transformasi yang mengubah input menjadi output. 3. output, meliputi pemindahan elemen-elemen yang telah dihasilkan melalui proses transformasi.

Upload: nguyenkhanh

Post on 11-Mar-2019

219 views

Category:

Documents


0 download

TRANSCRIPT

7

BAB 2

LANDASAN TEORI

2.1 Dasar-Dasar Data Warehouse

2.1.1 Pengertian Sistem Informasi

2.1.1.1 Pengertian Sistem

Menurut McLeod ( 1998, p11 ), sistem merupakan sekelompok

elemen-elemen yang terintegrasi dengan maksud yang sama untuk

mencapai suatu tujuan.

Menurut O’Brien ( 2005, p22 ), sistem merupakan sekelompok

komponen-komponen yang saling berhubungan satu sama lain dan bekerja

bersama-sama untuk mencapai suatu tujuan dengan menerima input dan

menghasilkan output yang melalui proses transformasi.

Menurut O’Brien, dalam sistem terdapat 3 komponen-komponen yang

saling berinteraksi, diantaranya adalah :

1. input, meliputi penangkapan elemen-elemen yang masuk ke dalam

sistem untuk diproses.

2. proccessing, meliputi proses transformasi yang mengubah input

menjadi output.

3. output, meliputi pemindahan elemen-elemen yang telah dihasilkan

melalui proses transformasi.

8

Apa itu Sistem ?Input

Feed-Forward

Bagaimana sistemdikontrol ? Feedback

Output

Sistem boundary

Sistem Enviroment

Gambar 2.1. Bagian Dari Sebuah Sistem Dan Relasinya Satu Sama Lain

Berdasarkan pada Gambar 2.1 karakteristik sistem dapat dijelaskan sebagai

berikut :

1. Sebuah sistem berada dalam sebuah informasi

2. Sebuah sistem dipisahkan dari lingkungannya oleh beberapa batasan

3. Sistem memiliki input dan output. Mereka menerima input dari

lingkungan dan mengirimkan output menuju lingkungan.

4. Sistem memiliki interface. Sebuah interface memungkinkan komunikasi

diantara 2 sistem

5. Sistem dapat memiliki subsistem-subsistem

6. Sistem yang bertahan memiliki mekanisasi kontrol

7. kontrol sistem bertumpu pada feedback (dan kadang-kadang feedforward)

8. Sebuah sistem memiliki beberapa properti yang secara tidak langsung

berdiri sendiri pada properti-properti dari bagian-bagiannya.

9

2.1.1.2 Pengertian Informasi

Menurut O’Brien ( 2005, p27 ), informasi didefinisikan sebagai data

yang telah diubah menjadi sebuah konteks yang berarti dan berguna bagi

end-user.

Menurut McLeod ( 1998, p15 ), informasi merupakan data yang telah

diproses atau data yang memilki arti.

Informasi adalah data yang telah diolah menjadi sebuah bentuk yang

berarti bagi si penerima dan bermanfaat dalam pengambilan keputusan.

2.1.1.3 Pengertian Sistem Informasi

Menurut O’Brien ( 2005, p6 ) ”An Information System is an organized

combination of people, hardware, software, communicaton network, an data

recources that collects, transform and disseminates information in an

organization”, yang berpengertian sistem informasi merupakan kombinasi

antara orang, perangkat keras, perangkat lunak, jaringan komunikasi dan

sumber data yang dikumpulkan, diubah dan informasi dalam sebuah

organisasi.

10

Tujuan dari sistem informasi adalah untuk memenuhi kebutuhan informasi

umum semua manajer dalam perusahaan atau dalam subunit fungsional

perusahaan. Subunit dapat didasarkan pada area fungsional atau tingkatan

manajemen. Sistem informasi manajemen menyediakan informasi bagi pemakai

dalam bentuk laporan dan output, model dapat disediakan dalam bentuk tabel

atau grafik.

Gambar 2.2 Piramida Sistem Informasi

Berdasarkan pada gambar 2.2 maka dapat dijelaskan sebagai berikut:

1. Sistem Informasi untuk perencanaan strategis dan kebijakan serta

pengambilan keputusan.

2. Sistem Informasi untuk perencanaan taktis dan pengambilan keputusan.

3. Sistem Informasi untuk perencanaan operasional, pengambilan keputusan

dan pengendalian.

4. Pengolahan transaksi pemberian informasi (tanggapan dan pertanyaan)

11

2.1.2 Pengertian Database

Menurut Thomas Connolly dan Carolyn Begg (2002, p14), “Database is

a shared collection of logically related data, and a decription of this data,

designed to meet the information needs if an organization”, yang kemudian

diartikan sebagai berikut database adalah kumpulan data yang saling

berhubungan satu sama lain yang digunakan secara bersama-sama dan kumpulan

data ini dirancang untuk memenuhi kebutuhan informasi suatu perusahaan.

2.1.3 Pengertian Data Warehouse

Menurut Vidette Poe (1996, p6), “A Data Warehouse is as read-only

analytical database that used as the foundation of decision support system”,

yang berarti bahwa Data Warehouse merupakan database yang bersifat analisis

dan hanya dapat dibaca, dimana database tersebut digunakan sebagai dasar

penunjang pengambilan keputusan.

Menurut W.H.Inmon (2002, p389), “A data warehouse is a collection of

integrated database designed to support the DSS function, where each unit of

data is relevant to some moment in time” yang artinya Data warehouse adalah

sekumpulan data yang dirancang untuk mendukung fungsi DSS, dimana setiap

unit data relevan pada beberapa waktu.

Menurut Thomas Connolly dan Carolyn Begg (2002, p1047) Data

Warehouse adalah ”subject oriented, integrated, time-variant, and non-volatile

collection of data in support of management’s decision-making process”. Yang

dapat diartikan sebagi kumpulan data yang berorientasi pada subjek, terintegrasi,

12

memiliki rentang waktu tertentu, serta bersifat tidak selalu berubah yang

digunakan untuk mendukung proses pengambilan keputusan.

Keuntungan data warehouse menurut Thomas Connolly dan Carolyn

Begg (2002, p1048) adalah sebagai berikut:

a. Potential high returns on investment yang berarti kembalinya modal

yang telah dikeluarkan akan lebih cepat.

b. Competitive advantage, yang dapat diartikan bahwa dengan

teknologi ini akan membawa keuntungan dalam bersaing dengan

perusahaan lainnya yang sejenis.

c. Increased productivity of corporate decision-maker, yaitu meningkat

produktivitas perusahaan dalam pengambilan keputusan menghasilkan

database terintegrasi yang konsisten, berorientasi subjek, serta bersifat

historical.

2.1.4 Istilah-Istilah Dalam Data Warehouse

Beberapa istilah-istilah yang berhubungan dengan data warehouse antara

lain :

1. DSS (Decision Support System)

Menurut Vidette Poe (1996, p23) ”A Decision support system is a system

to users so that they can analyze a situation and make decisions”, yang dapat

diartikan bahwa DSS merupakan suatu sistem yang memberikan informasi

kepada pengguna, sehingga pengguna dapat menganalisa situasi. Selain itu

DSS juga menyediakan informasi untuk membantu karyawan dalam

pengambilan keputusan yang lebih efektif dalam mengerjakan tugas mereka.

13

2. Data mart

Menurut W.H.Inmon ( 2002, p389 ) “Data mart is a departmentalized

structure of data feeding from the data warehouse where data is

denormalized based on the department’s need for information”, yakni data

yang bersumber dari Data Warehouse yang bersifat sebagian – sebagian,

dimana data tersebut diolah kembali (denormalisasi) sesuai dengan informasi

yang dibutuhkan oleh masing – masing bagian (fungsi bisnis).

Menurut Connolly ( 2002, p1067 ) “Data mart is a subset of a data

warehouse that support the requirements of a particular department of

business function”, yang berarti Data Mart adalah subset dari data warehouse

yang mendukung kebutuhan informasi dari suatu departemen atau fungsi

tertentu.

Karakterisistik dari data mart meliputi :

Data mart hanya berfokus pada kebutuhan suatu departemen atau

fungsi bisnis.

Data mart tidak berisi data operasional yang detail seperti data

warehouse

Data mart lebih mudah dimengerti karena data pada data mart

lebih sedikit.

3. OLAP (On Line Analytic Processing)

Menurut Connolly ( 2002, p1101 ) “OLAP is the dynamic

synthesis, analysis, and consolidation of large volumes of multi-

dimensional data”, yang berarti perpaduan dinamis, analistis dan

14

penggabungan data multi - dimensional dalam jumlah besar. OLAP adalah

terminology yang menjelaskan teknologi yang menggunakan sudut

pandang dari berbagai dimensi (multi dimensional) sehingga dapat

mempercepat pengaksesan startegi informasi untuk tujuan lanjutan.

OLAP juga memampukan pengguna untuk lebih memahami bahkan

menyelami berbagai aspek perusahaan secara cepat, konsisten serta

interaktif dalam melakukan pengaksesan ke berbagai macam sudut

pandang data yang memungkinkan.

4. OLTP (On Line Transaction Processing)

Menurut Connolly ( 2002, p1045 ) OLTP merupakan prosesa

penyimpanan data mengenai kegiatan operasional atau transaksi kegiatan

perusahaan sehari-harinya. OLTP dirancang untuk memungkinkan

terjadinya pengaksesan secara bersamaan oleh beberapa user terhadap

sumber data yang sama dan mengatur proses yang diperlukan.

5. Tabel Dimensi

Menurut Inmon ( 2002, p389 ) “Dimension table is the place where

extraneous data that relates to fact table is placed in a multidimensional

table”. Yang dapat diartikan sebagai tempat data lain (asing) yang

terhubung dengan tabel fakta yang ditempatkan pada tabel multi -

dimensional. Tabel dimensi dapat berisikan kategori dengan ringkasan data

detail yang dapat dilaporkan

15

6. Tabel Fakta

Menurut Inmon ( 2002, p391 ) “Fact table is the center of a star

join table that has many occurences will be located”, yang berarti tabel

fakta adalah tempat yang sediakan untuk tabel pusat dari tabel bintang

join yang memiliki beberapa kejadian (occurences).

Tabel yang pada umumnya mengandung histori dimana key yang

dihasilkan sangat unik karena merupakan kumpulan foreign key dan

primary key yang ada pada table dimensi yang berhubungan atau

merupakan tabel terpusat dari skema bintang. Tabel fakta juga menyimpan

measure yang berbeda, seperti measure yang secara langsung terhubung

dengan tabel dimensi (Additive) dan measure yang tidak berhubungan

dengan tabel dimensi (Non Additve).

7. Data Mining

Menurut Connolly ( 2002, p1115 ) “Data mining is the process of

extracting valid, previously unknown, comprehensible, and actionable

information from large databases and using it to make crucial business

decisions ”. Yang berarti proses mengekstrak informasi dari database

yang besar dan digunakan untuk membuat hal-hal yang bersifat penting

dalam bisnis.

8. Metadata

Menurut Mallach ( 2000, p514 ) ”Metadata are data that describe

the data in the data warehouse”. Yang berarti data yang menjelaskan

16

data dalam data warehouse. Metadata diperlukan jika orang ingin

mengakses data pada data warehouse.

2.2 Arsitektur Data Warehouse

Gambar 2.3 Arsitektur Data Warehouse

Berdasarkan pada Gambar 2.3 Elemen utama, entity eksternal yang berinteraksi

dengan data warehouse menurut Mallach ( 2000, p473 ), yaitu:

• Database operasional lainnya diberikan pada data warehouse. Data

eksternal lainnya juga diberikan pada data warehouse. Data warehouse

create

Extract Cleanse Transform Load

Summarize

Data Staging

Data Warehouse

Transaksi dan Data Eksternal Lainnya

Metadata

Database

Queries

Data Mining

User

17

mendapatkan salinan dari data yang berasal dari database. Database

tidak menyimpan langsung data.

• Data yang disimpan dalam database akan di-extract dan dibawa ke dalam

data warehouse. Dalam melakukan proses meng-extract ini, harus sering

melakukan transform data ke struktur data database dan format internal

dari data warehouse.

• Pada proses cleanse data, memastikan data berkualitas untuk

pengambilan keputusan.

• Selain itu juga dilakukan proses load, yang menyimpan data pada

database data warehouse. Mulai dari proses extraction, cleanse,

transform sampai load disebut sebagai data staging.

• Proses selanjutnya adalah membuat ringkasan data (summarize) seseuai

dengan yang diinginkan dan yang dibutuhkan. Data yang diringkas

berasal dari data yanag tersimpan dalam data warehouse, dimana data

tersebut bersumber dari data eksternal maupun internal.

• Metadata berguna untuk mengetahui data yang berada dalam data

warehouse. Misalnya dari mana asalnya data warehouse tersebut, atau

siapa yang bertanggung jawab terhadap data tersebut. Metadata juga

18

memiliki query tool yang ada dalam data warehouse, seperti di mana data

tersebut dapat ditemukan, siapa yang berhak untuk mengakses data serta

ringkasan data apa yang belum diperhitungkan.

• Database data warehouse berfungsi untuk menampung data detail dan

ringkasan data dari data warehouse.

• Query tool digunakan pada end user untuk memberikan pertanyaan

terhadap database. Proses memberikan pertanyaan ini disebut sebagai

online analytical processing (OLAP). Query tool juga dapat digunakan

untuk mendapatkan data yang belum terbentuk (data mining).

• User adalah pengguna dari data warehouse tersebut.

19

2.3 Struktur Data Warehouse

Gambar 2.4 Struktur Data Warehouse

Menurut Inmon ( 2002, pp36-pp37 ) yang terdapat pada Gambar 2.4 data

warehouse memilki struktur yang spesifik dan mempunyai perbedaan dalam

tingkatan detil data serta perbedaan dalam tingkatan umur data.

2.3.1 Current Detail Data

Current Detail data adalah data detil yang sedang aktif saat sekarang ini,

dimana data ini mencerminkan keadaan yang sedang berjalan.

Current Detail

Old Detail

Highly Summarized

Lightly Summarized M E T A D A T A

20

Alasan perlu diperhatikannya current detail data adalah sebagai berikut:

1. Melukiskan kejadian yang baru terjadi

2. Hampir selalu disimpan dalam media penyimpanan karena pengaksesannnya

cepat, tetapi lebih mahal karena membutuhkan media penyimpanan yang

besar dan kompleks dalam pengaturannya

3. Current detail data bersifat akurat, agar dapat digunakan untuk membuat

rekapitulasi

4. Jumlahnya sangat banyak dan disimpan pada tingkat penyimpanan terendah

2.3.2 Old Detail Data

Menurut Alex, Stephen, Kurt (2000, p27) old detail data

merepresentasikan current detail data atau history dari area subject yang lama.

Data ini yang membuat analisis trend yang mungkin. Old detail data biasanya

berupa backup dalam storage terpisah dan mencerminkan umur data agar

sewaktu - waktu dapat diakses. Data ini jarang diakses, sehingga disimpan dalam

media penyimpanan alternatif seperti tape disk.

2.3.3 Lightly Summarized Data

Merupakan ringkasan dari current detail data akan tetapi bukan bersifat

total summary. Data ini memiliki tingkatan detail yang lebih tinggi, dan

tingkatan ini juga disebut data mart. Data dapat diakses dan hasilnya banyak

digunakan untuk view dari kondisi yang sedang berjalan.

21

2.3.4 Highly Summarized Data

Ini merupakan data summary totalitas, datanya dapat dianalisis

berdasarkan urutan waktu, analisis multidimensi untuk mendukung pengambilan

keputusan serta data ini mudah diakses.

2.4 Anatomi Data Warehouse

Dalam menentukan bentuk data warehouse berasal dari berbagai sumber

dan kemudian dipindahkan ke dalam sebuah tempat penyimpanan data . Kita

perlu mengetahui kebutuhan yang diperlukan untuk menjalankan aplikasi yang

dirancang. Dengan adanya teknologi client/server memungkinkan data

warehouse diterapkan dalam berbagai macam cara untuk menampung kebutuhan

pengguna sistem secara lebih proporsional. Ada 3 jenis dasar sistem data

warehouse, yaitu :

22

2.4.1 Anatomi Data Warehouse Fungsional

Gambar 2.5 Data Warehouse Fungsional

Berdasarkan pada Gambar 2.5 maka dapat dijelaskan Data warehouse

fungsional dibuat lebih dari satu dan dikelompokkan berdasarkan tiap bagian

fungsi bisnis, misalnya departemen, divisi dan sebagainya. Setiap unit fungsi

dapat mempunyai gambaran datanya masing-masing.

Penerapan jenis sistem pengumpulan data seperti ini merupakan kerugian

dari sistem ini, karena kemampuan pengumpulan data yang terbatas bagi

pengguna. Sehingga beresiko kehilangan konsistensi data diluar lingkungan

fungsi bisnis yang bersangkutan. Apabila pendekatan ini lingkupnya menjadi

lingkup perusahaan, maka konsistensi data dari perusahaan tidak terjamin lagi.

Workstation

Workstation

Data Warehouse Fungsional

Data Warehouse Fungsional

Source

Source

Source

23

Selain kerugian pendekatan ini juga memiliki keuntungan yang memberi

solusi yang mudah untuk dibangun dengan biaya yang relatif rendah dan dapat

memberikan kelompok pengguna sebuah kemampuan sistem dengan data yang

terbatas.

2.4.2 Anatomi Data Warehouse Terpusat

Gambar 2.6 Data Warehouse Terpusat

Pada Gambar 2.6 dapat dijelaskan bahwa Data warehouse terpusat

merupakan pendekatan yang paling umum dan banyak digunakan, karena

kebiasaan pengguna dengan lingkungan main frame yang terpusat. Data diambil

dari seluruh sistem operasional dan disimpan dalam pusat penyimpanan data.

Data yang telah terkumpul tersebut dibagi-bagi berdasarkan fungsi-fungsi yang

dibutuhkan oleh perusahaan yang belum memliki jaringan eksternal

Data Warehouse Terpusat

Data Warehouse Fungsional

Data Warehouse Fungsional

Source

Source

Source

24

Keuntungan data warehouse terpusat adalah bahwa data benar-benar

terpadu/ terintegrasi dengan baik. Tetapi pendekatan ini mengharuskan pemasok

data untuk mengirimkan data tepat pada waktunya agar tetap konsisten dengan

pemasok lainnya. Disamping itu pengguna hanya dapat mengambil data dari

pusat pengumpulan saja dan tidak dapat secara langsung berhubungan dengan

pemasok datanya sendiri.

Adapun kekurangan dari sistem ini adalah biaya pemeliharaan yang besar

atas pengumpulan data yang demikian besar dan waktu untuk membangun sistem

ini lama.

25

2.4.3 Anatomi Data Warehouse Terdistribusi

Gambar 2.7 Data Warehouse Terdistribusi

Pada gambar 2.7 maka dapat dijelaskan bahwa Data warehouse

terdistribusi memiliki konsep data warehouse gateway, yang berfungsi sebagai

jembatan antar lokasi data warehouse dengan workstation yang bersistem beda.

Dimana memungkinkan pengguna untuk langsung mengakses sumber data yang

berbeda di luar lokasi perusahaan (eksternal).

Keunggulan yang dimiliki pendekatan ini adalah memungkinkan tiap

departmen atau divisi membangun pengumpulan data fungsionalnya masing-

masing, atau bahkan sistem operasionalnya, dan memadukan bagian-bagian

tersebut dengan teknologi client / server.

Kerugian dari pendekatan ini memerlukan biaya yang sangat besar karena

setiap sistem pengumpulan data fungsional dan sistem operasinya dikelola secara

Data Warehouse

Gateway

Workstation

Workstation

Source

Source

Source

26

terpisah. Metode ini akan sangat efektif apabila data telah tersedia dalam bentuk

yang konsisten.

2.5 Karakteristik Data Warehouse

Menurut Inmon (2002, pp31-pp35) data warehouse memiliki

karakteristik sebagai berikut:

Subject Oriented

Data warehouse disusun berdasarkan subjek-subjek atau entity

(fungsi bisnis) yang ada didalam sebuah organisasi, bukan berorientasi

pada data transaksi .Hal ini merefleksikan kebutuhan untuk menyimpan

data pendukung keputusan daripada data transaksi.

Time Variant

Data warehouse menggunakan time stamp untuk mempresentasikan

data history. Dimensi waktu penting untuk mengidentifikasi trend,

memprediksikan operasi yang akan datang, dan men-setting target operasi.

Data dalam data warehouse akan menjadi akurat dan valid pada beberapa

interval waktu tertentu (seperti tahun, dekade).

Integrated

Data operasional yang berasal dari berbagai macam database dan sumber

data eksternal di data warehouse digunakan untuk membuat keputusan.

Data operasional tersebut membutuhkan suatu konsistensi penamaan,

penggabungan format data dan perbandingan skala antara database dan

sumber data eksternal. Hal ini menyebabkan data tersebut tidak konsisten,

karena data warehouse menggabungkan berbagai data tersebut, makanya

27

kita harus mengintegrasikannya terlebih dahulu. Data disimpan sebagai

satu kesatuan tunggal, bukan sebagai kumpulan file yang berbeda dalam

pengelompokan data.

Non Volatile

Pada kenyataannya data pada data warehouse tidak boleh di update tetapi

di refresh dari sistem operasional dalam basis regular. Jadi hanya

menambah data baru, data yang lama tetap ada tidak dihapus.

2.6 Alat Perancangan Data Warehouse

Adapun alat perancangan data warehouse menurut Vidette Poe (1996,

pp120-pp121 ) adalah star schema (skema bintang). Yakni struktur sederhana

yang terdiri dari beberapa tabel yang saling terhubung dan terdefinisikan dengan

baik. Skema bintang terdiri dari 2 jenis tabel, yaitu tabel fakta dan tabel dimensi.

Tabel fakta terkadang disebut sebagai major table, tabel yang berisi data fakta

tentang bisnis. Sedangkan tabel dimensi, terkadang disebut minor table, yang

berukuran lebih kecil dan gambaran data yang merefleksikan dimensi bisnis.

28

2.6.1 Skema Bintang

Menurut Connolly (2002, p1079), “Star Schema is a logical structure that

has a fact table containing factual data in teh center, surrounded by dimensio

tables containing reference data (which can be denormalized)” Yang memiliki

pengertian struktur logical yang memiliki tabel fakta yang mengandung data

yang bersifat fakta ditengah dan beberapa tabel kecil (disebut tabel dimensi /

dimension table), yang berisi data references yang mengelilingi tabel pusat (yang

dapat di denormalisasi).

2.6.2 Jenis Skema Bintang

2.6.2.1 Skema Bintang Sederhana

Menurut Vidette (1996, p124) pada skema bintang sederhana ini setiap

tabel baik tabel dimensi maupun tabel fakta harus mempunyai primary key.

Dimana primary key tersebut akan membuat setiap record-nya menjadi unik.

Yang menjadi primary key pada tabel fakta adalah foreign key, yang dapat

berjumlah lebih dari satu.

Pada gambar dibawah terlihat hubungan antara satu tabel fakta dengan

tiga tabel dimensi. Tabel fakta memiliki primary key yang terdiri dari tiga

foreign key yaitu kunci 1, kunci 2, dan kunci 3. Terjadi hubungan one to many

antara primary key pada tabel dimensi dengan foreign key pada tabel fakta.

29

Gambar 2.8 Skema Bintang Sederhana

2.6.2.2 Skema Bintang Dengan Beberapa Tabel Fakta

Menurut Vidette (1996, p131) skema bintang dengan beberapa tabel fakta

ini merupakan skema bintang yang bisa terdiri dari beberapa fakta atau lebih dari

satu tabel fakta. Hal ini dapat terjadi karena tabel fakta tersebut berisi kenyataan

yang tidak saling berhubungan. Skema bintang dengan banyak fakta dapat dilihat

pada gambar dibawah ini.

30

Gambar 2.9 Skema Bintang Dengan Beberapa Tabel Fakta

2.6.2.3 Skema Bintang Dengan Tabel Dimensi Tambahan

Skema bintang dengan tabel dimensi tambahan ini merupakan

skema bintang yang bisa memiliki tabel dimensi tambahan. Dimana tabel

dimensi yang ada mengandung foreign key yang mereferensikan primary

key di tabel dimensi yang lain. Tabel yang direferensikan ini dinamakan

outboard atau secondary dimension table.

Gambar 2.10 Skema Bintang Dengan Tabel Dimensi Tambahan

2.1.1.1 Skema Snowflake

Menurut Connolly (2002, p1080), “snowflake schema is a variant of the

star schema where dimension table do not contain denormalized data”. Yang

berarti skema snowflake adaalah bentuk lain dari skema bintang, dimana tabel

dimensi tidak mengandung data yang didenormalisasi. (lihat gambar 2.10)

Ciri – ciri Snowflake adalah :

• Pada level atribut, tabel dimensi didenormalisasi

• Setiap dimensi memilki satu kunci untuk setiap tingkatan pada hierarki

dimensi

• Tabel dimensi dihubungkan dengan tabel fakta dan tabel atribut ayng

memiliki tingkatan rendah oleh kunci yang bertingkat rendah

Gambar 2.11 Skema bintang Snowflake

2.1.2 Keuntungan Skema Bintang

Menurut Connolly (2002, pp1081-pp1082), ada beberapa keuntungan

menggunakan skema bintang dan snowflake yaitu :

1. Efisiensi, Lebih efisien dalam mengakses data karena struktur database yang

konsisten

2. Skema bintang mampu beradaptasi terhadap perubahan kebutuhan pengguna.

3. Respon data lebih cepat daripada perancangan database operasional.

4. Extensibility, dimana mempermudah dalam hal modifikasi / pengembangan

data warehouse yang terus-menerus.

5. Kemampuan untuk menggambarkan situasi bisnis pada umumnya, pendekatan

standar untuk menangani situasi umum di dunia bisnis terus bertambah.

33

2.7 Normalisasi vs Denormalisasi

2.7.1 Normalisasi

Menurut Connolly (2002, p376), “Normalisasi is a technique for

producing a set of relation with desirable properties, given the data

requirements of an enterprise”, yang memiliki pengertian suatu teknik untuk

menghasilkan sekumpulan relasi dengan properti yang diinginkan, memenuhi

kebutuhan data pada perusahaan. Adapaun tujuan utama dari normalisasi adalah

untuk menghilangkan redundancy atau ketergantungan data. Normalisasi

memiliki lima tingkatan, namun demikian yang sering digunakan adalah tiga

tingkatan pertama. Tingkatan – tingkatan tersebut antara lain:

Unnormalized Form (UNF)

Merupakan suatu tabel yang berisikan satu atau lebih group yang berulang.

Dibuat dengan memindahkan semua data dari sumber informasi kedalam

format tabel baris dan kolom.

1. First Normal Form (1NF)

Merupakan sebuah relasi dimana setiap irisan antara baris dan kolom

berisikan satu dan hanya satu nilai. Bentuk ini dapat dicapai dengan

memindahkan group yang berulang. Bentuk 1NF ini digunakan untuk

menghilangkan repeating group (functional dependency).

2. Second Normal Form (2NF)

Merupakan sebuah relasi dalam 1NF dan setiap atribut non primary key

bersifat fully functionally dependency pada primary key. Bentuk 2NF ini

digunakan untuk menghilangkan partial dependency.

34

3. Third Normal Form (3NF)

Sebuah relasi dalam 1NF dan 2NF dimana tidak terdapat atribut non primary

key yang bersifat transitive dependency pada primary key. Bentuk 3NF ini

digunakan untuk menghilangkan transitive dependency.

4. Fourth Normal Form (4NF)

Dimana tingkatan pada normalisasi ini sangat jarang terjadi. Normalisasi ini

dilakukan bila ada atribut yang bersifat multivalue dependency (memiliki

nilai lebih dari 1)

5. Fifth Normal Form (5NF)

Normalisasi ini dilakukan dengan membuang join dependency. Tingkatan

pada normalisasi ini sangat jarang terjadi

2.7.2 Denormalisasi

Denormalisasi merupakan penggabungan tabel untuk meningkatkan unjuk

kerja (performance) yang ada. Hal ini merupakan sebuah proses yang melanggar

peraturan struktur normalisasi bentuk ketiga. Alasan perlu dilakukannya

denormalisasi oleh setiap perancang adalah:

• Untuk mengurangi jumlah hubungan yang terjadi antara tabel-tabel dimana

hubungan ini harus mengalami proses pada waktu dilakukan pencarian. Dengan

cara ini, maka performance database dapat ditingkatkan.

• Untuk membuat struktur fisik database semakin mendekati model dimensi

pemakai. Pembuatan struktur tabel sesuai dengan yang ingin ditanyakan oleh

pemakai. Memungkinkan terjadinya akses langsung, yang sekali lagi akan

meningkatkan performance.

35

2.8 Tahapan Perancangan Data Warehouse

Menurut Vidette Poe, dalam merancang data warehouse dapat

menggunakan tahapan SDLC (System Development Life Cycle) yang meliputi

beberapa fase berikut ini :

a. Planning (Perencanaan)

Sangat penting untuk melakukan perencanaan sebelum memulai

untuk mengembangkan suatu proyek termasuk dalam

mengembangkan proyek data warehouse. Perencanaan untuk data

warehouse lebih difokuskan pada hal-hal berikut ini:

• Mendefinisikan ruang lingkup (scope) dari proyek

• Membuat rencana proyek

• Mendefinisikan sumber-sumber apa saja yang dibutuhkan baik

internal maupun eksternal

• Mendefinisikan tugas-tugas dan tujuan-tujuannya

• Mendefinisikan batasan waktu (timelines )

• Mendefinisikan tujuan akhir dari proyek yang dibuat

b. Gathering data requirements and modeling (mengumpulkan

permintaan data dan membuat model)

Pada fase ini lebih difokuskan pada kebutuhan bisnis dan

permintaan akan data dari pengguna. Fase ini dapat dilakukan kurang

lebih dalam empat hingga enam minggu tetapi tidak lebih dari

sepuluh minggu. Jika proyek yang dikerjakan terlalu lama, maka

36

ruang lingkup dari proyek tersebut harus dipecah menjadi fase yang

lebih kecil lagi.

Gathering data requirements (mengumpulkan permintaan akan

data)

• Bagaimana user melakukan bisnisnya.

• Bagaimana performa user dapat diukur.

• Atribut apa saja yang dibutuhkan user.

• Apa saja hirarki dari bisnis tersebut.

• Data yang digunakan user sekarang dan data apa yang

kemudian mereka inginkan

• Pada tingkat apa user menggunakan detail atau summary

Data modeling (membuat model data)

• Data model logika meliputi seluruh ruang lingkup

dari pengembangan proyek termasuk relationship,

cardinaliy, attribute dan candidate key.

• Model bisnis dimensional yang menggambarkan

fakta, dimensi, hirarki, relationship dan candidate

key untuk semua ruang lingkup dari pengembangan

proyek.

37

c. Physical database design and development (perancangan database

fisikal dan pengembangannya)

pada fase ini mencakup perancangan database dan denormalisasi.

Fase ini juga mendukung untuk dilakukannya DSS (Decision Support

System) dan pengembangannya. Pada fase perancangan database

akan difokuskan pada:

• Perancangan database yang meliputi tabel fakta, tabel

relationship dan deskripsi dari tabel look up.

• Denormalisasi data

• Pengidentifikasian key

• Membuat strategi pengindeksan

• Membuat objek database yang sesuai

Pada tahapan ini sangat penting diperlukan pemahaman tentang:

Konsep pengambilan keputusan

Konsep hirarki, dimensi dan fakta

Pembuatan skema bintang

Dalam perancangan database untuk data warehouse, diperlukan

informasi yang luas dan lebih detail, yang akan membantu dalam

proses ini, tahapan yang dilakukan:

Pengembangan strategi agregasi

Pengembangan strategi partisi

Pengembangan perkiraan kapasitas

38

d. Data mapping and transformation (pemetaan data dan transformasi)

Fase ini tergolong cukup canggih dan meliputi sumber dari data

dalam sistem operasional, melakukan analisis untuk memahami tipe

dari data transformasi yang dibutuhkan, dan pemetaan sumber data ke

tujuan data warehouse pada perancangan database. Dalam fase ini,

hal yang harus dilakukan adalah :

• Mendefinisikan sumber sistem.

• Menentukan layout dari file.

• Melakukan pengembangan spesifikasi dari transformasi yang

tertulis untuk transformasi yang canggih

• Memetakan sumber ke tujuan

• Meninjau ulang kemampuan perencanaan

e. Data extraction and load (pengambilan data dan pengisian data)

Proses utuh dari mengekstraksi, transformasi dan loading data ke

dalam database tujuan akan sering dilakukan dengan bantuan dari

teknologi transformasi data. Dengan menggunakan tool data

transformasi akan mempengaruhi waktu dari fase siklus hidup dan

mendukung tugas dan tujuannya. Fokus pada fase ini adalah :

• Mengembangkan prosedur untuk mengekstrak dan

memindahkan data

• Mengembangkan prosedur untuk mengload data ke dalam

warehouse

39

• Mengembangkan program atau menggunakan tool transformasi

data untuk mentransformasi dan mengintegrasi data

• Mencoba ekstraksi, transformasi dan meload prosedur

f. Automating the data management process (mengotamasi proses

manajemen data)

Fase ini lebih terfokus pada otomasi pengekstraksian,

transformasi dan load data warehouse. Seperti yang dijelaskan

berikut ini:

• Mengotomasi dan menjadwalkan proses ekstraksi data

• Mengotomasi dan menjadwalkan proses transformasi data

• Mengotomasi dan menjadwalkan proses loading data

• Membuat backup dan merecovery prosedur

• Melaksanakan full test dari semua prosedur yang diotomasi

g. Application development – creating the starter set of reports

(pengembangan aplikasi – membuat penetapan awal untuk laporan)

Pengembangan aplikasi dapat langsung dilakukan setelah kita

melakukan pengujian pada data. Pengembangan aplikasi DSS

biasanya dilakukan dengan menggunakan tool pengaksesan data.

Pada fase ini biasanya aplikasi dibuat dengan menuliskan coding

Visual Basic tentu saja dengan memperhitungkan berapa lama waktu

yang dibutuhkan untuk mengembangkannya.

Hal yang termasuk di dalamnya, antara lain :

40

• Membuat set awal dari laporan yang telah didefinisikan

sebelumnya

• Mengembangkan laporan utama

• Menguji laporan

• Membuat dokumentasi dari aplikasi

• Mengembangkan jalur navigasi

h. Data validation and testing (validasi data dan pengujian)

Pada fase ini aplikasi yang telah dihubungkan dengan data

warehouse harus dilakukan validasi data dan testing. Yang didahului

dengan proses ektraksi data, transformasi data dan loading data.

i. Training

Pada fase ini, pihak perusahaan memberikan pelatihan kepada

semua staff yang hendak memakai aplikasi ini. Untuk mendapatkan

value sesungguhnya dari bisnis, semua user dalam perusahaan harus

dilatih dalam hal :

• Ruang lingkup data warehouse

• Tool untuk pengaksesan pada front end dan bagaimana cara

kerjanya

• Aplikasi DSS dan set awal dari report yang digunakan

• Training yang akan membantu user dalam mengunakan sistem

yang akan diterapkan dalam perusahaan

41

j. Rollout

Fase terakhir dalam SDLC dilakukan untuk menyebarkan data

warehouse kita kepada komunitas user yang akan menggunakannya.

Hal yang termasuk di dalamnya:

• memasang infrastruktur yang mendukung semua user.

Misalnya komponen yang digunakan dalam LAN atau WAN.

• Memperkenalkan aplikasi DSS

• Membuat stuktur bantuan yang dapat digunakan oleh user

• Membuat prosedur untuk menambah laporan baru dan

memperluas aplikasi DSS

• Membuat prosedur untuk membackup aplkasi DSS, tidak

hanya untuk data warehouse

• Membuat prosedur untuk investigasi dan memecahkan

permasalahan integrasi data.

2.9 Tahapan Perancangan Sistem

Berdasarkan Pressman (2001, pp29-pp30) model linier sequensial yang atau

yang dikenal dengan model waterfall dibagi menjadi empat tahapan utama

seperti yang dapat dilihat pada gambar di bawah ini (gambar 2.12).

42

Gambar 2.12 Model Waterfall

Berdasarkan pada Gambar 2.12 maka dapat dijelaskan sebagai berikut:

1. Analisis

Proses mengumpulkan kebutuhan difokuskan untuk pengembangan

software. Untuk memahami program yang hendak dibuat, maka seorang

analis harus memahami domain dari informasi yang akan digunakan untuk

software, seperti halnya fungsi yang dibutuhkan, kelakuan, kinerja, dan

antarmuka. Hasil analisa kebutuhan ini didokumentasikan dan di evaluasi

oleh customer / user.

2. Desain

Desain software adalah multi proses yang berfokuskan pada empat atribut

utama dari program, yaitu : struktur data, arsitektur software, representasi

antarmuka, dan detail algoritma / prosedur. Proses desain mengubah

kebutuhan menjadi suatu representasi software yang dapat dievaluasi untuk

kualitas sebelum proses coding. Proses desain ini juga harus

didokumentasikan dan menjadi bagian dari konfigurasi software.

3. Coding

43

Pada tahapan ini desain diterjemahkan ke dalam suatu bahasa

pemrograman yang dipahami oleh mesin. Jika desain dilakukan secara

terperinci, maka coding dapat dilakukan secara mekanis.

4. Testing

Setelah coding telah selesai, maka dilakukan testing program. Proses

testing difokuskan pada logika internal dari software untuk memastikan

bahwa setiap pernyataan yang ada telah diuji, dan juga fungsional eksternal

untuk menemukan kesalahan yang ada dan untuk memastikan bahwa input

yang diberikan akan menghasilkan output yang benar.

5. Support

Tahapan ini tidak harus ada, karena setelah software diserahkan pada

costumer / user, besar kemungkinan software akan mengalami perubahan /

perbaikan. Perubahan terjadi karena adanya kesalahan, karena software harus

dapat mengakomodasikan perubahan pada lingkungan eksternal, atau karena

perubahan kebutuhan user. Software support / perawatan dapat mengulang

tiap tahapan fase / langkah yang ada.

2.10 Makro Ekonomi

Menurut Sadono, makro ekonomi adalah gambaran mekanisme kerja

perekomian secara keseluruhan. Hubungan yang terdapat dalam makro ekonomi

44

adalah hubungan kausal / sebab-akibat antar variabel-variabel secara

keseluruhan. Berikut ini adalah beberapa tersebut antara lain:

• Sektor Rumah Tangga

Pada sektor rumah tangga, kebutuhan energinya dihitung

berdasarkan laju pertumbuhan jumlah rumah tangga dan tingkat

pemakaian energi yang didasarkan pada pertumbuhan GDP.

Kebutuhan energi ini dipakai untuk memasak, penerangan dan

peralatan-peralatan.

• Sektor Industri dan Komersial

Sektor industri dianalisis secara sektoral, antara lain menurut

inustri-industri logam dasar, semen, pupuk, kimia, kertas, gula dan non-

metalik.

• Sektor Transportasi

Pada sektor transportasi yang saat ini menduduki peringkat

kertiga dalam mengkonsumsi energi setelah sektor rumah tangga dan

sektor industri, pertumbuhan pemakaian energinya dipengaruhi oleh laju

pertumbuhan penduduk dan tingkat perekonomian nasional.

Analisis – analisis makro ekonomi menerangkan tentang :

i. Pentingnya segi permintaan dalam menentukan tingkat kegiatan dalam

perekonomian.

45

ii. Pentingnya kebijakan dan campur tangan pemerintah untuk mewujudkan

prestasi kegiatan ekonomi di tingkat yang dikehendaki

2.10.1 Isu – Isu Utama Dalam Analisis Makro Ekonomi

Makro ekonomi membahas isu-isu penting yang selalu dihadapi sesuatu

perekonomian. Analisisnya berusaha memberi jawaban kepada pertanyaan –

pertanyaan yang muncul. Pertanyaan tersebut meliputi ;

a. Mengapa pertumbuhan ekonomi tidak selalu teguh?

b. Mengapa kegiatan perekonomian tidak berkembang dengan stabil?

c. Mengapa pengangguran dan kenaikan harga – harga selalu berlaku.

Selain menjelaskan tentang keadaan yang menciptakan masalah

perekonomian yang terjadi, analisis ekonomi juga menjelaskan langkah-langkah

yang dapat digunakan untuk mengatasi masalah-masalah tersebut, antara lain;

1. Penentuan kegiatan ekonomi

Analisis ini menunjukkan bagaimana pengeluaran agregat (permintaan agregat)

dan penawaran agregat akan menentukan titik keseimbangan kegiatan sesuatu

perekonomian.

Dalam suatu perekonomian modern, komponen dari pengeluaran agregat

dibedakan menjadi 4 golongan :

a. Pengeluaran konsumsi rumah tangga

b. Investasi perusahaan-perusahaan

46

c. Pengeluaran konsumsi dan investasi pemerintah

d. Ekspor (pembelian baranag buatan dalam negeri oleh penduduk

negara-negara lain)

2. Masalah dan kebijakan makro ekonomi

Salah satu aspek penting dari ciri kegiatan perekonomian yang menjadi titik tolak

analisis dalam teori makro ekonomi adalah pandangan bahwa sistem pasar bebas

tidak dapat mewujudkan :

a. Penggunaan tenaga kerja penuh

b. Kestabilan harga-harga

c. Pertumbuhan ekonomi yang teguh

Setiap perekonomian akan selalu menghadapi masalah pengangguran, kenaikan

harga – harga, dan pertumbuhan ekonomi yang tidak teguh. Dari permasalahan

yang muncul tersebut, maka pemerintah menetapkan kebijakan-kebijakannya,

yakni ;

1. Kebijakan fiskal

Langkah pemerintah dalam perpajakan dan pengeluaran, meliputi:

Jenis – jenis pajak :

• Pajak langsung

47

Pajak yang dibayarkan langsung oleh pihak yang wajib membayar

pajak.

• Pajak tak langsung

Pajak yang bebannya boleh dipindah pindahkan pada pihak lain,

contoh: pajak impor.

Jenis – jenis pengeluaran :

• Pengeluaran konsumsi rumah tangga

Nilai perbelanjaan yang dilakukan oleh rumah tangga untuk membeli

berbagai jenis kebutuhannya dalam satu tahun tertentu.

• Pengeluaran pemerintah

Biaya yang digunakan pemerintah untuk kepentingan masyarakat.

Misalnya; fasilitas pendidkan dan kesehatan, biaya penegembagan

infrastruktur

2. Kebijakan moneter

Mengatur penawaran uang dan tingkat suku bunga. Kebijakan moneter

dibedakan menjadi 2, yakni :

• Kebijakan moneter kualitatif

Merupakan kebijakan yang bersifat melakukan kebijakan terpilih ke

atas beberapa aspek dari masalah moneter yang dihadapi pemerintah,

meliputi kegiatan ;

i. Operasi pasar terbuka

ii. Mengubah tingkat bunga dan tingkat diskonto

iii. Mengubah tingkat cadangan minimum

48

• Kebijakan moneter kuantitatif

Suatu kebijakan umum yang bertujuan untuk memperngaruhi jumlah

penawaran uang dan tingkat bunga dalam perekonomian, meliputi;

i. Pengawasan pinjaman secara selektif

ii. Pembujukan moral

2.10.2 Istilah Yang Ada Dalam Makro Ekonomi

1. Inflasi

Suatu proses kenaikan harga-harga yang berlaku dalam suatu perekonomian

2. Pendapatan nasional

Disebut juga produk nasional, memiliki arti nilai barang atau jasa yang

diproduksi di suatu negara dalam suatu tahun tertentu.

3. Produk Nasional Bruto (PNB)

Produk nasional yang diwujudkan oleh warganegara suatu negara pada suatu

tahun tertentu.

4. Produk Domestik Bruto (PDB)

Produk nasional yang diwujudkan oleh warganegara suatu negara pada suatu

tahun tertentu.

5. Gross Domestic Product (GDP)

Nilai barang dan jasa dalam suatu negara yang diproduksi oleh faktor-faktor

produksi milki warganegara negara tersebut dan negara asing.

6. Gross National Product (GNP)

49

Memiliki konsep yang sama dengan GDP, tetapi GNP memperkirakan jenis-

jenis pendapatan yang sedikit berbeda.

2.11 Metode Fact Finding

Menurut Connolly (2002, pp305-pp308) Fact finding adalah proses

formal penggunaan teknik seperti wawancara dan kuesioner untuk

mengumpulkan fakta tentang sistem, kebutuhan dan apa yang dikehendaki. Ada

5 teknik fact finding yang biasa digunakan :

• Pemeriksaan dokumen

Cara ini dapat berguna saat sistem membutuhkan perkembangan dan

dilakukan dengan menjadikan dokumen – dokumen yang berhubungan

dengan sistem sebagai bahan referensi.

• Wawancara

Wawancara adalah cara yang paling umum digunakan, dan biasanya yang

paling berguna. Dengan wawancara, pemberi respon dapat menjawab dengan

bebas dan terbuka.

• Observasi

Observasi adalah cara yang efektif untuk memahami sistem. Dengan teknik

ini, dimungkinkan untuk ikut berpartisipasi atau menyaksikan aktifitas yang

dilakukan untuk mempelajari sistem.

50

• Penelitian

Cara ini berguna untuk meneliti aplikasi dan masalah. Jurnal, buku referensi,

dari internet adalah sumber informasi yang baik.

• Kuesioner

Kuesioner adalah dokumen yang dibuat untuk mengumpulkan fakta dari

sejumlah besar orang dengan membuat control tertentu pada respon mereka.

2.12 Kerangka Berpikir

Kerangka berpikir merupakan gambaran secara sistematis mengenai

kaitan antar variabel yang diteliti untuk mengembangkan suatu sistem. Adapun

teknik yang digunakan untuk memcahakan masalah, yaitu dengan analisis

kebutuhan dengan metode fact finding.

51

Berikut ini metode dalam melakukan perancangan data warehouse makro

ekonomi pada BPPT - P3TKKE :

Gambar 2.13 Kerangka Berpikir

Analisis dan Perancangan Data Warehouse Makro Ekonomi BPPT-P3TKKE

Studi Kepustakaan Tentang Data Warehouse

Mencari Analisis Kebutuhan dari Sistem yang ada

Studi sistem yang sedang berjalan pada Makro ekonomi

BPPT-P3TKKE

Perancangan Data Warehouse 1. Merancang Arsitektur DWH 2. Merancang Skema Bintang 3. Menentukan Proses

Transformasi dan Metadata 4. Merancang Sistem

Keamanan

Coding 1. Microsoft SQL Server 2000 2. Visual Basic 6.0 3. Crystal report 8.5

Desain Aplikasi Data Warehouse 1. Merancang STD 2. Merancang Tampilan

Layar 3. Membuat Spesifikasi

Proses

Implementasi