bab 2 landasan teori - library.binus.ac.idlibrary.binus.ac.id/ecolls/ethesisdoc/bab2/2011-2-00972-si...

37
8 BAB 2 LANDASAN TEORI 2.1 Teori – Teori Dasar / Umum 2.1.1 Pengertian Data Warehouse dan Database Database merupakan gabungan dari sejumlah informasi yang terdapat pada masing - masing bagian aktivitas perusahaan yang membantu dalam memperbaharui database secara berkala (Molina,Widom & Jennifer, 2004) Data warehouse adalah sekumpulan data yang berorientasi pada subjek, terintegrasi, memiliki rentang waktu dan tidak mudah berubah yang mendukung proses pembuatan keputusan manajerial (Conolly & Begg, 2010). Data warehouse adalah sekumpulan data yang berorientasi pada subjek, terintegrasi, tidak mudah berubah dan memiliki rentang waktu yang dapat digunakan untuk mendukung keputusan manajerial (William, 2005) Data warehouse adalah mewakili sebuah solusi untuk meningkatkan ketersediaan data dan informasi, serta akses untuk pengambilan keputusan (Bornaz, 2010).

Upload: others

Post on 11-Jan-2020

15 views

Category:

Documents


0 download

TRANSCRIPT

8

BAB 2

LANDASAN TEORI

2.1 Teori – Teori Dasar / Umum

2.1.1 Pengertian Data Warehouse dan Database

Database merupakan gabungan dari sejumlah informasi yang

terdapat pada masing - masing bagian aktivitas perusahaan yang

membantu dalam memperbaharui database secara berkala

(Molina,Widom & Jennifer, 2004)

Data warehouse adalah sekumpulan data yang berorientasi pada

subjek, terintegrasi, memiliki rentang waktu dan tidak mudah berubah

yang mendukung proses pembuatan keputusan manajerial (Conolly &

Begg, 2010).

Data warehouse adalah sekumpulan data yang berorientasi pada

subjek, terintegrasi, tidak mudah berubah dan memiliki rentang waktu

yang dapat digunakan untuk mendukung keputusan manajerial (William,

2005)

Data warehouse adalah mewakili sebuah solusi untuk

meningkatkan ketersediaan data dan informasi, serta akses untuk

pengambilan keputusan (Bornaz, 2010).

9

Jadi bisa disimpulkan bahwa data warehouse mempunyai data

terintegrasi antara data yang satu dengan data yang lainnya didalam suatu

perusahaan yang bersifat tidak mudah berubah sehingga akan mendukung

suatu proses pembuatan keputusan di dalam perusahaan. Selain itu data

warehouse juga memiliki rentang waktu.

2.1.2 Karakteristik Data Warehouse

Karakteristik data warehouse yaitu subject-oriented, integrated, non-

volatile, time variant (Kimball & Ross, 2004)

- Subject Oriented

Sistem informasi klasik berorientasi pada aplikasi fungsional

perusahaan. Untuk perusahaan asuransi contohnya : aplikasinya

dapat berupa healthty, life, auto, casualty. Subjek dari sistem

informasi-nya claim, customer, policy dan premium.

Gambar 2.1 Data Warehouse Subject Oriented

(Sumber : (Kimball & Ross, 2004)p30)

10

- Integrated

Data diambil dari banyak sumber berbeda kemudian dimasukkan ke

dalam data warehouse. Selama data diambil, data tersebut diubah,

dilakukan format kembali, diurutkan, diringkas dan seterusnya. Hasilnya

adalah data yang terletak dalam data warehouse yang memiliki pandangan

terpadu dan terintegrasi.

Untuk menciptakan subjek area yang berguna dan sumber data yang

berasal dari banyak sistem yang berbeda, terlebih dahulu harus

diintegrasikan sebelum digabungkan ke dalam data warehouse. Sebagai

contoh : terdapat empat aplikasi yang menyimpan kode jenis kelamin

dalam database secara berbeda. Aplikasi A menyimpan kode jenis kelamin

dalam bentuk ‘m’ untuk laki-laki dan ‘f’ untuk perempuan, sedangkan

aplikasi B menyimpan jenis kelamin dalam bentuk ‘1’ dan ‘0’, aplikasi C

dalam bentuk ‘x’ dan ‘y’, aplikasi D dalam bentuk ‘male’ dan ‘female’.

Melalui proses integrasi itulah dihasilkan kode jenis kelamin yang seragam

untuk data warehouse yaitu ‘m’ dan ‘f’. Untuk lebih jelasnya lihat gambar

dibawah ini :

11

Gambar 2.2 Aspek Integrated dari data warehouse

(Sumber : (Kimball & Ross, 2004)p31)

- Non-Volatile

Data dalam lingkungan operasional di ubah secara teratur, tetapi data

pada data warehouse menunjukkan karakteristik yang berbeda. Data pada

data warehouse di load dan diakses tetapi tidak di update. Ketika data di

load pada data warehouse dalam sebuah snapshot (static format). Ketika

terjadi perubahan selanjutnya, snapshot yang baru akan ditulis.

12

Gambar 2.3 Aspek Non-volatile dari Data Warehouse

(Sumber : (Kimball & Ross, 2004), p32)

- Time Variant

Data yang tersimpan dalam data warehouse bersifat time-variant atau

bersifat akurat pada periode tertentu. Karakteristik dasar data dalam data

warehouse sangat berbeda dengan data dalam OLTP, dimana data hanya

akurat sesaat setelah data diakses, sedangkan data pada data warehouse,

data akurat selama periode waktu tertentu, maka dikatakan memiliki

rentang waktu (time variant).

Aspek yang menunjukkan karakteristik time variant dalam data

warehouseadalah sebagai berikut:

- Data warehouse mempresentasikan data untuk kurun waktu 5-10 tahun.

Sedangkan pada OLTP mempresentasikan data untuk jangka waktu yang

lebih singkat mulai 60-90 hari, karena pada OLTP, aplikasi yang digunakan

harus memiliki response time yang singkat maka data yang diproses harus

optimal.

13

- Secara implisit maupun eksplisit, setiap struktur data pada data warehouse

mengandung elemen waktu seperti hari, minggu, bulan, dan sebagainya.

Elemen waktu ini hampir selalu menjadi dasar yang mengintegrasikan data

dalam data warehouse.

- Data pada data warehouse merupakan serangkaian snapshot, yaitu potongan

data yang dikelompokkan sesuai dengan urutan waktu.

Gambar 2.4 Time Variant antara Data Operasional dan Data

Warehouse (Sumber : (Kimball & Ross, 2004),p32)

2.1.3 Struktur Data Warehouse

Dalam struktur data warehouse terdapat older level of detail, current

level of detail, level of summarized data (level data mart) dan level of

highly summarized data. Aliran data (data flow) di data warehouse

berasal dari lingkungan operasional. Biasanya transformasi signifikan

terjadi dari data yang ada di level operasional menuju ke level data

warehouse. (Kimball & Ross, 2004)p33).

14

1. Current Detail Data

Current Detail Data menggambarkan data detil yang aktif pada

saat ini dan keadaan yang sedang berjalan. Data jenis ini

memerlukan media penyimpanan yang besar dan merupakan data

yang sering diakses. Current Detail Data ini cepat diakses, tetapi

mahal dan kompleks dalam pemeliharaannya.

2. Older Detail Data

Older detail data merupakan data back-up (cadangan)

yang jarang diakses. Data back-up seperti ini biasanya disimpan

pada media penyimpanan yang berbeda. Penyusunan direktori

dilakukan berdasarkan urutan umur data, sehingga data dapat

tersusun rapi dan mempermudah dalam melakukan akses

selanjutnya.

3. Lightly Summarized Data

Lightly summarized data merupakan data ringkasan dari

Current detail data. Di dalam tahap ini, data belum dapat

digunakan untuk pengambilan keputusan karena data masih

belum bersifat total summary, yang artinya data masih bersifat

detil. Akses terhadap data jenis ini biasanya digunakan untuk

memantau kondisi yang sedang dan sudah berjalan.

15

4. Highly Summarized Data

Highly summarized data merupakan data yang bersifat

total summary. Pada level ini, data sangat mudah diakses terutama

untuk melakukan analisis perbandingan data berdasarkan urutan

waktu dan analisis yang menggunakan data multidimensi. Data

multidimensi adalah suatu teknologi software komputer yang

dirancang untuk meningkatkan efisiensi dalam query data

sehingga menjadi media penyimpanan yang lebih baik, serta

memudahkan pengambilan data dalam volume besar.

Gambar 2.5 Struktur Data Warehouse

(Sumber : (Kimball & Ross, 2004)p34).

16

5. Metadata

Menurut (Kimball & Ross, 2004)p393), metadata adalah data mengenai

deskripsi dari struktur, isi, kunci, indeks dan lain-lain mengenai data.

Menurut (Kimball & Ross, 2004)p269-270), hal-hal penting dari metadata

meliputi:

- ID dokumen

- Tanggal memasukkan data ke warehouse

- Deskripsi dari dokumen

- Sumber dari dokumen

- Tanggal sumber dari dokumen

- Klasifikasi dokumen

- Indeks

- Lokasi fisikal

- Panjang dokumen

- Referensi yang terhubung dengan dokumen

Syarat-syarat dalam pembuatan metadata menurut(Kimball & Ross, 2004)p102):

- Struktur data yang dikenal programmer

- Struktur data yang dikenal analis DSS

- Sumber data yang membantu data warehouse

- Transformasi data ketika dilewatkan ke data warehouse

- Model data

- Hubungan antara model data dan data warehouse

17

- History dari extracts.

2.1.4 Anatomi Data Warehouse

1. Data Warehouse Fungsional

Data warehouse fungsional menggunakan pendekatan kebutuhan dari tiap bagian

fungsi bisnis, misalnya departemen, divisi, dan sebagainya, untuk mendefinisikan

jenis data yang ditampung oleh sistem. Setiap unit fungsi dapat memiliki gambaran

data masing-masing.

Pendekatan ini banyak digunakan karena sistem memberikan solusi ang mudah

untuk dibangun dengan biaya investasi yang relatif rendah dan dapat memberikan

kemampuan sistem pengumpulan data yang terbatas kepada kelompok pemakai.

Penerapan jenis sistem pengumpulan data seperti ini beresiko kehilangan

konsistensi data di luar lingkungan fungsi bisnis bersangkutan. Bila lingkup

pendekatan ini diperbesar dari lingkungan fungsional menjadi lingkup organisasi,

konsistensi data organisasi tidak lagi dapat dijamin.

Gambar 2.6 Data Warehouse Fungsional

Sumber :(http://myhut.org/public/datawarehouse.doc)

18

2. Centralized data warehouse

Data warehouse terpusat adalah pendekatan yang paling baik digunakan,

disebabkan oleh keterbiasaan pemakai dengan lingkungan mainframe terpusat. Data

diambil dari seluruh sistem operasional dan disimpan di dalam pusat penyimpanan

data. User kemudian menggunakan data yang telah terkumpul tersebut untuk

membangun data warehouse fungsional masing-masing sesuai dengan

kebutuhannya.

Keuntungan sistem ini dibanding data warehouse fungsional adalah bahwa data

benar-benar terpadu. Sistem ini mengharuskan data dikirim tepat pada waktunya

agar tetap konsisten dengan pemasok data lainnya. Di samping itu, user hanya dapat

mengambil data dari pusat pengumpulan saja dan tidak dapat berhubungan secara

langsung dengan pemasok datanya sendiri.

Penerapan sistem ini membutuhkan biaya pemeliharaan yang tinggi atas sistem

pengumpulan data yang besar. Selain ini diperlukan waktu yang lama untuk

membangun sistem tersebut.

Gambar 2.7 Centralized Data Warehouse

(http://abstractinnovations.co.uk/businesssolution/datawarehousing.aspx)

19

2.1.5 Keuntungan Data Warehouse

Data warehouse yang telah diimplementasikan dengan baik dapat

memberikan keuntungan bagi organisasi, yaitu: (Conolly & Begg,

2010)p1198).

- Nilai kembali investasi yang berpotensi tinggi

Sebuah organisasi harus mengeluarkan sumber daya dalam jumlah

yang cukup besar untuk memastikan bahwa data warehouse telah

diimplementasikan dengan baik.

- Keuntungan kompetitif

Pengambilan investasi yang besar untuk organisasi yang sukses

mengimplementasikan data warehouse menjadi bukti besarnya

keuntungan kompetitif yang menyertai teknologi ini. Keuntungan

kompetitif akan didapatkan jika pengambil keputusan mengakses data

yang dapat mengungkapkan informasi yang sebelumnya tidak diketahui

atau tidak tersedia, misal informasi mengenai trend, konsumen, dan

permintaan.

- Meningkatkan produktivitas dari para pengambil keputusan organisasi.

Data warehouse meningkatkan produktivitas para pengambil keputusan

organisasi dengan menciptakan sebuah database yang terintegrasi secara

konsisten, berorientasi subjek dan data historis. Data warehouse

mengintegrasikan data dari beberapa sistem yang tidak compatible ke

20

dalam bentuk yang menyediakan satu pandangan yang konsisten dari

organisasi. Dengan mengubah data menjadi informasi yang berguna,

maka seorang manajer bisnis dapat membuat analisa yang lebih akurat

dan konsisten.

2.1.6 Metodologi Perancangan Data Warehouse

(Kimball & Ross, 2004)p161) terdapat 9 tahap metodologi dalam

membangun data warehouse yang dikenal dengan nine-step methodology yaitu:

1. Memilih proses (Choosing the process)

Proses pada subyek masalah dari data mart tertentu. Data mart

yang akan dibangun harus sesuai anggaran dan dapat menjawab

masalah-masalah bisnis yang penting.

2. Memilih Grain (Choosing the grain)

Memilih grain berarti menentukan hal yang sebenarnya

dihadirkan oleh tabel fakta. Setelah menentukan grain-grain tabel fakta,

dimensi-dimensi untuk setiap fakta dapat diidentifikasi.

3. Identifikasi dan membuat dimensi yang sesuai (Identifying and

conforming the dimensions)

Mengidentifikasi dimensi disertai deskripsi detail yang

secukupnya. Ketika tabel dimensi berada pada dua atau lebih data mart,

maka tabel dimensi tersebut harus mempunyai dimensi yang sama atau

salah satu merupakan subset dari yang lainnya. Jika suatu tabel dimensi

21

digunakan oleh lebih dari satu data mart, maka dimensinya harus

disesuaikan.

4. Memilih Fakta (Choosing the facts)

Memilih fakta yang akan digunakan dalam data mart. Semua

fakta harus ditampilkan pada tingkat yang diterapkan oleh grain dan

fakta juga harus numeric dan aditif.

5. Menyimpan Pre-kalkulasi dalam Tabel Fakta (Storing pre-calculations in

the fact table)

Ketika fakta telah dipilih, maka setiap fakta tersebut harus diuji

apakah ada fakta yang dapat menggunakan pre-kalkulasi, setelah itu

lakukan penyimpanan pada tabel fakta

6. Melengkapi Tabel Dimensi (Rounding out the dimension tables)

Menambahkan sebanyak mungkin deskripsi teks pada tabel

dimensi. Deskripsi tersebut harus intuitif dan dapat dimengerti oleh

user.

7. Memilih durasi dari Database (Choosing the duration of the database)

Menentukan batas waktu dari umur data yang diambil dan akan

dipindahkan ke dalam tabel fakta. Misalnya, data perusahaan dua tahun

lalu atau lebih diambil dan dimasukkan dalam tabel fakta.

22

8. Melacak perubahan dari dimensi secara perlahan (Tracking slowly changing

dimensions)

Perubahan dimensi yang lambat menjadi sebuah masalah. Ada 3

tipe dasar dari perubahan dimensi yang lambat, yakni :

a. Perubahan atribut dimensi yang ditulis ulang.

b. Perubahan atribut dimensi yang mengakibatkan pembuatan suatu

record dimensi baru.

c. Perubahan atribut dimensi yang mengakibatkan sebuah atribut

alternative dibuat, sehingga kedua atribut tersebut yakni atribut

yang lama dan yang baru dapat diakses secara bersamaan dalam

sebuah dimensi yang sama.

9. Memutuskan prioritas dan cara query (Deciding the query priorities

and the query modes)

Mempertimbangkan pengaruh dari perancangan fisikal yang akan

mempengaruhi persepsi user terhadap data mart. Selain itu, perancangan

fisikal akan mempengaruhi masalah administrasi, backup, kinerja

pengindeksan dan keamanan.

2.1.7 Pengertian Data Mining

Data mining adalah ilmu untuk menggali informasi dari data set yang besar

dan database yang digunakan dalam proses mengelola data yang mencakup

analisa dan penentuan kesalahan (Ghencea & Immo, 2010). Data mining

merupakan teknik untuk mengekstrak pengetahuan dari informasi. Proses analsis

23

ini mempunyai peran penting dalam menentukan estimasi standar (Titan, Tudor, &

Loana, 2007). Sebuah sistem data mining pada khususnya dapat melakukan satu

tugas atau secara umum mampu melakukan banyak tugas data mining. Sebagian

besar data mining menerapkan sejumlah algoritma dan mampu melakukan

sebagian besar tugas yang pada umumnya cukup untuk memenuhi kebutuhan

pelanggan (Crisan & Androin, 2010)p47).

2.1.8 Perbandingan OLTP dengan Data Warehouse

Biasanya sebuah organisasi mempunyai beberapa sistem online

transaction proccessing (OLTP) yang berbeda untuk setiap proses bisnis, seperti

pengawasan persediaan (inventory control), pesanan pelanggan (invoicing

costumer) dan tingkat penjualan. Sistem ini menghasilkan data operasional yang

detil, terbaru dan selalu berubah. Sistem OLTP optimal jika digunakan untuk

sejumlah transaksi yang dapat diramalkan (predictable), berulang (repetitive),

dan sering diperbaharui (update intensive). Data OLTP diorganisasikan

berdasarkan syarat-syarat dari transaksi yang dihubungkan dengan aplikasi bisnis

dan mendukung keputusan perhari dalam sejumlah besar operasional user yang

konkruen.

Umumnya organisasi hanya mempunyai satu data warehouse yang

menyimpan data secara historis, detil, dan ringkasan dengan beberapa tingkatan

dan sangat jarang berubah. Data warehouse didesain untuk mendukung transaksi

yang tidak dapat diramalkan (unpredictable) dan memerlukan jawaban untuk

query khusus (ad hoc), tidak terstruktur, dan heuristic. Data warehouse

24

diorganisasikan berdasarkan pada syarat-syarat query yang potensial dan

mendukung keputusan strategis jangka panjang dari sejumlah kecil user tingkat

manajerial. (Conolly & Begg, 2010)p1198).

Di bawah ini adalah tabel perbandingan antara sistem OLTP dengan sistem data

warehouse (Conolly & Begg, 2010)p1199), yaitu :

25

Tabel 2.1 Perbandingan OLTP dan Data Warehouse

OLTP Data Warehouse

Menyimpan data-data saat ini Menyimpan data historis

Menyimpan data yang rinci Menyimpan data yang rinci, sedang,

dan ringkas

Data bersifat dinamis Data bersifat statis

Proses berulang-ulang Proses ad hoc, tidak terstruktur, dan

heuristic.

Hasil transaksi tingkat tinggi Hasil transaksi tingkat rendah sampai

menengah

Pola penggunaan dapat diprediksi Pola penggunaan tidak dapat diprediksi

Digunakan untuk transaksi Digunakan untuk analisis

Berorientasi pada aplikasi Berorientasi pada subjek

Mendukung keputusan harian Mendukung keputusan yang bersifat

strategis

Digunakan oleh banyak user

operasional

Digunakan oleh sedikit user manajerial

26

2.1.9 Arsitektur Data Warehouse

(Conolly & Begg, 2010)p1203-1207), arsitektur data warehouse

terdiri dari

1. Operational Data

Sumber data untuk data warehouse diambil dari :

- Mainframe data operasional yang menangani generasi pertama

secara hirarki dan database jaringan. Biasanya mayoritas data

operasional perusahaan disimpan di sistem ini.

- Data masing-masing departemen yang disimpan dalam sistem

file kepemilikan seperti VSAM, RMS dan relational DBMS

seperti Informix dan Oracle.

- Data internal yang tersimpan dalam work station dan server

pribadi.

- Sistem eksternal seperti internet, database komersial atau

database yang berhubungan dengan supplier dan customer.

2. Operational Datastore (ODS)

Suatu operational datastore (ODS) adalah suatu media

penyimpanan dan pengintegrasian data operasional yang digunakan

untuk analisis. ODS menyediakan data dengan cara yang sama seperti

data warehouse, tetapi sesungguhnya bertindak secara sederhana

sebagai tempat penampungan sementara sebelum data dipindahkan

ke data warehouse.

27

ODS diciptakan ketika sistem operasional ditemukan tidak

mampu untuk mencapai keberhasilan sistem pelaporan. ODS

menyediakan manfaat yang berguna dari suatu relational database

dalam mengambil keputusan yang mendukung fungsi data

warehouse.

Membangun ODS dapat membantu dalam pembuatan data

warehouse sebab suatu ODS dapat menyediakan data yang telah di-

extract dan di-cleansing dari sumber. Ini artinya proses integrasi dan

restrukturisasi data untuk data warehouse menjadi lebih sederhana.

3. Load Manager

Load manager melaksanakan semua operasi yang berhubungan

dengan pengambilan dan load data ke dalam data warehouse. Data

di-extract secara langsung dari sumber data atau dari penyimpanan

data operasional. Operasi yang dilakukan oleh load manager dapat

meliputi perubahan bentuk yang sederhana untuk mempersiapkan

data tersebut agar dapat dimasukkan ke dalam data warehouse.

4. Warehouse Manager

Warehouse manager melaksanakan semua operasi yang

berhubungan dengan manajemen data. Operasi yang dilakukan oleh

warehouse manager meliputi :

28

- Analisis data untuk memastikan konsistensi

- Transformasi dan penggabungan sumber data dari tempat

penyimpanan data sementara ke dalam table-table data

warehouse.

- Pembuatan index dan view pada table

- Melakukan denormalisasi

- Melakukan agregasi

- Melakukan backup dan mengarsip data

Dalam beberapa hal, warehouse manager juga menghasilkan profile

query untuk menentukan kesesuaian indeks dan agregasi. Suatu

profile query dapat dihasilkan baik untuk masing-masing user,

kelompok user atau data warehouse dan didasarkan pada informasi

yang menguraikan karakteristik query seperti frekuensi, target table,

dan ukuran dari hasil yang telah ditetapkan.

5. Query Manager

Query manager melaksanakan semua operasi yang berhubungan

dengan manajemen user query. Komponen ini secara khusus

dibangun menggunakan peralatan akses data end-user, peralatan

pengontrol data warehouse, fasilitas database, dan pembangunan

program. Kompleksitas query manager ditentukan oleh fasilitas yang

disajikan melalui peralatan akses para end-user database. Operasi

yang dilakukan komponen ini meliputi pengarahan query pada tabel

yang sesuai dan penjadwalan pelaksanaan query. Terkadang query

29

manager juga menghasilkan profil query yang mengijinkan

warehouse manager menentukan kesesuaian indeks dan agregasi.

6. Detailed Data

Area ini menyimpan semua data yang terperinci di dalam skema

database. Dalam banyak kasus data yang terperinci tidaklah

disimpan secara online tetapi dapat disediakan melalui agregasi data

pada tingkatan detil berikutnya. Bagaimanapun biasanya data yang

lebih terperinci ditambahkan untuk melengkapi data yang sudah ada.

7. Lightly and highly summarized data

Area ini menyimpan semua lightly and highly summarized data

yang dihasilkan oleh warehouse manager. Area ini adalah tempat

penampungan sementara sebelum dilakukan perubahan secara

berkelanjutan untuk merespon perubahan profil query.

Tujuan informasi ringkasan adalah untuk mempercepat

pencapaian query. Meskipun biaya operasi akan meningkat

sehubungan dengan proses peringkasan data tersebut, namun ini

merupakan offset untuk melaksanakan operasi ringkasan secara terus

menerus untuk menjawab user query. Data ringkasan diperbaharui

secara terus-menerus ketika ada data baru yang terisi ke dalam data

warehouse.

30

8. Archive or Backup Data

Area ini menyimpan semua detil dan ringkasan data untuk

kepentingan archiving dan backup. Walaupun ringkasan data

dibangun dari detil data, akan memungkinkan untuk membuat

cadangan ringkasan data secara online jika data ini ditunjukkan

melebihi penyimpanan waktu untuk detil data. Data ditransfer ke

gudang atau penyimpanan seperti magnetic tape dan optical disk.

9. Metadata

Area ini menyimpan semua definisi metadata yang digunakan

oleh semua proses di dalam warehouse. Metadata digunakan untuk

berbagai tujuan termasuk :

- Proses extract dan load – metadata digunakan untuk memetakan

sumber data ke dalam pandangan umum sebagai warehouse.

- Proses manajemen warehouse-metadata digunakan untuk

mengotomatisasi pembuatan tabel ringkasan.

- Sebagai bagian proses manajemen query – metadata digunakan untuk

menghubungkan suatu query dengan sumber data yang tepat.

Struktur metadata berbeda untuk masing-masing proses, sebab

memiliki tujuan yang berbeda. Ini berarti bahwa berbagai salinan

metadata yang menggambarkan data item yang sama dipegang di

dalam data warehouse. Manajemen metadata di dalam data

warehouse adalah suatu tugas yang sangat kompleks yang tidak

boleh diremehkan.

31

10. End-Users Access Tools

Tujuan prinsip data warehousing adalah untuk menyediakan

informasi kepada para user bisnis untuk pengambilan keputusan.

Para user berinteraksi dengan warehouse menggunakan peralatan

akses end-user. Berdasarkan kutipan dari (Conolly & Begg,

2010)p1206) yang dikemukakan oleh Berson dan Smith, kategori

tools dibagi menjadi lima bagian :

- Sebagai alat untuk laporan dan query

Menghasilkan program laporan dan laporan tertulis, sedangkan

query tools didesain untuk menerima SQL atau menghasilkan

pernyataan SQL untuk men-query data di dalam data warehouse.

- Perangkat pengembangan aplikasi

Keperluan end user dari laporan dan alat query terkadang tidak

cukup karena analisis yang diperlukan tidak dapat ditampilkan

atau karena interaksi pengguna memerlukan keahlian yang tinggi

dari user. Beberapa dari alat pengembangan aplikasi ini

terintegrasi dengan alat OLAP yang tekenal, dan dapat mengakses

semua sistem database utama, termasuk Oracle, Sybase, dan

Informix.

- Perangkat Executive Information System (EIS)

Executive Information System (EIS), dikembangkan untuk

mendukung pembuatan keputusan tingkat tinggi. Alat EIS

32

berhubungan dengan mainframe pengguna untuk membangun

kebiasaan-kebiasaan, aplikasi grafik pendukung keputusan untuk

menyediakan sebuah gambaran data- data organisasi dan akses ke

sumber data luar.

- Perangkat Online Analytical Processing (OLAP)

Perangkat OLAP berdasarkan dari konsep multidimensional

database dan mengijinkan pengguna untuk menganalisa dan

menggunakan kompleks multidimensional views. Aplikasi

bisnis khusus ini digunakan untuk menilai keefektifan

marketing, perkiraan sales produk, dan rencana kapasitas.

- Perangkat data mining

Data mining adalah proses menemukan korelasi baru, pola, arah

yang baru dengan menganalisa sejumlah besar data menggunakan

statistik, matematika, dan teknik Artificial Intelligence (AI).

Gambar 2.8 Arsitektur Data Warehouse (Sumber : (Conolly & Begg, 2010)p1204)

33

2.1.10 OLAP

OLAP digunakan untuk menyediakan akses mudah dan cepat ke

sumber daya analisis yang mendasari pengambilan keputusan dan proses

manajemen (Diana, 2011)

2.1.11 Star Schema

Menurut Doro Edi1, Stevalin Betshani (p78-80) Star schema

merupakan salah satu alat pendukung pengambilan keputusan, maka dari

itu perancangan star schema disesuaikan dengan kebutuhan pihak

manajerial dalam pengambilan suatu keputusan

Star Schema adalah suatu struktur logical yang memiliki sebuah tabel

fakta yang berisikan data – data fakta di tengahnya dan di kelilingi oleh

tabel-tabel dimensi yang berisikan data-data referensi (bisa dalam bentuk

denormalisasi) (Conolly & Begg, 2010)p1227).

34

Gambar 2.9 Star Schema

(sumber (Conolly & Begg, 2010)p1228)

2.1.12 Snowflake Schema

Snowflake schema adalah variasi lain dari skema bintang dimana

tabel dimensi tidak berisi data yang dinormalisasi, dan suatu tabel

dimensi dapat memiliki tabel dimensi lainnya (Conolly & Begg,

2010)p1129).

35

Gambar 2.10 Snowflake Schema

(sumber (Conolly & Begg, 2010)p1229)

2.1.13 Starflake Schema

Starflake schema adalah struktur campuran antara skema bintang dan

snowflake schema. Beberapa tabel dimensi dapat disajikan dalam bentuk

skema bintang maupun snowflake schema untuk memenuhi kebutuhan query

yang berbeda beda (Conolly & Begg, 2010)p1230).

36

2.1.14 Granularity

Granularity mengarahkan ke level of detail atau ringkasan dara pada data

warehouse. Semakin detil data semakin rendah tingkat granularity. Semakin

ringkas data, semakin tinggi tingkat granularity. Ringkasan dari semua

transaksi pada suatu bulan akan menjadi tingkat yang tinggi atas granularity.

Granularity dari data akan menajadi sebuah persoalan desain utama pada

lingkungan data warehouse karena mempengaruhi volume data pada data

warehouse dan jenis query yang dapat dijawab. Pada banyak kasus, data

warehouse berada pada tingkat granularity yang terlalu tinggi artinya

developer harus menghabiskan banyak sumber daya untuk memecah data.

Kadang – kadang data masuk ke data werehouse pada tingkat granularity

yang terlalu rendah (William, 2005)p41).

2.1.15 Metadata

Metadata adalah sebuah komponen penting dari lingkungan data

werehouse. Metadata atau data tentang data, telah menjadi bagian dari

lingkungan pemrosesan informasi selama telah ada program dan data. Tetapi

dalam dunia data werehouse, metadata mendapatkan tingkat kepentingan

yang baru, untuk segala usaha yang paling efektif digunakan pada data

werehouse.

Metadata memungkinakan end-user atau decision support system analyst

untuk menavigasi melalu beberapa kemungkinan. Ketika user akan

menggunakan data warehouse yang tidak memiliki metadata, maka user

37

tidak tahu darimana akan memulai analisa. Dengan adanya metadata, maka

user dapat dengan cepat mencari data yang penting atau menentukan data

yang tidak ada dalam data warehouse. Metadata bertindak sebagai index

untuk isi data warehouse. (William, 2005) p102).

Metadata items menyimpan hal – hal sebagai berikut :

- Stuktur data bagai programmer.

- Struktur data bagi DSS Analyst.

- Sumber data untuk data warehouse.

- Transformasi data ke data warehouse.

- Data model.

- Relationship antara data model dan data warehouse.

- Histori dari extract.

2.1.16 External Data dan Data Warehouse

Kebanyakan organisasi membangun data warehouse mereka pada data

yang berasal dari sistem yang ada (yakni, diatas data internal ke perusahaan).

Di hampir setiap kasus, data ini dapat disebut data internal, terstruktur. Data

internal berasal dari perusahaan dan telah dibentuk ke dalam format yang

teratur. Satu keseluruhan besar atas data lain yang sah digunakan untuk

sebuah perusahaan yang tidak dihasilkan dari sistem perusahaan sendiri

disebut data eksternal dan biasanya memasuki perusahaan dalam format yang

tidak diduga. Data warehouse ialah tempat yang idela untuk menyimpan data

eksternal (William, 2005) p257-258).

38

Data warehouse mampu menangani lebih dari data internal, terstruktur.

Ada banyak infromasi yang relevan untuk menjalankan perusahaan yang

berasal dari sumber-sumber di luar perusahaan (William, 2005)p268).

2.1.17 Perhitungan Estimasi Kapasitas Disk

Perhitungan estimasi kapasitas disk adalah sebagai berikut:

- Menentukan jumlah baris di dalam tabel = Num_Rows

- Ukuran tergantung pada tipe data dan panjangnya

Jumlah kolom = Num_Cols

Jumlah fixed length kolom (byte) = Fixed_Data_Size

Jumlah variable-length kolom = Num_Variable_Cols

Ukuran maksimal variable length kolom = Max_Var_Size

- Menghitung null bitmap jika dalam tabel terdapat fixed length kolom:

Nul lBitmap (Null_Bitmap) = 2 + ((Num_Cols + 7) / 8 )

- Menghitung kapasitas jika terdapat variable length kolom dalam tabel:

Total size of variable-length columns (Variable_Data_Size) = 2 +

(Num_Variable_Cols * 2) + Max_Var_Size

Jika tidak terdapat variable length kolom, Variable_Data_Size = 0

- Menghitung ukuran baris:

Total row size (Row_Size) = Fixed_Data_Size + Variable_Data_Size +

Null_Bitmap + 4

39

- Menghitung jumlah baris per page (8096 byte per page):

Number of rows per page (Rows_PerPage) = (8096) / (Row_Size + 2)

- Jika terdapat clustered index di dalam tabel, maka menghitung free rows per

page didasarkan pada Fill Factor.

Jika tidak ada clustered index yang dibuat, maka Fill Factor = 100

Number of free rows per page (Free_Rows_Per_Page) = 8096 * ((100 -

Fill_Factor) / 100) / (Row_Size + 2)

- Menghitung jumlah page yang dibutuhkan untuk menyimpan semua baris:

Number of pages (Num_Pages) = Num_Rows / (Rows_ Per_Page -

Free_Rows_Per_Page)

- Menghitung kapasitas yang dibutuhkan untuk menyimpan data dalam tabel (8192

byte per page):

Table size (bytes) = 8192 * Num_Pages (Microsoft, 2011)

40

2.2 Teori Khusus

2.2.1 Pengertian Penjualan

Penjualan merupakan proses antara pembeli dan penjual yang

bertemu karena adanya kebutuhan, dengan saling bertukar informasi dan

adanya keterkaitan akan suatu kebutuhan.Penjualan membutuhkan

dorongan dalam bentuk iklan ataupun bentuk penyampaian kepada

masyarakat luas agar tercapainya dorongan efektivitas antara pembeli dan

penjual.Dengan informasi yang diberikan maka penjualan barang atau

jasa tertentu dapat meningkat sejalannya waktu (Kotler, 2006:457).

Penjualan merupakan proses menciptakan dan mengembangkan

hubungan antara pelanggan dan penanggung jawab (stakeholders). Relasi

penjualan mengacu pada peningkatan pembangunan,

hubungan pertukaran biaya yang efektif dengan setiap

pelanggan , supplier, karyawan dan mitra lainnya agar tercapai hubungan

yang saling menguntungkan (Jobber & David, 2006)

2.2.2 Pengertian Permintaan Barang

http://ri2-aff.blogspot.com/2010/02/pengertian-permintaan-dan-penawaran.html

Permintaan adalah sejumlah barang yang akan dibeli atau yang

diminta pada tingkat harga tertentu dalam waktu tertentu. Masyarakat

selaku konsumen harus membeli barang atau jasa keperluannya di pasar.

Keadaan ini mengandaikan bahwa barang atau jasa itu memiliki tingkat

harga tertentu. Adanya berbagai macam harga di pasar selanjutnya

41

mengandaikan adanya kondisi yang mempengaruhi. Adapun unsure-

unsur yang terdapat pada permintaan yakni barang atau jasa, harga dan

kondisi yang mempengaruhi. Jadi permintaan adalah jumlah barang atau

jasa yang dibeli dalam berbagai situasi dan tingkat harga.

Kurva Permintaan Barang

Permintaan di tempatkan sebagai fungsi yang dipengaruhi oleh beberapa

factor. Factor yang di maksid adalah harga, barang, atau jasa, selera dan

pendapatan. Keterkaitan antara permintaan dan faktor-faktor tersebut

menghasilkan rumus sbb :

X= f (Hb1, Hb2, S, P)

Dimana :

H = harga S = selera

B = barang atau jasa P = Pendapatan

Dalam kaitannya dengan factor ekonomi pada masalah permintaan ini

berlaku ceteris paribus. Dalam kondisi seperti ini harga merupakan factor

dominant dalam permintaan, sementara factor yang lain dianggap tidak

berubah.

Pada harga yang tinggi , banyak pembeli yang tidak mampu membeli

atau mungkin cenderung mencari barang substitusi dengan harga

terjangkau. Sedangkan pada harga rendah, pembeli yang tadinya kurang

mammpu menjadi mampu untuk membeli

42

Bagi pembeli perorangan, kenaikan harga akan memperkecil daya beli

pembeli atau akan mengurangi anggaran untuk alat pemuas kebutuhan

yang lainnya (dengan catatan pendapatan tetap)

Adanya harga barang substitusi yang harganya jauh lebih rendah akan

lebih menarik apabila harga suatu barang atau jasa semakin tinggi.

Akibatnya pembeli akan beralih dari barang atau jasa yang telah biasa di

konsumsi ke barang atau jasa substitusi.

2.2.3 Pengertian Pembelian

Pembelian merupakan kegiatan bisnis yang berhubungan dengan

pembayaran barang atau jasa oleh perusahaan. Kegiatan bisnis tersebut dapat

juga menjadi perputaran barang atau jasa pada putaran bisnis (bussiness

circle).

Terdapat 5 aktivitas yang mendasar dalam teori pembelian :

1. Requesting the purchase of needed goods

Aktivitas pertama dalam suatu pembelian terdapat permintaan barang atau

jasa, dalam melakukan pembelian persediaan maka perusahaan membutuhkan

perbandingan produk,harga, dan tanggal pembelian barang yang diperlukan.

2. Ordering goods to be purchased

Aktivitas kedua pembelian merupakan pemesanan barang. Pemesanan barang

harus melalui perbandingan yang terdapat pada tahap awal, serta

memperhatikan supplier yang memiliki harga kompetitif dan kualitas barang

43

yang terjamin mutunya.Dokumen yang secara formal digunakan untuk

membuat suatu perjanjian kepada supplier untuk mengirimkan barang tertentu

dengan harga yang telah disetujui kedua belah pihak adalah purchase order.

3. Receiving ordered goods

Aktivitas ketiga kegiatan menerima barang yang dikirim oleh supplier lalu

pihak perusahaan melakukan pengecekan ulang pada jumlah barang dan harga

yang disetujui dalam purchase order. Hal tersebut dilakukan agar dapat

melihat barang diterima sudah sesuai atau belum dan apabila terdapat

kerusakkan barang dapat langsung dikembalikan.

4. Approving vendor invoice for payment

Aktivitas keempat mencatat kembali barang yang sudah diterima dan

mencatat pengeluaran keuangan dalam perusahaan. Hal ini dilakukan oleh

bagian akuntan

5. Paying for goods purchased

Aktivitas kelima membayar barang yang sudah dibeli, pastikan pembayaran

dilakukan sesuai tanggal jatuh tempo (Romney, Marshall, Steinbart, & Paul,

2000).

2.2.4 Pengertian Retur Pembelian

Pelanggan mengembalikan barang dagangan yang telah mereka beli karena

beberapa alasan, antara lain penjual mengirimkan barang dagang yang salah :

barang tersebut cacat, produk rusak dalam pengiriman penjual melakukan

44

pengiriman barang terlambat atau tertunda dalam perjalanan, dan pembeli menolak

pengiriman tersebut. Ketika terjadi pengembalian, pembeli akan meminta penjual

untuk menjamin suatu credit allowance atas produk yang tidak diinginkan (Hall &

Singleton, 2007).