bab 2 landasan teori - library.binus.ac.idlibrary.binus.ac.id/ecolls/ethesisdoc/bab2/2011-2-00972-si...
TRANSCRIPT
8
BAB 2
LANDASAN TEORI
2.1 Teori – Teori Dasar / Umum
2.1.1 Pengertian Data Warehouse dan Database
Database merupakan gabungan dari sejumlah informasi yang
terdapat pada masing - masing bagian aktivitas perusahaan yang
membantu dalam memperbaharui database secara berkala
(Molina,Widom & Jennifer, 2004)
Data warehouse adalah sekumpulan data yang berorientasi pada
subjek, terintegrasi, memiliki rentang waktu dan tidak mudah berubah
yang mendukung proses pembuatan keputusan manajerial (Conolly &
Begg, 2010).
Data warehouse adalah sekumpulan data yang berorientasi pada
subjek, terintegrasi, tidak mudah berubah dan memiliki rentang waktu
yang dapat digunakan untuk mendukung keputusan manajerial (William,
2005)
Data warehouse adalah mewakili sebuah solusi untuk
meningkatkan ketersediaan data dan informasi, serta akses untuk
pengambilan keputusan (Bornaz, 2010).
9
Jadi bisa disimpulkan bahwa data warehouse mempunyai data
terintegrasi antara data yang satu dengan data yang lainnya didalam suatu
perusahaan yang bersifat tidak mudah berubah sehingga akan mendukung
suatu proses pembuatan keputusan di dalam perusahaan. Selain itu data
warehouse juga memiliki rentang waktu.
2.1.2 Karakteristik Data Warehouse
Karakteristik data warehouse yaitu subject-oriented, integrated, non-
volatile, time variant (Kimball & Ross, 2004)
- Subject Oriented
Sistem informasi klasik berorientasi pada aplikasi fungsional
perusahaan. Untuk perusahaan asuransi contohnya : aplikasinya
dapat berupa healthty, life, auto, casualty. Subjek dari sistem
informasi-nya claim, customer, policy dan premium.
Gambar 2.1 Data Warehouse Subject Oriented
(Sumber : (Kimball & Ross, 2004)p30)
10
- Integrated
Data diambil dari banyak sumber berbeda kemudian dimasukkan ke
dalam data warehouse. Selama data diambil, data tersebut diubah,
dilakukan format kembali, diurutkan, diringkas dan seterusnya. Hasilnya
adalah data yang terletak dalam data warehouse yang memiliki pandangan
terpadu dan terintegrasi.
Untuk menciptakan subjek area yang berguna dan sumber data yang
berasal dari banyak sistem yang berbeda, terlebih dahulu harus
diintegrasikan sebelum digabungkan ke dalam data warehouse. Sebagai
contoh : terdapat empat aplikasi yang menyimpan kode jenis kelamin
dalam database secara berbeda. Aplikasi A menyimpan kode jenis kelamin
dalam bentuk ‘m’ untuk laki-laki dan ‘f’ untuk perempuan, sedangkan
aplikasi B menyimpan jenis kelamin dalam bentuk ‘1’ dan ‘0’, aplikasi C
dalam bentuk ‘x’ dan ‘y’, aplikasi D dalam bentuk ‘male’ dan ‘female’.
Melalui proses integrasi itulah dihasilkan kode jenis kelamin yang seragam
untuk data warehouse yaitu ‘m’ dan ‘f’. Untuk lebih jelasnya lihat gambar
dibawah ini :
11
Gambar 2.2 Aspek Integrated dari data warehouse
(Sumber : (Kimball & Ross, 2004)p31)
- Non-Volatile
Data dalam lingkungan operasional di ubah secara teratur, tetapi data
pada data warehouse menunjukkan karakteristik yang berbeda. Data pada
data warehouse di load dan diakses tetapi tidak di update. Ketika data di
load pada data warehouse dalam sebuah snapshot (static format). Ketika
terjadi perubahan selanjutnya, snapshot yang baru akan ditulis.
12
Gambar 2.3 Aspek Non-volatile dari Data Warehouse
(Sumber : (Kimball & Ross, 2004), p32)
- Time Variant
Data yang tersimpan dalam data warehouse bersifat time-variant atau
bersifat akurat pada periode tertentu. Karakteristik dasar data dalam data
warehouse sangat berbeda dengan data dalam OLTP, dimana data hanya
akurat sesaat setelah data diakses, sedangkan data pada data warehouse,
data akurat selama periode waktu tertentu, maka dikatakan memiliki
rentang waktu (time variant).
Aspek yang menunjukkan karakteristik time variant dalam data
warehouseadalah sebagai berikut:
- Data warehouse mempresentasikan data untuk kurun waktu 5-10 tahun.
Sedangkan pada OLTP mempresentasikan data untuk jangka waktu yang
lebih singkat mulai 60-90 hari, karena pada OLTP, aplikasi yang digunakan
harus memiliki response time yang singkat maka data yang diproses harus
optimal.
13
- Secara implisit maupun eksplisit, setiap struktur data pada data warehouse
mengandung elemen waktu seperti hari, minggu, bulan, dan sebagainya.
Elemen waktu ini hampir selalu menjadi dasar yang mengintegrasikan data
dalam data warehouse.
- Data pada data warehouse merupakan serangkaian snapshot, yaitu potongan
data yang dikelompokkan sesuai dengan urutan waktu.
Gambar 2.4 Time Variant antara Data Operasional dan Data
Warehouse (Sumber : (Kimball & Ross, 2004),p32)
2.1.3 Struktur Data Warehouse
Dalam struktur data warehouse terdapat older level of detail, current
level of detail, level of summarized data (level data mart) dan level of
highly summarized data. Aliran data (data flow) di data warehouse
berasal dari lingkungan operasional. Biasanya transformasi signifikan
terjadi dari data yang ada di level operasional menuju ke level data
warehouse. (Kimball & Ross, 2004)p33).
14
1. Current Detail Data
Current Detail Data menggambarkan data detil yang aktif pada
saat ini dan keadaan yang sedang berjalan. Data jenis ini
memerlukan media penyimpanan yang besar dan merupakan data
yang sering diakses. Current Detail Data ini cepat diakses, tetapi
mahal dan kompleks dalam pemeliharaannya.
2. Older Detail Data
Older detail data merupakan data back-up (cadangan)
yang jarang diakses. Data back-up seperti ini biasanya disimpan
pada media penyimpanan yang berbeda. Penyusunan direktori
dilakukan berdasarkan urutan umur data, sehingga data dapat
tersusun rapi dan mempermudah dalam melakukan akses
selanjutnya.
3. Lightly Summarized Data
Lightly summarized data merupakan data ringkasan dari
Current detail data. Di dalam tahap ini, data belum dapat
digunakan untuk pengambilan keputusan karena data masih
belum bersifat total summary, yang artinya data masih bersifat
detil. Akses terhadap data jenis ini biasanya digunakan untuk
memantau kondisi yang sedang dan sudah berjalan.
15
4. Highly Summarized Data
Highly summarized data merupakan data yang bersifat
total summary. Pada level ini, data sangat mudah diakses terutama
untuk melakukan analisis perbandingan data berdasarkan urutan
waktu dan analisis yang menggunakan data multidimensi. Data
multidimensi adalah suatu teknologi software komputer yang
dirancang untuk meningkatkan efisiensi dalam query data
sehingga menjadi media penyimpanan yang lebih baik, serta
memudahkan pengambilan data dalam volume besar.
Gambar 2.5 Struktur Data Warehouse
(Sumber : (Kimball & Ross, 2004)p34).
16
5. Metadata
Menurut (Kimball & Ross, 2004)p393), metadata adalah data mengenai
deskripsi dari struktur, isi, kunci, indeks dan lain-lain mengenai data.
Menurut (Kimball & Ross, 2004)p269-270), hal-hal penting dari metadata
meliputi:
- ID dokumen
- Tanggal memasukkan data ke warehouse
- Deskripsi dari dokumen
- Sumber dari dokumen
- Tanggal sumber dari dokumen
- Klasifikasi dokumen
- Indeks
- Lokasi fisikal
- Panjang dokumen
- Referensi yang terhubung dengan dokumen
Syarat-syarat dalam pembuatan metadata menurut(Kimball & Ross, 2004)p102):
- Struktur data yang dikenal programmer
- Struktur data yang dikenal analis DSS
- Sumber data yang membantu data warehouse
- Transformasi data ketika dilewatkan ke data warehouse
- Model data
- Hubungan antara model data dan data warehouse
17
- History dari extracts.
2.1.4 Anatomi Data Warehouse
1. Data Warehouse Fungsional
Data warehouse fungsional menggunakan pendekatan kebutuhan dari tiap bagian
fungsi bisnis, misalnya departemen, divisi, dan sebagainya, untuk mendefinisikan
jenis data yang ditampung oleh sistem. Setiap unit fungsi dapat memiliki gambaran
data masing-masing.
Pendekatan ini banyak digunakan karena sistem memberikan solusi ang mudah
untuk dibangun dengan biaya investasi yang relatif rendah dan dapat memberikan
kemampuan sistem pengumpulan data yang terbatas kepada kelompok pemakai.
Penerapan jenis sistem pengumpulan data seperti ini beresiko kehilangan
konsistensi data di luar lingkungan fungsi bisnis bersangkutan. Bila lingkup
pendekatan ini diperbesar dari lingkungan fungsional menjadi lingkup organisasi,
konsistensi data organisasi tidak lagi dapat dijamin.
Gambar 2.6 Data Warehouse Fungsional
Sumber :(http://myhut.org/public/datawarehouse.doc)
18
2. Centralized data warehouse
Data warehouse terpusat adalah pendekatan yang paling baik digunakan,
disebabkan oleh keterbiasaan pemakai dengan lingkungan mainframe terpusat. Data
diambil dari seluruh sistem operasional dan disimpan di dalam pusat penyimpanan
data. User kemudian menggunakan data yang telah terkumpul tersebut untuk
membangun data warehouse fungsional masing-masing sesuai dengan
kebutuhannya.
Keuntungan sistem ini dibanding data warehouse fungsional adalah bahwa data
benar-benar terpadu. Sistem ini mengharuskan data dikirim tepat pada waktunya
agar tetap konsisten dengan pemasok data lainnya. Di samping itu, user hanya dapat
mengambil data dari pusat pengumpulan saja dan tidak dapat berhubungan secara
langsung dengan pemasok datanya sendiri.
Penerapan sistem ini membutuhkan biaya pemeliharaan yang tinggi atas sistem
pengumpulan data yang besar. Selain ini diperlukan waktu yang lama untuk
membangun sistem tersebut.
Gambar 2.7 Centralized Data Warehouse
(http://abstractinnovations.co.uk/businesssolution/datawarehousing.aspx)
19
2.1.5 Keuntungan Data Warehouse
Data warehouse yang telah diimplementasikan dengan baik dapat
memberikan keuntungan bagi organisasi, yaitu: (Conolly & Begg,
2010)p1198).
- Nilai kembali investasi yang berpotensi tinggi
Sebuah organisasi harus mengeluarkan sumber daya dalam jumlah
yang cukup besar untuk memastikan bahwa data warehouse telah
diimplementasikan dengan baik.
- Keuntungan kompetitif
Pengambilan investasi yang besar untuk organisasi yang sukses
mengimplementasikan data warehouse menjadi bukti besarnya
keuntungan kompetitif yang menyertai teknologi ini. Keuntungan
kompetitif akan didapatkan jika pengambil keputusan mengakses data
yang dapat mengungkapkan informasi yang sebelumnya tidak diketahui
atau tidak tersedia, misal informasi mengenai trend, konsumen, dan
permintaan.
- Meningkatkan produktivitas dari para pengambil keputusan organisasi.
Data warehouse meningkatkan produktivitas para pengambil keputusan
organisasi dengan menciptakan sebuah database yang terintegrasi secara
konsisten, berorientasi subjek dan data historis. Data warehouse
mengintegrasikan data dari beberapa sistem yang tidak compatible ke
20
dalam bentuk yang menyediakan satu pandangan yang konsisten dari
organisasi. Dengan mengubah data menjadi informasi yang berguna,
maka seorang manajer bisnis dapat membuat analisa yang lebih akurat
dan konsisten.
2.1.6 Metodologi Perancangan Data Warehouse
(Kimball & Ross, 2004)p161) terdapat 9 tahap metodologi dalam
membangun data warehouse yang dikenal dengan nine-step methodology yaitu:
1. Memilih proses (Choosing the process)
Proses pada subyek masalah dari data mart tertentu. Data mart
yang akan dibangun harus sesuai anggaran dan dapat menjawab
masalah-masalah bisnis yang penting.
2. Memilih Grain (Choosing the grain)
Memilih grain berarti menentukan hal yang sebenarnya
dihadirkan oleh tabel fakta. Setelah menentukan grain-grain tabel fakta,
dimensi-dimensi untuk setiap fakta dapat diidentifikasi.
3. Identifikasi dan membuat dimensi yang sesuai (Identifying and
conforming the dimensions)
Mengidentifikasi dimensi disertai deskripsi detail yang
secukupnya. Ketika tabel dimensi berada pada dua atau lebih data mart,
maka tabel dimensi tersebut harus mempunyai dimensi yang sama atau
salah satu merupakan subset dari yang lainnya. Jika suatu tabel dimensi
21
digunakan oleh lebih dari satu data mart, maka dimensinya harus
disesuaikan.
4. Memilih Fakta (Choosing the facts)
Memilih fakta yang akan digunakan dalam data mart. Semua
fakta harus ditampilkan pada tingkat yang diterapkan oleh grain dan
fakta juga harus numeric dan aditif.
5. Menyimpan Pre-kalkulasi dalam Tabel Fakta (Storing pre-calculations in
the fact table)
Ketika fakta telah dipilih, maka setiap fakta tersebut harus diuji
apakah ada fakta yang dapat menggunakan pre-kalkulasi, setelah itu
lakukan penyimpanan pada tabel fakta
6. Melengkapi Tabel Dimensi (Rounding out the dimension tables)
Menambahkan sebanyak mungkin deskripsi teks pada tabel
dimensi. Deskripsi tersebut harus intuitif dan dapat dimengerti oleh
user.
7. Memilih durasi dari Database (Choosing the duration of the database)
Menentukan batas waktu dari umur data yang diambil dan akan
dipindahkan ke dalam tabel fakta. Misalnya, data perusahaan dua tahun
lalu atau lebih diambil dan dimasukkan dalam tabel fakta.
22
8. Melacak perubahan dari dimensi secara perlahan (Tracking slowly changing
dimensions)
Perubahan dimensi yang lambat menjadi sebuah masalah. Ada 3
tipe dasar dari perubahan dimensi yang lambat, yakni :
a. Perubahan atribut dimensi yang ditulis ulang.
b. Perubahan atribut dimensi yang mengakibatkan pembuatan suatu
record dimensi baru.
c. Perubahan atribut dimensi yang mengakibatkan sebuah atribut
alternative dibuat, sehingga kedua atribut tersebut yakni atribut
yang lama dan yang baru dapat diakses secara bersamaan dalam
sebuah dimensi yang sama.
9. Memutuskan prioritas dan cara query (Deciding the query priorities
and the query modes)
Mempertimbangkan pengaruh dari perancangan fisikal yang akan
mempengaruhi persepsi user terhadap data mart. Selain itu, perancangan
fisikal akan mempengaruhi masalah administrasi, backup, kinerja
pengindeksan dan keamanan.
2.1.7 Pengertian Data Mining
Data mining adalah ilmu untuk menggali informasi dari data set yang besar
dan database yang digunakan dalam proses mengelola data yang mencakup
analisa dan penentuan kesalahan (Ghencea & Immo, 2010). Data mining
merupakan teknik untuk mengekstrak pengetahuan dari informasi. Proses analsis
23
ini mempunyai peran penting dalam menentukan estimasi standar (Titan, Tudor, &
Loana, 2007). Sebuah sistem data mining pada khususnya dapat melakukan satu
tugas atau secara umum mampu melakukan banyak tugas data mining. Sebagian
besar data mining menerapkan sejumlah algoritma dan mampu melakukan
sebagian besar tugas yang pada umumnya cukup untuk memenuhi kebutuhan
pelanggan (Crisan & Androin, 2010)p47).
2.1.8 Perbandingan OLTP dengan Data Warehouse
Biasanya sebuah organisasi mempunyai beberapa sistem online
transaction proccessing (OLTP) yang berbeda untuk setiap proses bisnis, seperti
pengawasan persediaan (inventory control), pesanan pelanggan (invoicing
costumer) dan tingkat penjualan. Sistem ini menghasilkan data operasional yang
detil, terbaru dan selalu berubah. Sistem OLTP optimal jika digunakan untuk
sejumlah transaksi yang dapat diramalkan (predictable), berulang (repetitive),
dan sering diperbaharui (update intensive). Data OLTP diorganisasikan
berdasarkan syarat-syarat dari transaksi yang dihubungkan dengan aplikasi bisnis
dan mendukung keputusan perhari dalam sejumlah besar operasional user yang
konkruen.
Umumnya organisasi hanya mempunyai satu data warehouse yang
menyimpan data secara historis, detil, dan ringkasan dengan beberapa tingkatan
dan sangat jarang berubah. Data warehouse didesain untuk mendukung transaksi
yang tidak dapat diramalkan (unpredictable) dan memerlukan jawaban untuk
query khusus (ad hoc), tidak terstruktur, dan heuristic. Data warehouse
24
diorganisasikan berdasarkan pada syarat-syarat query yang potensial dan
mendukung keputusan strategis jangka panjang dari sejumlah kecil user tingkat
manajerial. (Conolly & Begg, 2010)p1198).
Di bawah ini adalah tabel perbandingan antara sistem OLTP dengan sistem data
warehouse (Conolly & Begg, 2010)p1199), yaitu :
25
Tabel 2.1 Perbandingan OLTP dan Data Warehouse
OLTP Data Warehouse
Menyimpan data-data saat ini Menyimpan data historis
Menyimpan data yang rinci Menyimpan data yang rinci, sedang,
dan ringkas
Data bersifat dinamis Data bersifat statis
Proses berulang-ulang Proses ad hoc, tidak terstruktur, dan
heuristic.
Hasil transaksi tingkat tinggi Hasil transaksi tingkat rendah sampai
menengah
Pola penggunaan dapat diprediksi Pola penggunaan tidak dapat diprediksi
Digunakan untuk transaksi Digunakan untuk analisis
Berorientasi pada aplikasi Berorientasi pada subjek
Mendukung keputusan harian Mendukung keputusan yang bersifat
strategis
Digunakan oleh banyak user
operasional
Digunakan oleh sedikit user manajerial
26
2.1.9 Arsitektur Data Warehouse
(Conolly & Begg, 2010)p1203-1207), arsitektur data warehouse
terdiri dari
1. Operational Data
Sumber data untuk data warehouse diambil dari :
- Mainframe data operasional yang menangani generasi pertama
secara hirarki dan database jaringan. Biasanya mayoritas data
operasional perusahaan disimpan di sistem ini.
- Data masing-masing departemen yang disimpan dalam sistem
file kepemilikan seperti VSAM, RMS dan relational DBMS
seperti Informix dan Oracle.
- Data internal yang tersimpan dalam work station dan server
pribadi.
- Sistem eksternal seperti internet, database komersial atau
database yang berhubungan dengan supplier dan customer.
2. Operational Datastore (ODS)
Suatu operational datastore (ODS) adalah suatu media
penyimpanan dan pengintegrasian data operasional yang digunakan
untuk analisis. ODS menyediakan data dengan cara yang sama seperti
data warehouse, tetapi sesungguhnya bertindak secara sederhana
sebagai tempat penampungan sementara sebelum data dipindahkan
ke data warehouse.
27
ODS diciptakan ketika sistem operasional ditemukan tidak
mampu untuk mencapai keberhasilan sistem pelaporan. ODS
menyediakan manfaat yang berguna dari suatu relational database
dalam mengambil keputusan yang mendukung fungsi data
warehouse.
Membangun ODS dapat membantu dalam pembuatan data
warehouse sebab suatu ODS dapat menyediakan data yang telah di-
extract dan di-cleansing dari sumber. Ini artinya proses integrasi dan
restrukturisasi data untuk data warehouse menjadi lebih sederhana.
3. Load Manager
Load manager melaksanakan semua operasi yang berhubungan
dengan pengambilan dan load data ke dalam data warehouse. Data
di-extract secara langsung dari sumber data atau dari penyimpanan
data operasional. Operasi yang dilakukan oleh load manager dapat
meliputi perubahan bentuk yang sederhana untuk mempersiapkan
data tersebut agar dapat dimasukkan ke dalam data warehouse.
4. Warehouse Manager
Warehouse manager melaksanakan semua operasi yang
berhubungan dengan manajemen data. Operasi yang dilakukan oleh
warehouse manager meliputi :
28
- Analisis data untuk memastikan konsistensi
- Transformasi dan penggabungan sumber data dari tempat
penyimpanan data sementara ke dalam table-table data
warehouse.
- Pembuatan index dan view pada table
- Melakukan denormalisasi
- Melakukan agregasi
- Melakukan backup dan mengarsip data
Dalam beberapa hal, warehouse manager juga menghasilkan profile
query untuk menentukan kesesuaian indeks dan agregasi. Suatu
profile query dapat dihasilkan baik untuk masing-masing user,
kelompok user atau data warehouse dan didasarkan pada informasi
yang menguraikan karakteristik query seperti frekuensi, target table,
dan ukuran dari hasil yang telah ditetapkan.
5. Query Manager
Query manager melaksanakan semua operasi yang berhubungan
dengan manajemen user query. Komponen ini secara khusus
dibangun menggunakan peralatan akses data end-user, peralatan
pengontrol data warehouse, fasilitas database, dan pembangunan
program. Kompleksitas query manager ditentukan oleh fasilitas yang
disajikan melalui peralatan akses para end-user database. Operasi
yang dilakukan komponen ini meliputi pengarahan query pada tabel
yang sesuai dan penjadwalan pelaksanaan query. Terkadang query
29
manager juga menghasilkan profil query yang mengijinkan
warehouse manager menentukan kesesuaian indeks dan agregasi.
6. Detailed Data
Area ini menyimpan semua data yang terperinci di dalam skema
database. Dalam banyak kasus data yang terperinci tidaklah
disimpan secara online tetapi dapat disediakan melalui agregasi data
pada tingkatan detil berikutnya. Bagaimanapun biasanya data yang
lebih terperinci ditambahkan untuk melengkapi data yang sudah ada.
7. Lightly and highly summarized data
Area ini menyimpan semua lightly and highly summarized data
yang dihasilkan oleh warehouse manager. Area ini adalah tempat
penampungan sementara sebelum dilakukan perubahan secara
berkelanjutan untuk merespon perubahan profil query.
Tujuan informasi ringkasan adalah untuk mempercepat
pencapaian query. Meskipun biaya operasi akan meningkat
sehubungan dengan proses peringkasan data tersebut, namun ini
merupakan offset untuk melaksanakan operasi ringkasan secara terus
menerus untuk menjawab user query. Data ringkasan diperbaharui
secara terus-menerus ketika ada data baru yang terisi ke dalam data
warehouse.
30
8. Archive or Backup Data
Area ini menyimpan semua detil dan ringkasan data untuk
kepentingan archiving dan backup. Walaupun ringkasan data
dibangun dari detil data, akan memungkinkan untuk membuat
cadangan ringkasan data secara online jika data ini ditunjukkan
melebihi penyimpanan waktu untuk detil data. Data ditransfer ke
gudang atau penyimpanan seperti magnetic tape dan optical disk.
9. Metadata
Area ini menyimpan semua definisi metadata yang digunakan
oleh semua proses di dalam warehouse. Metadata digunakan untuk
berbagai tujuan termasuk :
- Proses extract dan load – metadata digunakan untuk memetakan
sumber data ke dalam pandangan umum sebagai warehouse.
- Proses manajemen warehouse-metadata digunakan untuk
mengotomatisasi pembuatan tabel ringkasan.
- Sebagai bagian proses manajemen query – metadata digunakan untuk
menghubungkan suatu query dengan sumber data yang tepat.
Struktur metadata berbeda untuk masing-masing proses, sebab
memiliki tujuan yang berbeda. Ini berarti bahwa berbagai salinan
metadata yang menggambarkan data item yang sama dipegang di
dalam data warehouse. Manajemen metadata di dalam data
warehouse adalah suatu tugas yang sangat kompleks yang tidak
boleh diremehkan.
31
10. End-Users Access Tools
Tujuan prinsip data warehousing adalah untuk menyediakan
informasi kepada para user bisnis untuk pengambilan keputusan.
Para user berinteraksi dengan warehouse menggunakan peralatan
akses end-user. Berdasarkan kutipan dari (Conolly & Begg,
2010)p1206) yang dikemukakan oleh Berson dan Smith, kategori
tools dibagi menjadi lima bagian :
- Sebagai alat untuk laporan dan query
Menghasilkan program laporan dan laporan tertulis, sedangkan
query tools didesain untuk menerima SQL atau menghasilkan
pernyataan SQL untuk men-query data di dalam data warehouse.
- Perangkat pengembangan aplikasi
Keperluan end user dari laporan dan alat query terkadang tidak
cukup karena analisis yang diperlukan tidak dapat ditampilkan
atau karena interaksi pengguna memerlukan keahlian yang tinggi
dari user. Beberapa dari alat pengembangan aplikasi ini
terintegrasi dengan alat OLAP yang tekenal, dan dapat mengakses
semua sistem database utama, termasuk Oracle, Sybase, dan
Informix.
- Perangkat Executive Information System (EIS)
Executive Information System (EIS), dikembangkan untuk
mendukung pembuatan keputusan tingkat tinggi. Alat EIS
32
berhubungan dengan mainframe pengguna untuk membangun
kebiasaan-kebiasaan, aplikasi grafik pendukung keputusan untuk
menyediakan sebuah gambaran data- data organisasi dan akses ke
sumber data luar.
- Perangkat Online Analytical Processing (OLAP)
Perangkat OLAP berdasarkan dari konsep multidimensional
database dan mengijinkan pengguna untuk menganalisa dan
menggunakan kompleks multidimensional views. Aplikasi
bisnis khusus ini digunakan untuk menilai keefektifan
marketing, perkiraan sales produk, dan rencana kapasitas.
- Perangkat data mining
Data mining adalah proses menemukan korelasi baru, pola, arah
yang baru dengan menganalisa sejumlah besar data menggunakan
statistik, matematika, dan teknik Artificial Intelligence (AI).
Gambar 2.8 Arsitektur Data Warehouse (Sumber : (Conolly & Begg, 2010)p1204)
33
2.1.10 OLAP
OLAP digunakan untuk menyediakan akses mudah dan cepat ke
sumber daya analisis yang mendasari pengambilan keputusan dan proses
manajemen (Diana, 2011)
2.1.11 Star Schema
Menurut Doro Edi1, Stevalin Betshani (p78-80) Star schema
merupakan salah satu alat pendukung pengambilan keputusan, maka dari
itu perancangan star schema disesuaikan dengan kebutuhan pihak
manajerial dalam pengambilan suatu keputusan
Star Schema adalah suatu struktur logical yang memiliki sebuah tabel
fakta yang berisikan data – data fakta di tengahnya dan di kelilingi oleh
tabel-tabel dimensi yang berisikan data-data referensi (bisa dalam bentuk
denormalisasi) (Conolly & Begg, 2010)p1227).
34
Gambar 2.9 Star Schema
(sumber (Conolly & Begg, 2010)p1228)
2.1.12 Snowflake Schema
Snowflake schema adalah variasi lain dari skema bintang dimana
tabel dimensi tidak berisi data yang dinormalisasi, dan suatu tabel
dimensi dapat memiliki tabel dimensi lainnya (Conolly & Begg,
2010)p1129).
35
Gambar 2.10 Snowflake Schema
(sumber (Conolly & Begg, 2010)p1229)
2.1.13 Starflake Schema
Starflake schema adalah struktur campuran antara skema bintang dan
snowflake schema. Beberapa tabel dimensi dapat disajikan dalam bentuk
skema bintang maupun snowflake schema untuk memenuhi kebutuhan query
yang berbeda beda (Conolly & Begg, 2010)p1230).
36
2.1.14 Granularity
Granularity mengarahkan ke level of detail atau ringkasan dara pada data
warehouse. Semakin detil data semakin rendah tingkat granularity. Semakin
ringkas data, semakin tinggi tingkat granularity. Ringkasan dari semua
transaksi pada suatu bulan akan menjadi tingkat yang tinggi atas granularity.
Granularity dari data akan menajadi sebuah persoalan desain utama pada
lingkungan data warehouse karena mempengaruhi volume data pada data
warehouse dan jenis query yang dapat dijawab. Pada banyak kasus, data
warehouse berada pada tingkat granularity yang terlalu tinggi artinya
developer harus menghabiskan banyak sumber daya untuk memecah data.
Kadang – kadang data masuk ke data werehouse pada tingkat granularity
yang terlalu rendah (William, 2005)p41).
2.1.15 Metadata
Metadata adalah sebuah komponen penting dari lingkungan data
werehouse. Metadata atau data tentang data, telah menjadi bagian dari
lingkungan pemrosesan informasi selama telah ada program dan data. Tetapi
dalam dunia data werehouse, metadata mendapatkan tingkat kepentingan
yang baru, untuk segala usaha yang paling efektif digunakan pada data
werehouse.
Metadata memungkinakan end-user atau decision support system analyst
untuk menavigasi melalu beberapa kemungkinan. Ketika user akan
menggunakan data warehouse yang tidak memiliki metadata, maka user
37
tidak tahu darimana akan memulai analisa. Dengan adanya metadata, maka
user dapat dengan cepat mencari data yang penting atau menentukan data
yang tidak ada dalam data warehouse. Metadata bertindak sebagai index
untuk isi data warehouse. (William, 2005) p102).
Metadata items menyimpan hal – hal sebagai berikut :
- Stuktur data bagai programmer.
- Struktur data bagi DSS Analyst.
- Sumber data untuk data warehouse.
- Transformasi data ke data warehouse.
- Data model.
- Relationship antara data model dan data warehouse.
- Histori dari extract.
2.1.16 External Data dan Data Warehouse
Kebanyakan organisasi membangun data warehouse mereka pada data
yang berasal dari sistem yang ada (yakni, diatas data internal ke perusahaan).
Di hampir setiap kasus, data ini dapat disebut data internal, terstruktur. Data
internal berasal dari perusahaan dan telah dibentuk ke dalam format yang
teratur. Satu keseluruhan besar atas data lain yang sah digunakan untuk
sebuah perusahaan yang tidak dihasilkan dari sistem perusahaan sendiri
disebut data eksternal dan biasanya memasuki perusahaan dalam format yang
tidak diduga. Data warehouse ialah tempat yang idela untuk menyimpan data
eksternal (William, 2005) p257-258).
38
Data warehouse mampu menangani lebih dari data internal, terstruktur.
Ada banyak infromasi yang relevan untuk menjalankan perusahaan yang
berasal dari sumber-sumber di luar perusahaan (William, 2005)p268).
2.1.17 Perhitungan Estimasi Kapasitas Disk
Perhitungan estimasi kapasitas disk adalah sebagai berikut:
- Menentukan jumlah baris di dalam tabel = Num_Rows
- Ukuran tergantung pada tipe data dan panjangnya
Jumlah kolom = Num_Cols
Jumlah fixed length kolom (byte) = Fixed_Data_Size
Jumlah variable-length kolom = Num_Variable_Cols
Ukuran maksimal variable length kolom = Max_Var_Size
- Menghitung null bitmap jika dalam tabel terdapat fixed length kolom:
Nul lBitmap (Null_Bitmap) = 2 + ((Num_Cols + 7) / 8 )
- Menghitung kapasitas jika terdapat variable length kolom dalam tabel:
Total size of variable-length columns (Variable_Data_Size) = 2 +
(Num_Variable_Cols * 2) + Max_Var_Size
Jika tidak terdapat variable length kolom, Variable_Data_Size = 0
- Menghitung ukuran baris:
Total row size (Row_Size) = Fixed_Data_Size + Variable_Data_Size +
Null_Bitmap + 4
39
- Menghitung jumlah baris per page (8096 byte per page):
Number of rows per page (Rows_PerPage) = (8096) / (Row_Size + 2)
- Jika terdapat clustered index di dalam tabel, maka menghitung free rows per
page didasarkan pada Fill Factor.
Jika tidak ada clustered index yang dibuat, maka Fill Factor = 100
Number of free rows per page (Free_Rows_Per_Page) = 8096 * ((100 -
Fill_Factor) / 100) / (Row_Size + 2)
- Menghitung jumlah page yang dibutuhkan untuk menyimpan semua baris:
Number of pages (Num_Pages) = Num_Rows / (Rows_ Per_Page -
Free_Rows_Per_Page)
- Menghitung kapasitas yang dibutuhkan untuk menyimpan data dalam tabel (8192
byte per page):
Table size (bytes) = 8192 * Num_Pages (Microsoft, 2011)
40
2.2 Teori Khusus
2.2.1 Pengertian Penjualan
Penjualan merupakan proses antara pembeli dan penjual yang
bertemu karena adanya kebutuhan, dengan saling bertukar informasi dan
adanya keterkaitan akan suatu kebutuhan.Penjualan membutuhkan
dorongan dalam bentuk iklan ataupun bentuk penyampaian kepada
masyarakat luas agar tercapainya dorongan efektivitas antara pembeli dan
penjual.Dengan informasi yang diberikan maka penjualan barang atau
jasa tertentu dapat meningkat sejalannya waktu (Kotler, 2006:457).
Penjualan merupakan proses menciptakan dan mengembangkan
hubungan antara pelanggan dan penanggung jawab (stakeholders). Relasi
penjualan mengacu pada peningkatan pembangunan,
hubungan pertukaran biaya yang efektif dengan setiap
pelanggan , supplier, karyawan dan mitra lainnya agar tercapai hubungan
yang saling menguntungkan (Jobber & David, 2006)
2.2.2 Pengertian Permintaan Barang
http://ri2-aff.blogspot.com/2010/02/pengertian-permintaan-dan-penawaran.html
Permintaan adalah sejumlah barang yang akan dibeli atau yang
diminta pada tingkat harga tertentu dalam waktu tertentu. Masyarakat
selaku konsumen harus membeli barang atau jasa keperluannya di pasar.
Keadaan ini mengandaikan bahwa barang atau jasa itu memiliki tingkat
harga tertentu. Adanya berbagai macam harga di pasar selanjutnya
41
mengandaikan adanya kondisi yang mempengaruhi. Adapun unsure-
unsur yang terdapat pada permintaan yakni barang atau jasa, harga dan
kondisi yang mempengaruhi. Jadi permintaan adalah jumlah barang atau
jasa yang dibeli dalam berbagai situasi dan tingkat harga.
Kurva Permintaan Barang
Permintaan di tempatkan sebagai fungsi yang dipengaruhi oleh beberapa
factor. Factor yang di maksid adalah harga, barang, atau jasa, selera dan
pendapatan. Keterkaitan antara permintaan dan faktor-faktor tersebut
menghasilkan rumus sbb :
X= f (Hb1, Hb2, S, P)
Dimana :
H = harga S = selera
B = barang atau jasa P = Pendapatan
Dalam kaitannya dengan factor ekonomi pada masalah permintaan ini
berlaku ceteris paribus. Dalam kondisi seperti ini harga merupakan factor
dominant dalam permintaan, sementara factor yang lain dianggap tidak
berubah.
Pada harga yang tinggi , banyak pembeli yang tidak mampu membeli
atau mungkin cenderung mencari barang substitusi dengan harga
terjangkau. Sedangkan pada harga rendah, pembeli yang tadinya kurang
mammpu menjadi mampu untuk membeli
42
Bagi pembeli perorangan, kenaikan harga akan memperkecil daya beli
pembeli atau akan mengurangi anggaran untuk alat pemuas kebutuhan
yang lainnya (dengan catatan pendapatan tetap)
Adanya harga barang substitusi yang harganya jauh lebih rendah akan
lebih menarik apabila harga suatu barang atau jasa semakin tinggi.
Akibatnya pembeli akan beralih dari barang atau jasa yang telah biasa di
konsumsi ke barang atau jasa substitusi.
2.2.3 Pengertian Pembelian
Pembelian merupakan kegiatan bisnis yang berhubungan dengan
pembayaran barang atau jasa oleh perusahaan. Kegiatan bisnis tersebut dapat
juga menjadi perputaran barang atau jasa pada putaran bisnis (bussiness
circle).
Terdapat 5 aktivitas yang mendasar dalam teori pembelian :
1. Requesting the purchase of needed goods
Aktivitas pertama dalam suatu pembelian terdapat permintaan barang atau
jasa, dalam melakukan pembelian persediaan maka perusahaan membutuhkan
perbandingan produk,harga, dan tanggal pembelian barang yang diperlukan.
2. Ordering goods to be purchased
Aktivitas kedua pembelian merupakan pemesanan barang. Pemesanan barang
harus melalui perbandingan yang terdapat pada tahap awal, serta
memperhatikan supplier yang memiliki harga kompetitif dan kualitas barang
43
yang terjamin mutunya.Dokumen yang secara formal digunakan untuk
membuat suatu perjanjian kepada supplier untuk mengirimkan barang tertentu
dengan harga yang telah disetujui kedua belah pihak adalah purchase order.
3. Receiving ordered goods
Aktivitas ketiga kegiatan menerima barang yang dikirim oleh supplier lalu
pihak perusahaan melakukan pengecekan ulang pada jumlah barang dan harga
yang disetujui dalam purchase order. Hal tersebut dilakukan agar dapat
melihat barang diterima sudah sesuai atau belum dan apabila terdapat
kerusakkan barang dapat langsung dikembalikan.
4. Approving vendor invoice for payment
Aktivitas keempat mencatat kembali barang yang sudah diterima dan
mencatat pengeluaran keuangan dalam perusahaan. Hal ini dilakukan oleh
bagian akuntan
5. Paying for goods purchased
Aktivitas kelima membayar barang yang sudah dibeli, pastikan pembayaran
dilakukan sesuai tanggal jatuh tempo (Romney, Marshall, Steinbart, & Paul,
2000).
2.2.4 Pengertian Retur Pembelian
Pelanggan mengembalikan barang dagangan yang telah mereka beli karena
beberapa alasan, antara lain penjual mengirimkan barang dagang yang salah :
barang tersebut cacat, produk rusak dalam pengiriman penjual melakukan