bab 2 landasan teori -...

24
9 BAB 2 LANDASAN TEORI 2.1 Data Warehouse Data warehouse merupakan database relasional yang dirancang untuk keperluan query dan analisis. Data warehouse berisikan data historis yang berasal dari sumber data transaksi, namun juga berasal dari berbagai sumber data lainnya. Data warehouse memisahkan beban kerja analisis dari transaksi dan memungkinkan perusahaan untuk menggabungkan data dari beberapa sumber (Mohammed, 2014, p. 643). Data warehouse mendukung penyediaan data yang tepat dan juga mengubah data menjadi informasi yang sangat akurat, serta dapat digunakan untuk menemukan pola dan fakta untuk mengidentifikasi masalah dan menyediakan data dan informasi pada waktu yang tepat (Aloush, 2015, p. 216). Selain itu, data warehouse memainkan peran yang signifikan bagi pegambilan keputusan di level strategis. Data warehouse menyediakan pandangan multidimensional dari data historis berjumlah besar yang berasal dari sumber operasional sehingga dapat memberikan informasi yang berguna untuk para pengambil keputusan (Kaur, Sandhu, & Kaur, 2015, p. 47). Data warehouse merupakan sebuah kumpulan data yang memiliki karakteristik terintegrasi, berorientasi-subjek, non-volatile dan time variant sebagai pendukung dalam proses pengambilan keputusan manajemen (Imhoff, Galemmo, & Geiger, 2003) Sebuah data warehouse dapat memberikan laporan-laporan yang bersifat dinamis karena dapat dilihat dari berbagai dimensi dan memiliki kemampuan untuk diperinci lebih detail maupun diringkas sesuai kebutuhan pengguna. Tanpa menggunakan data warehouse, maka laporan-laporan yang akan dihasilkan bersifat statis sesuai dengan output aplikasi berdasarkan permintaan pengguna sistem (Ma, Yao-Jan Wu, & Yinhai Wang, 2014).

Upload: hoangmien

Post on 21-Jul-2019

219 views

Category:

Documents


0 download

TRANSCRIPT

9

BAB 2

LANDASAN TEORI

2.1 Data Warehouse Data warehouse merupakan database relasional yang dirancang untuk

keperluan query dan analisis. Data warehouse berisikan data historis yang

berasal dari sumber data transaksi, namun juga berasal dari berbagai sumber

data lainnya. Data warehouse memisahkan beban kerja analisis dari transaksi

dan memungkinkan perusahaan untuk menggabungkan data dari beberapa

sumber (Mohammed, 2014, p. 643).

Data warehouse mendukung penyediaan data yang tepat dan juga

mengubah data menjadi informasi yang sangat akurat, serta dapat digunakan

untuk menemukan pola dan fakta untuk mengidentifikasi masalah dan

menyediakan data dan informasi pada waktu yang tepat (Aloush, 2015, p.

216).

Selain itu, data warehouse memainkan peran yang signifikan bagi

pegambilan keputusan di level strategis. Data warehouse menyediakan

pandangan multidimensional dari data historis berjumlah besar yang berasal

dari sumber operasional sehingga dapat memberikan informasi yang berguna

untuk para pengambil keputusan (Kaur, Sandhu, & Kaur, 2015, p. 47).

Data warehouse merupakan sebuah kumpulan data yang memiliki

karakteristik terintegrasi, berorientasi-subjek, non-volatile dan time variant

sebagai pendukung dalam proses pengambilan keputusan manajemen

(Imhoff, Galemmo, & Geiger, 2003)

Sebuah data warehouse dapat memberikan laporan-laporan yang

bersifat dinamis karena dapat dilihat dari berbagai dimensi dan memiliki

kemampuan untuk diperinci lebih detail maupun diringkas sesuai kebutuhan

pengguna. Tanpa menggunakan data warehouse, maka laporan-laporan yang

akan dihasilkan bersifat statis sesuai dengan output aplikasi berdasarkan

permintaan pengguna sistem (Ma, Yao-Jan Wu, & Yinhai Wang, 2014).

10

2.1.1 Karakteristik Data warehouse Menurut Inmon yang dikutip Connolly & Begg (2015, p. 1225)

karakteristik data warehouse adalah sebagai berikut:

a) Subject-oriented

Data warehouse diorganisasikan subjek utama perusahaan (seperti

pelanggan, produk, dan penjualan) daripada area utama aplikasi

(seperti pelanggan, faktur, pengendalian stok, dan penjualan produk).

Hal ini tercermin dalam kebutuhan untuk menyimpan data pendukung

keputusan daripada data berorientasi aplikasi.

b) Integrated

Karena sumber data datang secara bersamaan dari berbagai

enterprise-wide application system. Sumber data ini sering tidak

konsisten, misalnya berbeda format. Sumber data harus terintegrasi

dan dibuat konsisten untuk menyajikan pandangan satu data ke

pengguna.

c) Time variant

Karena data dalam warehouse hanya akurat dan berlaku di

beberapa titik di suatu waktu atau selama beberapa interval waktu.

Variansi waktu dari data warehouse juga dalam waktu yang

ditentukan, asosiasi implisit maupun eksplisit waktu dengan semua

data.

d) Non-volatile

Data tidak di perbarui secara real time tapi memperbarui dari

operasional sistem secara teratur. Data baru selalu ditambahkan

sebagai suplemen ke database, database terus menyerap data baru

secara bertahap dengan mengintegrasikan data sebelumnya.

11

2.1.2 Arsitektur Data Warehouse Arsitektur data warehouse menurut Connolly & Begg (2015, p. 1231)

Gambar 2. 1 Arsitektur Data warehouse Sumber: Database Management Book, 2015, p. 1261

2.1.2.1 Operational Data Sumber data untuk data warehouse berasal dari:

• Mainframe operasional data yang memegang kendali di hierarki

generasi pertama dan di database jaringan.

• Departemental data yang memegang kendali di kepemilikan

sistem file seperti VSAM, RMS, dan relational DBMS.

• Private data yang memegang kendali di workstation dan private

server.

• External sistem seperti internet, database komersial yang

tersedia atau database yang berhubungan dengan organisasi

pelanggan.

2.1.2.2 Operational Data Store (ODS) Operational Data Store (ODS) adalah suatu media penyimpanan

untuk data operasional saat ini yang terintegrasi dan digunakan untuk

analisis. ODS menyediakan data dengan cara yang sama seperti data

warehouse, tetapi sesungguhnya bertindak secara sederhana sebagai

12

tempat penampungan data sementara untuk dipindahkan ke data

warehouse. ODS diciptakan ketika sistem operasional tidak mampu

mencapai kebutuhan sistem pelaporan. ODS menyediakan manfaat

yang berguna dari suatu relasional database dalam mengambil

keputusan yang mendukung fungsi data warehouse.

2.1.2.3 Load Manager Load Manager melakukan semua operasi yang berhubungan

dengan extract dan load data ke dalam data warehouse. Data dapat di-

extract secara langsung dari sumber data atau lebih umumnya berasal

dari ODS.

2.1.2.4 Warehouse Manager Warehouse Manager melakukan semua operasi yang

berhubungan dengan pengelolaan data di dalam warehouse. Operasi

yang dilakukan oleh warehouse manager antara lain :

• Analisa terhadap data untuk memastikan konsistensi.

• Transformasi dan penggabungan sumber data dari tempat

penyimpanan sementara menjadi tabel-tabel data warehouse.

• Pembuatan index dan view berdasarkan tabel-tabel dasar.

• Menghasilkan denormalisasi (jika diperlukan).

• Menghasilkan agregasi (jika diperlukan).

• Backup dan archieve data.

2.1.2.5 Query Manager Query manager melakukan operasi yang berhubungan dengan

manajemen dari pengguna query. Operasi yang dilakukan oleh query

manager seperti pengarahan query pada tabel yang sesuai dan

penjadwalan pelaksanaan query. Dalam beberapa kasus, query manager

juga menghasilkan profil query yang memungkinkan warehouse

manager menentukan kesusuaian indeks dan agregasi.

2.1.2.6 Detailed Data Area ini menyimpan semua data detil di dalam skema database,

yang bertujuan untuk melengkapkan kumpulan data untuk data

warehouse. Dalam banyak kasus, data yang terperinci tidaklah disimpan

secara online tetapi dapat disediakan melalui agregasi data pada

tingkatan detil berikutnya.

13

2.1.2.7 Lightly and Highly Summarized Data Area ini menyimpan semua lightly dan highly summarized data

yang dihasilkan oleh warehouse manager. Area ini adalah tempat

penampungan sementara sebelum dilakukan perubahan secara

berkelanjutan untuk merespon perubahan profil query. Tujuan

ringkasan informasi ini adalah untuk mempercepat penyampaian query.

2.1.2.8 Achieve / Backup Data Area warehouse yang menyimpan data detil dan ringkasan data

dengan tujuan sebagai arsip dan backup data. Data ditransfer ke

penyimpanan arsip seperti magnetic tape atau optical disk.

2.1.2.9 Metadata Area warehouse ini menyimpan semua definisi metadata (data

mengenai data) menggunakan semua proses yang ada pada data

warehouse. Metadata digunakan untuk beberapa tujuan :

• Proses ekstraksi dan loading Metadata digunakan untuk

memetakan data source menjadi bentuk data yang lebih umum

dalam warehouse.

• Proses manajemen warehouse Metadata digunakan untuk

mengotomatisasi produksi dari tabel ringkasan.

• Bagian dari proses manajemen query Metadata digunakan untuk

query secara langsung pada sumber data yang paling sesuai.

2.1.2.10 End-User Access Tools Pengguna akan berinteraksi dengan data warehouse guna

mendukung pengambilan keputusan melalui end-user access tool.

Lima kelompok utama dari end-user access tool adalah :

• Reporting dan Query Tools Reporting tool meliputi production

Reporting tool dan Report writer. Production Reporting tool

digunakan untuk menghasilkan laporan operasional regular.

Report writer adalah desktop tool yang dirancang untuk end-

user. Query tool untuk data warehouse dirancang untuk

menerima SQL atau menghasilkan pernyataan SQL untuk proses

query data yang tersimpan dalam warehouse.

• Application Development Tools Aplikasi yang dapat digunakan

user yaitu graphical data access yang dirancang untuk client

14

server. Beberapa application development tools terintegrasi

dengan OLAP tools dan mengakses semua sistem database

utama.

• Executive Information Sistem (EIS) Tools Executive Information

Sistem mendukung pengambilan keputusan semua tingkat

menajemen. EIS tools yang terhubung dengan mainframe

memungkinkan pengguna membuat aplikasi pendukung

pengambilan keputusan untuk menyediakan overview data

organisasi dan mengakses sumber data eksternal.

• Online Analytical Processing (OLAP) Tools OLAP tools

berbasis pada konsep multidimensional database dan

memperbolehkan pengguna untuk menganalisis data dengan

menggunakan view yang kompleks dan multidimensional view.

Tool ini mengasumsikan bahwa data diatur dalam model

multidimensi yang didukung oleh multidimensional database

(MDDB) atau oleh relational database yang dirancang untuk

mendapatkan multidimensional queries.

• Data Mining Tools Data mining adalah proses menemukan

korelasi, pola, dan arah baru yang mempunyai arti dengan

mining sejumlah besar data dengan menggunakan teknik

statistic, matematika, dan Artificial Intelligence (AI). Data

mining memiliki potensi untuk mengganti kemampuan dari

OLAP tools.

2.1.3 Perancangan Data Warehouse Terdapat 9 langkah dalam membangun sebuah data warehouse

menurut Girsang (2017) yang dikutip dari Ralph Kimball, dikenal

dengan nine-step design methodology, jika langkah-langkah dalam nine-

step design methodology dilakukan secara sistematis, maka dapat

membangun sebuah data warehouse yang baik. Kita ambil sebuah kasus

pada sebuah perusahaan sederhana penjualan untuk menggambarkan

kesembilan langkah tersebut.

15

1. Choose the Process

Memilih proses berarti menentukan subjek utama. Subjek

utama merujuk pada suatu kegiatan bisnis perusahaan yang dapat

menjawab semua pertanyaan bisnis yang penting serta memiliki ciri-

ciri tertentu. Misalnya adalah proses penjualan.

2. Choose the Grain

Memilih grain berarti menentukan apa yang akan diwakili atau

dipresentasikan oleh sebuah tabel fakta. Setelah

menentukan grain dari tabel fakta, selanjutnya dapat ditentukan tabel-

tabel dimensi yang berhubungan dengan tabel fakta

tersebut. Grain pada tabel fakta juga menentukan grain tabel dimensi.

Pada kasus ini grain bisa diperoleh dari invoice yang dikeluarkan

kepada pembeli.

3. Identify and Conform the Dimensions

Mengidentifikasi dan menghubungkan tabel dimensi dengan

tabel fakta. Dimensi merupakan kumpulan sudut pandang yang

penting untuk menggambarkan fakta-fakta yang terdapat pada tabel

fakta. Sebagai contoh adalah dimensi customer, waktu, dan jenis

produk.

4. Choose the Facts

Grain dari suatu tabel fakta menentukan fakta-fakta yang bisa

digunakan. Pada tahap ini, tentukan measure yang dibutuhkan pada

tabel fakta. Informasi apa saja yang ingin dibutuhkan.

5. Store Pre calculations in the Fact Table

Pada tahap ini, hasil perhitungan pada suatu atribut perlu

dipertimbangkan untuk disimpan di database. Hal ini untuk

mengurangi risiko kesalahan pada program setiap kali melakukan

perhitungan pada atribut-atribut tersebut.

6. Round Out the Dimension Tables

Dari dimensi-dimensi yang telah diidentifikasi, dibuat

deskripsi yang memuat informasi terstruktur mengenai atribut-atribut

pada tabel dimensi. Tabel dimensi tersebut harus diberi keterangan

secara lengkap dan mudah dipahami oleh pengguna.

16

7. Choose the Durations of the Database

Durasi waktu dari data-data yang akan dimasukkan ke

dalam data warehouse akan ditentukan pada tahap ini. Misalnya,

data perusahaan dua tahun lalu atau lebih diambil dan

dimasukkan ke dalam tabel fakta.

8. Determine the Need to Track Slowly Changing Dimensions

Dimensi dapat berubah dengan lambat dan menjadi sebuah

masalah. Terdapat tiga tipe dasar dari perubahan dimensi yang lambat,

yaitu:

• Menulis ulang atribut yang berubah.

• Membuat record baru pada dimensi.

• Membuat suatu atribut alternatif untuk menampung nilai

yang baru.

9. Decide Physical Design

Pada tahap ini, dilakukan perancangan fisik dari data

warehouse. Selain itu, penentuan masalah-masalah yang mungkin ada

pada perancangan fisik.

2.1.4 Keuntungan Data Warehouse Menurut Connolly dan Begg (2015, p. 1226), implementasi yang

sukses dari sebuah data warehouse dapat memberikan keuntungan –

keuntungan utama bagi organisasi, yaitu:

1. Potential high returns on investment

Suatu organisasi harus berkomitmen dengan jumlah

sumber daya yang besar untuk menjamin kesuksesan dalam

membuat data warehouse dan biayanya bervariasi tergantung

kondisi teknis yang ada. Namun, studi oleh International Data

Ccorpoation (IDC) melaporkan bahwa proyek – proyek data

warehouse memberikan rata – rata tiga tahun laba atas investasi

(ROI) dari 401% (IDC, 1996).

2. Competitive advantage

Dengan adanya kemungkinan balik modal yang besar

tehadap investasi merupakan bukti adanya keuntungan

kompetitif. Keuntungan kompetitif ini diperoleh dengan

17

memungkinkan para pengambilan keputusan untuk mengakses

data yang dapat mengungkapkan hal yang sebelumnya tidak

tersedia, tidak diketahui, dan informasi yang tidak tercatat

contohnya pelanggan, tren, dan permintaan.

3. Increased productivity of corporate decision makers

Data warehouse mengintegrasikan data dari beberapa

sistem yang tidak terstruktur menjadi bentuk yang menyediakan

satu pandangan dari suatu perusahaan. Dengan mengubah data

menjadi informasi yang bermakna, data warehouse

memungkinkan para pembuat keputusan untuk melakukan

analisis yang lebih substantive, dan akurat.

2.2 Online Transactional Processing (OLTP) OLTP mengandung tabel yang telah dinormalisasi dan data online yang

mana memiliki frekuensi insert/update/delete yang sering. OLTP merupakan

seperangkat program yang memfasilitasi dan mengatur aplikasi berbasis

transaksi, khususnya untuk memasukkan data dan pengambilan transaksi di

beberapa industri seperti keuangan, institusi, industri penerbangan,

supermarket dan manufaktur (Singh & Sood, 2013, p. 188).

Pengumpulan data di tingkat operational biasa disebut dengan OLTP

(Darudiato, 2010, p. 354). Sistem database OLTP mengandung data yang

bersifat detail dan terkini. OLTP berurusan dengan data yang penting yang

digunakan untuk kepentingan operasional sehari-hari pada suatu indutri. Pada

OLTP data yang tetrsimpan berfokus pada akses yang banyak dan update yang

sering (Ramzan, Nawaz, & Javed, 2015, p. 3). Selain itu menurut Namrata &

Singh (2014, p. 188) OLTP sistem berperan dalam memberikan sumber

informasi terhadap data warehouse.

Menurut Connolly & Begg (2015, p. 1226) Online Transaction

Processing (OLTP) adalah sistem yang dapat mengoptimalkan transaksi dalam

jumlah besar, yang diprediksi, berulang, dan diperbarui secara intensif. Data

dalam Online Transaction Processing (OLTP) dapat diatur sesuai dengan

persyaratan dari transaksi yang terkait dengan aplikasi bisnis dan mendukung

keputusan perhari dalam jumlah besar pada pengguna operasional.

18

2.3 Online Analytical Processing (OLAP) OLAP digunakan untuk keperluan analisis data oleh manajer, eksekutif

bisnis dan analis pemasaran. Data warehouse dan OLAP telah muncul sebagai

teknologi yang terkemuka yang dapat memfasilitasi penyimpanan data,

pengaturan dan pencarian data. Teknologi OLAP memungkinkan data

warehouse untuk digunakan secara efektif untuk kepentingan analisis online,

menyediakan respon cepat terhadap iterative complex analytical queries.

Mutidimensional data model OLAP dan teknik data aggregation mengatur dan

menyederhanakan data dalam jumlah yang besar sehingga dapaat dievaluasi

secara cepat menggunakan online analysis dan graphical tools (Singh & Sood,

2013, p. 189).

Menurut Connolly & Begg (2015, p. 1286) Online Analytical Processing

(OLAP) adalah sebuah teknologi yang menggunakan tampilan multidimensi

dari data agregat untuk menghasilkan akses yang cepat ke informasi yang

strategis untuk tujuan analisis.

OLAP merupakan suatu alat yang disediakan oleh data warehouse untuk

kepentingan pengambilan keputusan yang intensif dimana data disimpan

kedalam model multidimensional. OLAP biasanya digunakan untuk

mendeskripsikan analisis dari informasi kompleks data warehouse. Selain itu

OLAP menyediakan ringkasan data dan melakukan rich computation (Namrata

& Singh, 2014, p. 187). Dengan adanya OLAP, informasi dapat dilihat dengan

detail yang disebut dengan drill down, atau secara lebih ringkas disebut dengan

roll up (Wijaya, 2017, p. 3)

Pada OLAP, query yang digunakan sering kali lebih rumit termasuk pada

agregasinya. Waktu merupakan pengukuran yang sangat berharga pada sistem

OLAP (Ramzan, Nawaz, & Javed, 2015, p. 3).

2.4 OLAP vs. OLTP

Menurut Han, Kamber, & pei (2012, p. 128) perbedaan antara sistem

OLAP dan OLTP adalah sebagai berikut:

19

Tabel 2. 1 Perbedaan OLAP dan OLTP

2.5 Extract Transform Load Terdapat tiga tahap dalam proses ETL, yaitu:

2.5.1 Extract Menurut Darudiato (2010, p. 353) langkah pertama pada proses

ETL adalah mengekstrak data dari sumber-sumber data. Kebanyakan

proyek data warehouse menggabungkan data dari sumber-sumber yang

Fitur OLTP OLAP

Karakteristik Memproses kebutuhan

operasional Memproses informasi

Orientasi transaksi analisis

Pengguna petugas, DBA, database

profesional

pekerja pengetahuan ex:

manajer, eksekutif, analis

Fungsi Membantu kegiatan

operasional harian

Mendukung kebutuhan

informasi jangka panjang

dalam pengambilan

keputusan

Desain Database berorientasi pada

aplikasi, ER-based

berorientasi pada subjek,

star/snowflake

Data data sekarang, terjamin

keupdateannya

berupa data historis,

keakuratan data diatur

secara berkala waktu

View secara detail, flat

relational

secara ringkas,

multidimensional

Berfokus pada pemasukan data keluaran informasi

Jumlah Pengguna ribuan jutaan

Kapasitas DB GB sampai high GB >TB

Prioritas performa yang tinggi,

ketersediaan yang tinggi

fleksibilitas yang tinggi,

end-user autonomy

Metric transaction throughput query throughput, waktu

respon

20

berbeda. Sistem-sistem yang terpisah sangat mungkin menggunakan

format data yang berbeda.

Extract adalah langkah dalam menargetkan satu atau lebih

sumber data untuk Enterprise Data warehouse (EDW), sumber-sumber

ini biasanya mencakup database OLTP tetapi juga dapat menyertakan

sumber-sumber seperti operasional database dan lembar kerja,

Enterprise Resource Planning (ERP) file, dan file pengguna web.

Langkah extract umumnya menyalin extract data ke penyimpanan data

sementara disebut Operational Data Store (ODS) atau Staging Area

(SA) (Connolly & Begg, 2015, pp. 1236-1237).

Extract merupakan proses pemilahan dan pengambilan data dari

satu atau lebih sumber data (Prasetyo, Nugroho, & Aji, 2012, p. 17).

Pada proses ekstak, pertama-tama data diambil dari database

operasional (Ahmed, Islam, & Karim, 2017, p. 14). Proses ekstraksi

informasi dari sumber asli dan dipindahkan ke dalam data warehouse

merupakan hal yang sangat penting. Hal ini disebabkan sejumlah besar

volume data akan dipindahkan dari sistem sumber (legacy) ke dalam

data warehouse dengan ekstraksi data dilakukan secara otomatis.

Hanya item yang dibutuhkan yang dipindahkan ke dalam data

warehouse. Informasi yang masuk ke dalam data warehouse dapat

datang dari internal sistem (legacy system) maupun dari eksternal

organisasi (Safril, 2009, p. 135).

2.5.2 Transformation Tahapan transformasi menggunakan serangkaian aturan atau

fungsi untuk mengekstrak data dari sumber dan selanjutnya akan

dimasukkan ke data warehouse (Darudiato, 2010, p. 3).

Menurut Connolly & Begg (2015, pp. 1236-1237) Transformasi

adalah serangkaian aturan atau fungsi untuk extract data, yang mana

menentukan bagaimana data akan digunakan untuk analisis dan dapat

melibatkan data transformasi seperti pengkodean data, penggabungan

data, pemisahan data, perhitungan data, dan pembuatan Surrogate Key.

Output dari transformasi adalah data yang bersih dan konsisten dengan

21

data yang sudah di warehouse dan selanjutnya adalah dalam bentuk

yang siap untuk dianalisis oleh pengguna warehouse.

Selain itu menurut Safril (2009, p. 135) Transformasi dilakukan

dengan melakukan proses penyeragaman (cleaning). Proses cleaning

dilakukan karena data yang dicatat di organisasi dalam bentuk yang

berbeda. Data bisa disimpan dalam format yang berbeda dan

penyimpanan yang berbeda. Data warehouse membutuhkan informasi

yang telah dilakukan penyeragaman sehingga bentuk data tersebut

menjadi seragam.

Transformasi dilakukan untuk menyesuaikan terhadap standar

dari data warehouse (Ahmed, Islam, & Karim, 2017, p. 14).

Penyesuaian data manakala terjadi integrasi data dari berberapa sumber

(Prasetyo, Nugroho, & Aji, 2012, p. 17).

2.5.3 Loading Menurut Darudiato (2010, p. 3) fase load merupakan tahapan

yang berfungsi untuk memasukkan data ke dalam target akhir, yang

biasanya ke dalam suatu data warehouse. Jangka waktu proses ini

tergantung pada kebutuhan organisasi. Beberapa data warehouse dapat

setiap minggu mengisi keseluruhan informasi yang ada secara

kumulatif, data diubah, sementara data warehouse yang lain (atau

bagian lain dari data warehouse yang sama) dapat menambahkan data

baru dalam suatu bentuk yang historikal, contohnya setiap jam.

Loading merupakan proses pemuatan data ke dalam target data

warehouse (Prasetyo, Nugroho, & Aji, 2012, p. 17). Loading data ke

dalam warehouse dapat terjadi setelah semua transformasi mengambil

tempat atau bagian dari proses transformasi (Connolly & Begg, 2015,

pp. 1236-1237).

Pada proses load data akan masuk ke data warehouse (Ahmed,

Islam, & Karim, 2017, p. 14). Data yang masuk ke dalam data

warehouse haruslah benar. Apabila data yang masuk merupakan

informasi yang salah maka informasi tersebut tidak akan digunakan

pengguna (Safril, 2009, p. 135).

22

2.6 Metadata Metadata merupakan “data tentang data” atau “data yang digunakan

untuk mendefinisikan data lain”. Metadata mendefinisikan sumber, nilai,

penggunaan dan fitur dari data data warehouse dan mendefinisikan mengenai

bagaimana data dapat diubah dan diproses pada tiap lapisan arsitektur.

Metadata disimpan dalam repositori metadata yang dapat digunakan oleh tiap

komponen arsitektur. Metadata merupakan kebutuhan wajib untuk

menggunakan, membangun, dan mengelola data warehouse. Bagi end-user,

metadata diibaratkan sebagai peta untuk menuju isi dari data warehouse

(Parekh, 2013, p. 2569).

Metadata merupakan suatu bentuk informasi yang berisi data yang akan

digunakan, tipe data, panjang datanya serta sumber datanya yang akan

digunakan dalam data warehouse (Darudiato, 2010, p. 351).

Seperti yang dikatakan oleh Inmon (2005, p. 393), metadata adalah data

mengenai data atau deskripsi dari struktur, isi, kunci, indeks, dan lainlain

mengenai data. Terlebih menurut Prasetyo, Nugroho, & Aji (2012, p. 18)

Metadata ini akan mendiskripsikan tabel-tabel database, kolom-kolom beserta

relasinya sehingga akan nampak sebagai kesatuan dalam sebuah laporan

Sedangkan menurut Efrem G. (2000, p. 474) metadata adalah data

tentang data yang berguna sebagai pusat penyimpanan informasi untuk

menjelaskan kepada user tentang apakah data warehouse itu, dari mana

asalnya dan siapa yang bertanggung jawab atas hal tersebut.

2.7 Multidimensional Data Model Multidimensional data model merupakan teknik desain logis yang

bertujuan untuk menyajikan data secara standar, merupakan bentuk intuitif

yang memungkinkan adanya akses performa yang tinggi (Connolly & Begg,

2015, p. 1261). Menurut Lane (2007, pp. 18-56) untuk mengoptimalkan

penggunaan resource pada multidimensional data, aplikasi dapat menggunakan

query SQL yang kompleks, bahasa pemrograman C atau fungsi-fungsi tabel

untuk menampilkan data dari database.

Pada konsep multidimensi, data yang berupa fakta yang sama dapat

dilihat dengan menggunakan fungsi yang berbeda. (Wijaya, 2017, p. 3).

23

Multidimensional data model juga diketahui sebagai data cube yang

mana memungkinkan data untuk dimodelkan dan dilihat dari berbagai dimensi

atau sudut pandang (Mohammed, 2014, p. 642). Multidimensional data model

mengorganisir dan meringkas data yang berjumlah banyak agar data dapat

dievaluasi secara cepat menggunakan analisis online dan graphical tools

(Singh & Sood, 2013, p. 189).

2.7.1 Tabel Dimensi Dimensi berisikan referensi informasi mengenai fakta seperti

tanggal, produk atau pelanggan (Kaur, Sandhu, & Kaur, 2015, p. 49).

Menurut Connolly & Begg (2015, p. 1281) tabel dimensi berisi

informasi tekstual deskriptif dan dimensi atribut digunakan sebagai

batasan dalam query data warehouse. Terlebih lagi, tabel dimensi

adalah tabel yang diperlukan untuk melengkapi tabel fakta. tabel

dimensi berisi konteks tekstual data yang terkait dengan bisnis proses

(Kimball & Ross, 2013, p. 13).

Dimensi merupakan struktur yang mengkatagorikan data agar

memungkinkan pengguna dalam menjawab pertanyaan bisnis.

Sebagai contoh, setiap saluran penjualan retail pakaian dapat

mengumpulkan dan menyimpan data terkait penjualan dan reklamasi

dari berbagai jenis kain mereka. Salahsatu pendekatan untuk

mengidentifikasi dimensi adalah dengan meninjau tabel referensi,

seperti tabel produk yang berisikan semua informasi mengenai produk

atau tabel promosi yang berisi semua informasi mengenai promosi

(Lane, 2007, pp. 10-1).

Dimensi merupakan sekumpulan atribut. Pada hal ini atribut

yang digunakan mengacu pada kolom dalam tabel dimensi, sedangkan

pada permodelan relasional atribut yang digunakan lebih spesifik

(Imhoff, Galemmo, & Geiger, 2003, p. 152).

2.7.2 Tabel Fakta Fakta merupakan suatu kejadian yang dapat dihitung atau diukur,

seperti penjualan atau login menurut (Kaur, Sandhu, & Kaur, 2015, p.

48). Tabel fakta terdiri dari satu tabel dengan composite primary key

(Connolly & Begg, 2015, p. 1261).

24

Menurut Lane (2007, pp. 2-3, 2-4) tabel fakta adalah tabel besar

didalam susunan data warehouse yang menyimpan pengukuran bisnis.

Tabel Fakta mereprentasikan data, biasanya dalam bentuk angka dan

data tambahan, yang dapat dianalisa dan diperiksa. Contohnya termasuk

penjualan, biaya dan, keuntungan.

Selain itu, menurut Kimball & Ross (2013, p. 41) tabel fakta

mengandung angka yang mempunyai arti yang dibuat berdasarkan

kejadian yang sebenarnya.

Sebuah fakta didalamnya berisikan pengukuran dan foreign keys

dari tabel dimensi. Sebuah pengukuran biasanya berupa nilai numerik

yang merepresentasikan sebuah kejadian yang telah terjadi pada bisnis

(Imhoff, Galemmo, & Geiger, 2003, p. 152). Terlebih menurut

Mohammed (2014, p. 642) fakta digunakan untuk menghafalkan

perhitungan terhadap situasi atau kejadian.

2.7.3 Surrogate Key Menurut Kimball & Ross (2013, p. 58) Surrogate Key digunakan

untuk menjadi primary key dari hampir semua tabel dimensi dan juga

sebagai fact key (kunci fakta) yang digunakan setiap kolom, meskipun

tidak selalu wajib.

Surrogate key adalah semua natural key yang diganti dengan

surrogate key, dalam artian tiap gabungan fakta dengan tabel dimensi

berdasarkan surrogate key bukan natural key dan setiap surrogate key

harus memiliki struktur generalisasi yang berdasarkan bilangan bulat

(Connolly & Begg, 2015, p. 1261).

Surrogate key merupakan kunci primer yang bersifat unik untuk

mengidentifikasi setiap record yang disebut dengan kunci dimensi

surrogate. Kunci ini merupakan sebuah identifier yang dibangkitkan

oleh sistem database ataupun oleh aplikasi proses ETL (Prasetyo,

Nugroho, & Aji, 2012, p. 16).

Menurut Link, Lukovic, & Mogin (2009, p. 2) keberadaan

surrogate key dan nilainya tidak terlihat oleh user. Ini merupakan

sebuah keuntungan untuk menggunakan surrogate key sebagai primary

key karena memisahkan dari logika bisnis.

25

Terlebih lagi surrogate key menghindari data warehouse dari

adanya perubahan data oleh user. Hal ini dilakukan agar

mempertahankan integritas data dari waktu ke waktu terlepas dari apa

yang terjadi pada sistem operasional. (Imhoff, Galemmo, & Geiger,

2003, p. 330).

2.7.4 Star Schema Star schema merupakan dimensional data model yang memiliki

tabel fakta ditengahnya dan dikelilingi oleh tabel dimensi yang di

denormalisasi (Connolly & Begg, 2015, pp. 1261-1262).

Gambar 2. 2 Contoh Star schema Penjualan Properti

Sumber: Database Management Book, 2015, p.1261

Tabel fakta memiliki beberapa key yang merupakan kunci indeks

individual dalam tabel dimensi (Wijaya, 2017, p. 3). Star schema merupakan

bentuk yang paling sederhana dari model dimensional, yang mana data

diorganisir ke dalam fakta dan dimensi. Star schema ditandai oleh satu atau

lebih tabel fakta yang sangat besar yang berisikan informasi utama pada data

warehouse dan sejumlah tabel dimensi yang lebih kecil, yang masing-masing

berisikan informasi mengenai entri untuk atribut tertentu pada tabel fakta.

Fitur utama dari star schema adalah tabel fakta yang dikelilingi oleh tabel

26

dimensional, yang masing-masing berisikan informasi mengenai entri untuk

atribut tertentu di tabel fakta (Kaur, Sandhu, & Kaur, 2015, p. 49).

Menurut Ponniah (2001, p. 210) skema bintang (star schema) adalah

teknik dasar perancangan data untuk data warehouse. Struktur skema bintang

adalah suatu struktur yang dapat dengan mudah dipahami dan digunakan oleh

pengguna. Struktur tersebut mencerminkan bagaimana pengguna biasanya

memandang ukuran-ukuran kritis mengikuti dimensi-dimensi bisnis yang ada.

Selain itu, menurut Kimball & Ross (2013, p. 16) pengguna bisnis

lebih mudah mendapatkan manfaat dengan menggunakan Star Schema karena

data lebih mudah untuk dipahami dan dikendalikan, selain itu mengurangi

jumlah tabel yang akan digunakan dan kecil kemungkinan kesalahan akan

terjadi.

2.8 Dashboard Menurut Pramudijono (2013, p. 1) dashboard adalah sebuah tampilan

visual berisikan informasi yang dibutuhkan oleh pemangku kepentingan dalam

rangka melakukan monitoring dan sebagai dasar analisa untuk melakukan

pengambilan keputusan. Fungsi utama dashboard secara umum adalah untuk

menyediakan data atau informasi penting dan memberikan sinyal mengenai

suatu kondisi yang perlu segera mendapatkan respon.

Dashboard merupakan suatu alat atau sarana yang dikembangkan pada

unit sektor bisnis, dimana pada mulanya diperkenalkan untuk

menyederhanakan serta mengintegrasikan KPI ke seluruh bagian perusahaan

yang berupa tampilan visual segai cara untuk menampilkan informasi

pengambilan keputusan operasional (Dowding, 2014, p. 4).

Selain itu, dashboard didefinisikan oleh Pauwels (2009, p. 177)

sebagai koleksi kecil dari metrik kinerja utama yang saling terhubung dan

mendasari performa yang merepresentasikan kepentingan jangka pendek

maupun panjang terhadap perusahaan.

Dashboard menyatukan data dari berbagai sumber yang berbeda dan

menampilkannya melalui grafik yang informatif lengkap dengan keterangan

penjelasan (Ganapati, 2011, p. 47).

Dashboard digunakan pada berbagai macam keadaan untuk membantu

manajemen dan pengambilan keputusan. Dashboard dapat membantu dalam

27

mengelola orang atau proses untuk mengarahkan pengguna ke arah yang benar

(Baskett, 2008, p. 16).

2.8.1 Tipe-tipe Dashboard Terdapat 3 Tipe Dashboard Menurut (Smith, 2015):

• Operational Dashboards

Dashboard ini menampilkan data yang memfasilitasi

sisi operasional dari bisnis. contohnya saja, bisnis dengan

website, sangat penting untuk memastikan bahwa website yang

kita bangun tetap aktif dan berjalan, sehingga kita dapat

memantau dari segi waktu dan penggunaan server secara

maksimal. Dashboard ini terkadang membutuhkan data real-

time atau yang hampir mendekati data real-time.

• Strategic / Executive Dashboards

Dashboard strategis biasanya menyediakan KPI (Key

Performance Indicators) yang dapat diikuti oleh eksekutif

perusahaan secara periodik (harian, mingguan ataupun

bulanan). Strategic dashboard harus dapat menyediakan tim

eksekutif dengan gambaran high level mengenai keadaan

bisnis bersamaan dengan berbagai kesempatan yang dihadapi

oleh bisnis tersebut. Data tersebut dapat berupa pendapatan

periodik (vs periode sebelumnya), biaya (vs periode

sebelumnya), headcount (vs berdasarkan departemen).

• Analytical Dashboards

Setiap user yang berbeda membutuhkan tipe

dashboard yang berbeda juga. Contohnya saja pada manajer

marketing mungkin membutuhkan dashboard dari sisi

strategical dan operational. Dan hal tersebut sangat

memungkinkan sehingga akan dibentuk dua dashboard yang

terpisah.

2.8.2 Karakteristik Dashboard Menurut (Eckerson, 2011), Karakteristik utama dashboard adalah

sebagai berikut:

28

Tabel 2. 2 Karakteristik Dashboard

2.9 Fishbone

Diagram sebab akibat sering disebut diagram tulang ikan, dapat

membantu dalam mengidentifikasi kemungkinan penyebab suatu masalah dan

memilah ide kedalam kategori yang bermanfaat.

Gambar 2. 3 Diagram Fishbone Analysis

Sumber: QAPI, 2016, p.1

29

Diagram diatas mengilustrasikan sebab dan sub-sebab yang

menyebabkan adanya suatu efek atau gejala. Pada diagram tersebut yang

menjadi efek biasanya merupakan sebuah masalah yang perlu dipecahkan dan

ditempatkan di posisi “kepala ikan”. Penyebab dari efeknya kemudian

diletakkan di sepanjang “tulang” dan dikelompokkan menjadi beberapa jenis di

sepanjang cabang (QAPI, 2016, p. 1).

Menurut Atmaja (2005, p. 26) Diagram fishbone menggambarkan garis

dan simbol-simbol yang menunjukkan hubungan antara akibat dan suatu

masalah. Diagram tersebut memang digunakan untuk mengetahui akibat dari

suatu masalah untuk selanjutnya diambil tindakan perbaikan.

Fishbone diagram akan mengidentifikasi berbagai sebab potensial dari

satu efek atau masalah, dan menganalisis masalah tersebut melalui sesi

brainstorming. Masalah akan dipecah menjadi sejumlah kategori yang

berkaitan, mencakup manusia, material, mesin, prosedur, kebijakan, dan

sebagainya. Setiap kategori mempunyai sebab-sebab yang perlu diuraikan

melalui sesi brainstorming (Kusnadi, 2013, p. 1).

Selain itu menurut (Slameto, 2015, p. 5) diagram fishbone adalah

sebuah teknik grafis yang berguna untuk menganalisia dan menemukan faktor-

faktor yang berpengaruh atau efek secara signifikan di dalam menentukan

karakteristik kualitas hasil kerja.

Diagram Fishbone adalah suatu diagram yang menunjukkan hubungan

antara penyebab dan akibat dari suatu masalah dan berguna dalam

brainstorming karena dapat menyusun ide-ide yang muncul (Alamsyah, 2015,

p. 293).

2.10 6 Golden Rules Menurut Smith (2015) terdapat enam langkah dalam pembuatan

dashboard yang baik. Adapun langkah-langkahnya sebagai berikut:

1. Menentukan Siapa Pengguna yang Ingin Diberi Kesan

Desain dashboard yang efektif menargetkan kepada single user dan

hanya menampilkan data yang spesifik terhadap permasalahan atau

kejadian yang dihadapi. Dashboard harus benar-benar dipahami siapa

target dari penggunanya dan untuk kepentingan apa digunakan. Apakah

30

dashboard akan digunakan oleh tim eksekutif untuk memonitor keuangan

perusahaan atau akan digunakan oleh tim marketing untuk memonitor

aktivitas harian? hal tersebut sangat penting untuk memastikan bahwa data

dashboard yang kita sajikan bersifat spesifik kepada satu pengguna.

2. Memilih Tipe Dashboard yang Tepat

Dashboard memiliki tiga tipe yang berbeda dan setiap tipe

menjalankan tujuan yang spesifik. Ketiga tipe tersebut adalah:

o Operational Dashboards

Dashboard ini menampilkan data yang memfasilitasi sisi

operasional dari bisnis. contohnya saja, bisnis dengan website, sangat

penting untuk memastikan bahwa website yang kita bangun tetap

aktif dan berjalan, sehingga kita dapat memantau dari segi waktu dan

penggunaan server secara maksimal. Dashboard ini terkadang

membutuhkan data real-time atau yang hampir mendekati data real-

time.

o Strategic / Executive Dashboards

Dashboard strategis biasanya menyediakan KPI (Key

Performance Indicators) yang dapat diikuti oleh eksekutif

perusahaan secara periodik (harian, mingguan ataupun bulanan).

Strategic dashboard harus dapat menyediakan tim eksekutif dengan

gambaran high level mengenai keadaan bisnis bersamaan dengan

berbagai kesempatan yang dihadapi oleh bisnis tersebut. Data

tersebut dapat berupa pendapatan periodik (vs periode sebelumnya),

biaya (vs periode sebelumnya), headcount (vs berdasarkan

departemen).

o Analytical Dashboards

Setiap user yang berbeda membutuhkan tipe dashboard yang

berbeda juga. Contohnya saja pada manajer marketing mungkin

membutuhkan dashboard dari sisi strategical dan operational. Dan

hal tersebut sangat memungkinkan sehingga akan dibentuk dua

dashboard yang terpisah.

3. Mengelompokkan Dashboard Berdasarkan Data yang Saling Terkait

Dashboard yang dirancang dengan baik akan memastikan bahwa

data yang ditampilkan sudah dikelompokan secara logis. Misalnya, jika

31

sebuah dashboard menyertakan Financial KPIs and Sales Pipeline,

pastikan bahwa data keuangan ditampilkan di posisi yang sejajar secara

bersampingan satu sama lain. Pengelompokan sering dilakukan oleh

departemen atau area fungsional dan dapat mencakup: Produk (Inventaris,

pengembangan), Penjualan / Pemasaran, Keuangan (Aktual dan prakiraan).

4. Membuat Data yang Relevan Terhadap Audiens

Dashboard eksekutif dapat memiliki sejumlah pengguna yang

berbeda. Pastikan data yang Anda tampilkan relevan dengan pengguna.

Pikirkan cakupan dan jangkauan data Anda: Seluruh perusahaan,

Departemen, Individu, Pemasok.

Pastikan Anda mengerti dengan pasti siapa khalayak yang dituju

dan lingkup persyaratan mereka. Dalam sebuah organisasi kecil,

dashboard Eksekutif cenderung menyertakan data KPI di semua

departemen. Namun, di perusahaan yang lebih besar, masing-masing

departemen mungkin memiliki dashboard eksekutif mereka sendiri.

5. Menampilkan Metric yang Paling Penting

Dashboard seringkali tidak beraturan. Tampilan yang tidak

beraturan membelokkan fokus pada pesan penting dashboard tersebut.

Ada yang tidak beraturan dengan informasi yang berguna dan relevan dan

ada juga yang tidak beraturan dengan informasi yang tidak berguna dan

tidak relevan. Tak satu pun dari situasi ini diinginkan. Setiap tipe

dashboard mungkin memerlukan jumlah data yang berbeda (misalnya,

dashboard Eksekutif hanya memerlukan 6 nomor, sedangkan dashboard

operasional mungkin memerlukan lebih dari 20). Tidak ada peraturan yang

sulit dan cepat untuk diikuti di sini, kecuali memastikan bahwa semua

yang Anda tampilkan relevan dan bermakna bagi penonton.

6. Menentukan Interval Periode Data Harus di Perbaharui

Memastikan data dashboard diperbaharui pada interval yang tepat.

Contoh refresh rate pada dashboard meliputi: Real-time (atau mendekati

real-time), Harian, mingguan, bulanan. Sebagai aturan praktis, dashboard

operasional memerlukan data secara real-time atau mendekati waktu

nyata, sedangkan dashboard eksekutif / strategis memerlukan data yang

diperbaharui secara tidak sering.

32