mengenal sebagian tipe slowly changing dimensions...

8
Lisensi Dokumen: Copyright © 2008-2019 ilmuti.org Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit), dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org Mengenal Sebagian Tipe Slowly Changing Dimensions DWH Fadil Nur Syeha [email protected] Abstrak Dalam pengelolaan data, teknologi bernama data warehouse memiliki peran penting untuk mengelola data dalam volume besar sesuai dengan kebutuhan sebuah Organisasi atau Perusahaan. Data data yang tersimpan tesebut dapat mengalami perubahan, hal ini merefleksikan aspek dinamis dari data warehouse sehingga memerlukan updating beberapa dimensi table dimensi memiliki peran yang sangat penting dalam setiap Data Warehouse. Peran utama table dimensi adalah untuk mendukung catatan table fakta dengan deskripsi dan informasi lain tentang entitas yang terlibat pada catatan ini. Untuk mendukung pembentukan dimensi yang dinamis dalam sebuah data warehouse diimplementasikan sebuat kriteria dimensional yaitu Slowly Changing Dimensions (SCD) sehingga setiap perubahan data dapat terpelihara dengan baik. Pengertian singkat SCD sendiri adalah teknik menyimpan dimensi pada data warehouse dalam hubungannya terhadap perubahan dimensi dan atribut data. Terdapat banyak pendekatan mengenai tipe- tipe dari SCD, namun yang paling populer pendekatan dari SCD ada 6 yaitu, retain original (tipe 0), overwrite (tipe 1), add new row (tipe 2), add new attribute (tipe 3), add history table (tipe 4) dan Combine Approach (tipe 6). Kata Kunci: Data Watehouse, Slowly Change Dimension, Tipe SCD

Upload: buidieu

Post on 31-Mar-2019

259 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Mengenal Sebagian Tipe Slowly Changing Dimensions DWHilmuti.org/wp-content/uploads/2019/02/Fadil-Nur-Syeha_Mengenal...data dari berbagai sumber data operasional dan sikronisasi datanya

Lisensi Dokumen: Copyright © 2008-2019 ilmuti.org

Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit),

dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak

diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org

Mengenal Sebagian Tipe Slowly Changing Dimensions DWH

Fadil Nur Syeha

[email protected]

Abstrak

Dalam pengelolaan data, teknologi bernama data warehouse memiliki peran penting

untuk mengelola data dalam volume besar sesuai dengan kebutuhan sebuah Organisasi

atau Perusahaan. Data data yang tersimpan tesebut dapat mengalami perubahan, hal ini

merefleksikan aspek dinamis dari data warehouse sehingga memerlukan updating

beberapa dimensi table dimensi memiliki peran yang sangat penting dalam setiap Data

Warehouse. Peran utama table dimensi adalah untuk mendukung catatan table fakta

dengan deskripsi dan informasi lain tentang entitas yang terlibat pada catatan ini. Untuk

mendukung pembentukan dimensi yang dinamis dalam sebuah data warehouse

diimplementasikan sebuat kriteria dimensional yaitu Slowly Changing Dimensions (SCD)

sehingga setiap perubahan data dapat terpelihara dengan baik. Pengertian singkat SCD

sendiri adalah teknik menyimpan dimensi pada data warehouse dalam hubungannya

terhadap perubahan dimensi dan atribut data. Terdapat banyak pendekatan mengenai tipe-

tipe dari SCD, namun yang paling populer pendekatan dari SCD ada 6 yaitu, retain

original (tipe 0), overwrite (tipe 1), add new row (tipe 2), add new attribute (tipe 3), add

history table (tipe 4) dan Combine Approach (tipe 6).

Kata Kunci: Data Watehouse, Slowly Change Dimension, Tipe SCD

Page 2: Mengenal Sebagian Tipe Slowly Changing Dimensions DWHilmuti.org/wp-content/uploads/2019/02/Fadil-Nur-Syeha_Mengenal...data dari berbagai sumber data operasional dan sikronisasi datanya

Lisensi Dokumen: Copyright © 2008-2019 ilmuti.org

Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit),

dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak

diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org

Pendahuluan

Informasi dan data yang dikelola atau dimiliki oleh suatu organisasi atau perusahaan kini

telah berubah menjadi aset berharga untuk menentukan keputusan dalam perencanaan dan

pengembangan strategi dalam rangka memajukan organisasi atau perusahaan itu sendiri.

Selain itu memutuskan kebijakan yang cepat dan tepat, data dan informasi tersebut perlu

dipelihara untuk kemudahan akses sewaktu-waktu dibutuhkan misalnya untuk keperluan

analisis seperti data penjualan suatu barang dan lain-lain. Kemudahan akses data

operasional yanh bersifat historical dapat dikembangkan menjadi informasi guna

kebutuhan perencanaan atau kebutuhan strategis ke pedan dengan tujuan memperoleh

informasi yang relevan bagi kebutuhan organisasi yang dipakai untuk pengambilan

keputusan.

Untuk mendukung pengelolaan data yang baik, khususnya bagi organisasi atau

perusahaan yang memilik data dengan volume besar dan tersebar ke dalam database

terpisah, di era saat ini telah ada teknologi Data Warehouse yang dapat menggabungkan

data dari berbagai sumber data operasional dan sikronisasi datanya dapat dilakukan secara

periodik maupun real-time, disesuai dengan kebutuhan yang ada. “A Data Warehouse is

a Subject Oriented, Integrated, Non-Volatile, and Time-variant collection of data in

support of management’s decisions” Penerapan Data Warehouse yang baik dan sesuai

dengan kebutuhan secara otomatis memudahkan pengelolaan data dan proses

pengambilan informasi dari sumber data.

Contoh, data penjualan dari masing-masing toko mengentrikan data penjualan yang

disimpan kedalam database terpusat di suatu perusahaan retail besar dapat diambil dengan

mudah rangkuman datanya ketika digudangkan dalam suatu basis data besar (Data

Warehouse) terlebih dahulu. Data yang telah disimpan dapat mengalami perubahan, hal

ini menunjukkan aspek dinamis dari Data Warehouse sehingga memerlukan updating

beberapa dimensi. Perubahan-perubahan dalam catatan dimensi dapat menyebabkan

situasi tidak teratur jika tidak diperlakukan dengan baik. Untuk mendukung pembentukan

dimensi yang dinamis dalam sebuah Data Warehouse diimplementasikan sebuah kriteria

Page 3: Mengenal Sebagian Tipe Slowly Changing Dimensions DWHilmuti.org/wp-content/uploads/2019/02/Fadil-Nur-Syeha_Mengenal...data dari berbagai sumber data operasional dan sikronisasi datanya

Lisensi Dokumen: Copyright © 2008-2019 ilmuti.org

Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit),

dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak

diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org

Dimensional yaitu Slowly Changing Dimensions (SCD) sehingga data histori dapat

tersimpan dan diakses sewaktu-waktu.

Hasil dari sebuah Data Warehouse dapat dimanfaatkan untuk kepentingan OLAP (Online

Analytical Processing) yang memungkinkan dilakukan query dengan cepat dan

menghasilkan informasi secara multidimensi.

Pembahasan

Dmensi yang berubah perlahan dari waktu ke waktu, dimensi ini menyimpan nilai atau

data lama dari atribut sebuah dimensi. Dimensi adalah struktur yang mengkategorikan

kumpulan informasi sehingga. Dimensi dalam manajemen data dan data warehouse

(gudang data) berisi data yang relatif statis. Namun data dari dimensi dapat berubah

secara perlahan dari waktu ke waktu dan pada interval yang tidak dapat diprediksi. Jenis

data dari dimensi dapat dinamakan dengan Slowly Changing Dimension (SCD). Nilai

yang lama tersebut dapat disimpan untuk sebagai sebuah “sejarah perubahan nilai” dari

atribut sebuah dimensi yang berubah tersebut. Penyimpanan nilai yang lama ini

dapat dilakukan dengan cara membuat sebuah kolom yang khusus untuk menyimpan

nilai yang lama tersebut.

Pada pembahasan kali ini akan dijelaskan 4 tipe metodologi dari SCD, yaitu:

1. Type 0: retain original

2. Type 1: overwrite

3. Type 2: add new row

4. Type 3: add new attribute

Page 4: Mengenal Sebagian Tipe Slowly Changing Dimensions DWHilmuti.org/wp-content/uploads/2019/02/Fadil-Nur-Syeha_Mengenal...data dari berbagai sumber data operasional dan sikronisasi datanya

Lisensi Dokumen: Copyright © 2008-2019 ilmuti.org

Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit),

dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak

diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org

1. Type 0 : Retain Original

Dapat disebut dengan “metode pasif”. Metodologi ini tidak ada tindakan khusus yang

dilakukan jika terjadi perubahan dalam suatu dimensi. Beberapa data dari dimensi

menjadi tetap sama seperti pertama kali dimasukkan.

Contoh: BirthOfDay.

2. Type 1 : Overwrite

Dapat disebut dengan “mengganti nilai lama”. Dalam metodologi ini tidak ada

riwayat dari perubahan dimensi yang disimpan dalam database. Nilai dimensi dari

data yang lama hanya diganti dengan yang baru. Jenis metode ini mudah dipelihara

(maintain) dan sering digunakan untuk data yang perubahannya disebabkan oleh

proses dari koreksi data, misalnya seperti penghapusan karakter khusus atau

memperbaiki ejaan data.

Page 5: Mengenal Sebagian Tipe Slowly Changing Dimensions DWHilmuti.org/wp-content/uploads/2019/02/Fadil-Nur-Syeha_Mengenal...data dari berbagai sumber data operasional dan sikronisasi datanya

Lisensi Dokumen: Copyright © 2008-2019 ilmuti.org

Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit),

dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak

diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org

Contoh dari metode ini ditunjukkan pada tabel 1. Terdapat tabel yang memiliki data

Corporate dari kolom CustType, kemudia terdapat perubahan pada tabel 2. Kolom

CustType menjadi Retail. Perubahan tersebut dapat berubaha sesuai kedaan kondisi

data yang dibutuhkan saat ini.

Sebelum perubahan:

CustD CustName CustType

1 Cust_1 Corporate

Table 1: Sebelum perubahan CustType

Setelah perubahan:

CustD CustName CustType

1 Cust_1 Retail

Table 2: Setelah perubahan CustType

3. Type 2 : Add New Row

Dapat disebut dengan “membuat tambahan baris baru”. Dalam metodologi ini

melacak data historis dengan membuat beberapa records sebuah natural key diberikan

dalam tabel dimensi dengan surrogate key terpisah dan/atau nomor versi yang

berbeda. Riwayat tak terbatas dipertahankan untuk setiap masukan (insert).

Kondisi sebelum perubahan:

CustD CustName CustType

1 Cust_1 Corporate

Table 3: Sebelum perubahan CustType

Ada beberapa sub metode dalam type 2 ini, yaitu:

1) Menggunakan version number

Setelah perubahan:

CustD CustName CustType Version

Page 6: Mengenal Sebagian Tipe Slowly Changing Dimensions DWHilmuti.org/wp-content/uploads/2019/02/Fadil-Nur-Syeha_Mengenal...data dari berbagai sumber data operasional dan sikronisasi datanya

Lisensi Dokumen: Copyright © 2008-2019 ilmuti.org

Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit),

dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak

diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org

1 Cust_1 Corporate 0

2 Cust_1 Retail 1

Table 4: Setelah perubahan CustType

Catatan: jika CustType mengalami perubahan, maka Version akan meningikat

secara berurutan.

2) Menambahkan kolom ‘Effective Date’

Sesudah perubahan:

CustD CustName CustType StartDate EndDate

1 Cust_1 Corporate 01-01-2018 \s\31-01-2018

2 Cust_1 Retail 01-02-2018 NULL

Table 5: Setelah perubahan CustType

Catatan: NULL pada EndDate di baris kedua menunjukan versi tupple saat ini.

3) Menambahkan kolom ‘Effetive Date’ dan ‘Current Flag’

Sesudah perubahan:

CustD CustName CustType EffectiveDate CurrentFlag

1 Cust_1 Corporate 01-01-2018 \N

2 Cust_1 Retail 01-02-2018 Y

Table 6: Setelah perubahan CustType

Catatan: nilai 'Y' dari CurrentFlag menunjukkan versi tupel saat ini.

4. Type 3 : Add New Attribute

Dapat disebut dengan “Menambahkan Kolom Baru”. Dalam tipe ini biasanya hanya

nilai dimensi saat ini dan sebelumnya disimpan di database. Nilai baru dimuat dalam

kolom ‘Sekarang/Baru’ (Current Type) dan kolom lama dimuat dalam kolom lama

yang diberi nama ‘Lama/Sebelumnya’ (Previous Type). SCD tipe 3 menggunakan

Page 7: Mengenal Sebagian Tipe Slowly Changing Dimensions DWHilmuti.org/wp-content/uploads/2019/02/Fadil-Nur-Syeha_Mengenal...data dari berbagai sumber data operasional dan sikronisasi datanya

Lisensi Dokumen: Copyright © 2008-2019 ilmuti.org

Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit),

dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak

diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org

kolom untuk menyimpan datalama setelah perubahan terjadi, yang

menyebabkannya tidak terlalu fleksibel untuk Metode ini ideal digunakan pada

situasi dimana tidak terlalu banyak data peruabahan yang ingin disimpan, atau

jumlah perubahan yang ingindisimpan diketahui secara pasti.Metode ini juga sesuai

apabila perubahan data pada atribut tersebut akan mempengaruhi banyakbaris data

lainnya, atau nilai atribut ini diubah oleh banyak baris data lain secara bersamaan.

Sebelum perubahan:

CustD CustName CurrentType PreviousType

1 Cust_1 Corporate Corporate

Table 7: Sebelum perubahan kolom CurrentType

Setelah perubahan:

CustD CustName CurrentType PreviousType

1 Cust_1 Retail Corporate

Table 7: Setelah perubahan kolom CurrentType

Itulah sebagian Metodologi yang ada pada Slowly Changing Dimensions.

Penutup

Kesimpulan:

Dari data yang telah dipaparkan diatas maka penulis dapat menyimpulkan bawha setiap

Type pada Slowly Changing Dimension memiliki kelebihan dan kekurangan masing

masing, semua dapat diterapkan sesuai dengan kebutuhan dan kepentingan Organisasi

atau Perusahaan itu sendiri.

Saran:

Meskipun penulis menginginkan kesempurnaan dalam penulisan artikel ini akan tetapi

pada kenyataannya masih banyak kekurangan yang perlu penulis perbaiki. Hal ini

dikarenakan masih minimnya pengetahuan penulis. Oleh karena itu kritik dan saran yang

Page 8: Mengenal Sebagian Tipe Slowly Changing Dimensions DWHilmuti.org/wp-content/uploads/2019/02/Fadil-Nur-Syeha_Mengenal...data dari berbagai sumber data operasional dan sikronisasi datanya

Lisensi Dokumen: Copyright © 2008-2019 ilmuti.org

Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit),

dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak

diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org

membangun dari para pembaca sangat penulis harapkan sebagai bahan evaluasi untuk

kedepannya.

Referensi

Sumber:

en.wikipedia.org/wiki/Slowly_changing_dimension

mti.binus.ac.id/2018/05/21/slowly-changing-dimension-pada-data-warehouse/

henryeka.wordpress.com/2013/02/12/scd-slowly-changing-dimension/

media.neliti.com/media/publications/88455-ID-penerapan-slowly-changing-

dimensions-unt.pdf

asriyar.wordpress.com/2012/10/17/slowly-changing-dimension-scd/

R. Kimball,J.Caserta.,"The data warehouse ETL toolkit : practical techniques for

extracting, cleaning, conforming, and delivering data",Wiley, 2004.

Biografi

Nama saya Fadil Nur Syeha, saya mahasiswa semester 6 jurusan Sistem Informasi di STMIK

Raharja, konsentrasi yang saya ambil adalah Sistem Informasi Manajemen. Saya sangat

tertarik dengan dunia IT dan wirausaha. Hobi saya berolahraga, membaca, menjelajah

internet, bermain game dan traveling.

FOTO