tugas 2 data warehouse nuriyadi_10751000260

6
Nama : Nuriyadi NIM : 10751000260 B.Study : Data Warehouse A. SNOWFLAKE SCHEME Skema Snowflake adalah susunan logis dari tabel dalam database multidimensi sedemikian rupa sehingga menyerupai diagram hubungan entitas dalam bentuk Snowflake. Skema Snowflake diwakili oleh tabel fakta terpusat yang terhubung ke beberapa dimensi. Skema Snowflake ini mirip dengan skema bintang. Namun, dalam skema Snowflake, dimensi dinormalisasi ke dalam beberapa tabel terkait, sedangkan dimensi skema bintang adalah denormalized dengan dimensi masing-masing diwakili oleh sebuah tabel tunggal. Sebuah bentuk Snowflake yang kompleks muncul ketika dimensi sebuah skema Snowflake yang rumit, memiliki beberapa tingkat hubungan. The "snowflaking" efek nya hanya mempengaruhi tabel dimensi dan bukan tabel fakta. Snowflake skema Gambar berikut ini menunjukkan sebuah skema Snowflake dengan dua dimensi, masing-masing memiliki tingkat tiga. Skema Snowflake dapat memiliki jumlah dimensi dan dimensi masing-masing dapat memiliki sejumlah tingkat.

Upload: yaditifsuska

Post on 25-Jun-2015

162 views

Category:

Documents


6 download

TRANSCRIPT

Page 1: Tugas 2 Data Warehouse Nuriyadi_10751000260

Nama : Nuriyadi

NIM : 10751000260

B.Study : Data Warehouse

A. SNOWFLAKE SCHEME

Skema Snowflake adalah susunan logis dari tabel dalam database multidimensi

sedemikian rupa sehingga menyerupai diagram hubungan entitas dalam bentuk Snowflake.

Skema Snowflake diwakili oleh tabel fakta terpusat yang terhubung ke beberapa dimensi.

Skema Snowflake ini mirip dengan skema bintang. Namun, dalam skema Snowflake,

dimensi dinormalisasi ke dalam beberapa tabel terkait, sedangkan dimensi skema bintang adalah

denormalized dengan dimensi masing-masing diwakili oleh sebuah tabel tunggal. Sebuah bentuk

Snowflake yang kompleks muncul ketika dimensi sebuah skema Snowflake yang rumit,

memiliki beberapa tingkat hubungan. The "snowflaking" efeknya hanya mempengaruhi tabel

dimensi dan bukan tabel fakta.

Snowflake skema

Gambar berikut ini menunjukkan sebuah skema Snowflake dengan dua dimensi, masing-

masing memiliki tingkat tiga. Skema Snowflake dapat memiliki jumlah dimensi dan dimensi

masing-masing dapat memiliki sejumlah tingkat.

Page 2: Tugas 2 Data Warehouse Nuriyadi_10751000260

Penggunaan Umum

Star dan skema Snowflake yang paling sering ditemukan di gudang data dimensi dan data

mart di mana kecepatan pengambilan data lebih penting daripada efisiensi manipulasi data.

Dengan demikian, tabel dalam skema ini tidak dinormalisasi banyak, dan sering dirancang pada

tingkat normalisasi pendek bentuk normal ketiga.

Keputusan apakah akan menggunakan skema bintang atau skema Snowflake harus

mempertimbangkan kekuatan relatif dari platform database yang dimaksud dan alat query untuk

dipekerjakan. Skema Star harus disesuaikan dengan alat query yang sebagian besar pengguna

untuk mengekspos struktur tabel yang mendasar. Skema Snowflake sering lebih baik digunakan

dengan menggunakan tool query yang lebih canggih yang mengisolasi pengguna dari struktur

tabel baku dan untuk lingkungan yang memiliki banyak query dengan kriteria yang kompleks.

Normalisasi data dan penyimpanan

Normalisasi data untuk menghindari redundansi (duplikasi) dengan menggerakkan

umumnya kelompok pengulangan data ke dalam tabel baru. Normalisasi itu cenderung

meningkatkan jumlah tabel yang harus bergabung untuk melakukan query yang diberikan,

namun mengurangi ruang yang dibutuhkan untuk menyimpan data dan jumlah tempat-tempat itu

perlu diperbarui jika perubahan data.

Dari sudut pandang ruang penyimpanan, tabel dimensi biasanya kecil dibandingkan dengan

tabel fakta. Hal ini sering menghilangkan manfaat ruang penyimpanan snowflaking tabel

dimensi, dibandingkan dengan skema bintang.

Beberapa pengembang database kompromi dengan menciptakan skema Snowflake yang

mendasar dengan pandangan yang dibangun di atasnya banyak yang melakukan yang diperlukan

bergabung untuk mensimulasikan suatu skema bintang. Ini memberikan manfaat penyimpanan

dicapai melalui normalisasi dimensi dengan kemudahan query yang menyediakan skema

bintang. Tradeoff adalah bahwa membutuhkan server untuk melakukan mendasari bergabung

secara otomatis dapat mengakibatkan kinerja yang menyerang ketika query serta tambahan

bergabung untuk tabel yang mungkin tidak diperlukan untuk memenuhi permintaan tertentu.

Page 3: Tugas 2 Data Warehouse Nuriyadi_10751000260

Manfaat dari " S nowflak e "

Beberapa alat OLAP multidimensi pemodelan database yang menggunakan mart dimensi

data sebagai sumber data yang dioptimalkan untuk skema Snowflake.

Jika dimensi sangat tipis (yaitu sebagian besar nilai yang mungkin untuk dimensi tidak

memiliki data) dan atau dimensi memiliki daftar yang sangat panjang atribut yang dapat

digunakan dalam query, tabel dimensi dapat menempati proporsi yang signifikan dari

database dan snowflaking yang mungkin tepat.

Tampilan multidimensi kadang ditambahkan ke database transaksional yang ada untuk

membantu pelaporan. Dalam hal ini, tabel-tabel yang menggambarkan dimensi sudah

akan ada dan biasanya akan dinormalisasi. Skema Snowflake sehingga akan lebih mudah

untuk diimplementasikan.

Skema Snowflake kadang-kadang dapat mencerminkan cara di mana pengguna berpikir

tentang data. Pengguna dapat memilih untuk menghasilkan query dengan menggunakan

skema bintang dalam beberapa kasus, walaupun ini mungkin atau mungkin tidak

tercermin dalam organisasi yang mendasari database.

Beberapa pengguna mungkin ingin mengajukan pertanyaan ke database yang

menggunakan alat-alat konvensional pelaporan multidimensi, tidak dapat dinyatakan

dalam skema bintang sederhana. Hal ini khususnya umum dalam data mining dari

database pelanggan, di mana persyaratan umum adalah untuk menemukan faktor umum

antara pelanggan yang membeli produk yang memenuhi kriteria yang kompleks.

Beberapa snowflaking biasanya akan diperlukan untuk memungkinkan alat query yang

sederhana untuk membentuk seperti query, terutama bila penyediaan bentuk-bentuk dari

query tidak diantisipasi ketika gudang data pertama kali dirancang.

B.STAR SCHEME

Page 4: Tugas 2 Data Warehouse Nuriyadi_10751000260

Star schema adalah rancangan database sederhana dimana data dimensi terpisah dari data

fakta. Star schema atau sering juga dinamakan model dimensi sangat cocok digunakan untuk

adhoc query. Star schema terdiri dari dua tipe tabel yaitu tabel fakta dan tabel dimensi. Tabel

fakta mengandung data kuantitatif mengenai bisnis seperti produk yang terjual, order yang telah

masuk, dan lainnya. Sedangkan tabel dimensi biasanya data yang digunakan untuk melakukan

kualifikasi, kategorisasi atau fakta ringkasan dalam query, laporan atau grafik. Star Schema yang

paling sederhana terdiri dari satu tabel fakta dan beberapa tabel dimensi. Tiap dimensi memiliki

relasi one-to-many ke tabel fakta. Tabel dimensi memiliki satu primary key, dimana primary key

tersebut merupakan foreign key pada tabel fakta.

Gambar berikut ini menunjukkan skema bintang dengan tabel fakta tunggal dan empat

tabel dimensi. Skema bintang dapat memiliki sejumlah tabel dimensi. Kaki burung gagak di

akhir dari link yang menghubungkan tabel menunjukkan hubungan-ke-satu banyak antara tabel

fakta dan tabel dimensi masing-masing.