tugas 2 data warehouse nuriyadi_10751000260
TRANSCRIPT
![Page 1: Tugas 2 Data Warehouse Nuriyadi_10751000260](https://reader031.vdokumen.com/reader031/viewer/2022013003/5571f85f49795991698d4829/html5/thumbnails/1.jpg)
Nama : Nuriyadi
NIM : 10751000260
B.Study : Data Warehouse
A. SNOWFLAKE SCHEME
Skema Snowflake adalah susunan logis dari tabel dalam database multidimensi
sedemikian rupa sehingga menyerupai diagram hubungan entitas dalam bentuk Snowflake.
Skema Snowflake diwakili oleh tabel fakta terpusat yang terhubung ke beberapa dimensi.
Skema Snowflake ini mirip dengan skema bintang. Namun, dalam skema Snowflake,
dimensi dinormalisasi ke dalam beberapa tabel terkait, sedangkan dimensi skema bintang adalah
denormalized dengan dimensi masing-masing diwakili oleh sebuah tabel tunggal. Sebuah bentuk
Snowflake yang kompleks muncul ketika dimensi sebuah skema Snowflake yang rumit,
memiliki beberapa tingkat hubungan. The "snowflaking" efeknya hanya mempengaruhi tabel
dimensi dan bukan tabel fakta.
Snowflake skema
Gambar berikut ini menunjukkan sebuah skema Snowflake dengan dua dimensi, masing-
masing memiliki tingkat tiga. Skema Snowflake dapat memiliki jumlah dimensi dan dimensi
masing-masing dapat memiliki sejumlah tingkat.
![Page 2: Tugas 2 Data Warehouse Nuriyadi_10751000260](https://reader031.vdokumen.com/reader031/viewer/2022013003/5571f85f49795991698d4829/html5/thumbnails/2.jpg)
Penggunaan Umum
Star dan skema Snowflake yang paling sering ditemukan di gudang data dimensi dan data
mart di mana kecepatan pengambilan data lebih penting daripada efisiensi manipulasi data.
Dengan demikian, tabel dalam skema ini tidak dinormalisasi banyak, dan sering dirancang pada
tingkat normalisasi pendek bentuk normal ketiga.
Keputusan apakah akan menggunakan skema bintang atau skema Snowflake harus
mempertimbangkan kekuatan relatif dari platform database yang dimaksud dan alat query untuk
dipekerjakan. Skema Star harus disesuaikan dengan alat query yang sebagian besar pengguna
untuk mengekspos struktur tabel yang mendasar. Skema Snowflake sering lebih baik digunakan
dengan menggunakan tool query yang lebih canggih yang mengisolasi pengguna dari struktur
tabel baku dan untuk lingkungan yang memiliki banyak query dengan kriteria yang kompleks.
Normalisasi data dan penyimpanan
Normalisasi data untuk menghindari redundansi (duplikasi) dengan menggerakkan
umumnya kelompok pengulangan data ke dalam tabel baru. Normalisasi itu cenderung
meningkatkan jumlah tabel yang harus bergabung untuk melakukan query yang diberikan,
namun mengurangi ruang yang dibutuhkan untuk menyimpan data dan jumlah tempat-tempat itu
perlu diperbarui jika perubahan data.
Dari sudut pandang ruang penyimpanan, tabel dimensi biasanya kecil dibandingkan dengan
tabel fakta. Hal ini sering menghilangkan manfaat ruang penyimpanan snowflaking tabel
dimensi, dibandingkan dengan skema bintang.
Beberapa pengembang database kompromi dengan menciptakan skema Snowflake yang
mendasar dengan pandangan yang dibangun di atasnya banyak yang melakukan yang diperlukan
bergabung untuk mensimulasikan suatu skema bintang. Ini memberikan manfaat penyimpanan
dicapai melalui normalisasi dimensi dengan kemudahan query yang menyediakan skema
bintang. Tradeoff adalah bahwa membutuhkan server untuk melakukan mendasari bergabung
secara otomatis dapat mengakibatkan kinerja yang menyerang ketika query serta tambahan
bergabung untuk tabel yang mungkin tidak diperlukan untuk memenuhi permintaan tertentu.
![Page 3: Tugas 2 Data Warehouse Nuriyadi_10751000260](https://reader031.vdokumen.com/reader031/viewer/2022013003/5571f85f49795991698d4829/html5/thumbnails/3.jpg)
Manfaat dari " S nowflak e "
Beberapa alat OLAP multidimensi pemodelan database yang menggunakan mart dimensi
data sebagai sumber data yang dioptimalkan untuk skema Snowflake.
Jika dimensi sangat tipis (yaitu sebagian besar nilai yang mungkin untuk dimensi tidak
memiliki data) dan atau dimensi memiliki daftar yang sangat panjang atribut yang dapat
digunakan dalam query, tabel dimensi dapat menempati proporsi yang signifikan dari
database dan snowflaking yang mungkin tepat.
Tampilan multidimensi kadang ditambahkan ke database transaksional yang ada untuk
membantu pelaporan. Dalam hal ini, tabel-tabel yang menggambarkan dimensi sudah
akan ada dan biasanya akan dinormalisasi. Skema Snowflake sehingga akan lebih mudah
untuk diimplementasikan.
Skema Snowflake kadang-kadang dapat mencerminkan cara di mana pengguna berpikir
tentang data. Pengguna dapat memilih untuk menghasilkan query dengan menggunakan
skema bintang dalam beberapa kasus, walaupun ini mungkin atau mungkin tidak
tercermin dalam organisasi yang mendasari database.
Beberapa pengguna mungkin ingin mengajukan pertanyaan ke database yang
menggunakan alat-alat konvensional pelaporan multidimensi, tidak dapat dinyatakan
dalam skema bintang sederhana. Hal ini khususnya umum dalam data mining dari
database pelanggan, di mana persyaratan umum adalah untuk menemukan faktor umum
antara pelanggan yang membeli produk yang memenuhi kriteria yang kompleks.
Beberapa snowflaking biasanya akan diperlukan untuk memungkinkan alat query yang
sederhana untuk membentuk seperti query, terutama bila penyediaan bentuk-bentuk dari
query tidak diantisipasi ketika gudang data pertama kali dirancang.
B.STAR SCHEME
![Page 4: Tugas 2 Data Warehouse Nuriyadi_10751000260](https://reader031.vdokumen.com/reader031/viewer/2022013003/5571f85f49795991698d4829/html5/thumbnails/4.jpg)
Star schema adalah rancangan database sederhana dimana data dimensi terpisah dari data
fakta. Star schema atau sering juga dinamakan model dimensi sangat cocok digunakan untuk
adhoc query. Star schema terdiri dari dua tipe tabel yaitu tabel fakta dan tabel dimensi. Tabel
fakta mengandung data kuantitatif mengenai bisnis seperti produk yang terjual, order yang telah
masuk, dan lainnya. Sedangkan tabel dimensi biasanya data yang digunakan untuk melakukan
kualifikasi, kategorisasi atau fakta ringkasan dalam query, laporan atau grafik. Star Schema yang
paling sederhana terdiri dari satu tabel fakta dan beberapa tabel dimensi. Tiap dimensi memiliki
relasi one-to-many ke tabel fakta. Tabel dimensi memiliki satu primary key, dimana primary key
tersebut merupakan foreign key pada tabel fakta.
Gambar berikut ini menunjukkan skema bintang dengan tabel fakta tunggal dan empat
tabel dimensi. Skema bintang dapat memiliki sejumlah tabel dimensi. Kaki burung gagak di
akhir dari link yang menghubungkan tabel menunjukkan hubungan-ke-satu banyak antara tabel
fakta dan tabel dimensi masing-masing.