edmund & hady
DESCRIPTION
EDMUNDTRANSCRIPT
Tugas Kelompok Dosen Pengampu
Data Warehouse Megawati S.Kom M.Kom
Slide Lecture 3
DISUSUN OLEH :
EDMUND ANDRIANO [11353104438] = Halaman 1 - 6
HADY EKA SAPUTRA [11353106489] = Halaman 6 - 11
KELAS V F
JURUSAN SISTEM INFORMASI
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SULTAN SYARIF KASIM RIAU
T.A.2015/2016
Model entity relationship (ER) adalah teknik untuk mengidentifikasi hubungan antar
entitas. Sasaran utama dari pemodelan ER ini adalah untuk menghilangkan redudansi dari
data. Hal ini sangat berguna pada proses transaksi karena dalam transaksi harus dibuat
sederhana dan deterministik. Dimensional Modeling adalah teknik pemodelan favorit dalam
Data Warehouse. Di dalam Dimensional Modeling, sebuah model tabel dan relasi digunakan
untuk tujuan pengoptimalan kinerja kueri pengambilan keputusan dalam database relasional,
relatif terhadap pengukuran atau seperangkat pengukuran proses bisnis yang akan dimodel.
langkah-langkah perancangan pembuatan database pada warehouse
Menurut Kimball ada sembilan tahap metodologi dalam perancangan database
untuk data warehouse, yaitu :
Langkah 1 : Pemilihan proses
Data mart yang pertama kali dibangun haruslah data mart yang dapat dikirim
tepat waktu dan dapat menjawab semua pertanyaan bisnis yang penting
Pilihan terbaik untuk data mart yang pertama adalah yang berhubungan dengan
sales, misal property sales, property leasing,property advertising.
Langkah 2 : Pemilihan sumber
Untuk memutuskan secara pasti apa yang diwakili atau direpresentasikan oleh
sebuah tabel fakta.
Misal, jika sumber dari sebuah tabel fakta properti sale adalah properti sale
individual maka sumber dari sebuah dimensi pelanggan berisi rincian pelanggan
yang membeli properti utama
Langkah 3 : Mengidentifikasi dimensi
Set dimensi yang dibangun dengan baik, memberikan kemudahan untuk
memahami dan menggunakan data mart
Dimensi ini penting untuk menggambarkan fakta-fakta yang terdapat pada tabel
fakta
Misal, setiap data pelanggan pada tabel dimensi pembeli dilengkapi dengan
id_pelanggan,no_pelanggan,tipe_pelanggan,tempat_tinggal, dan lain sebagainya.
Jika ada dimensi yang muncul pada dua data mart,kedua data mart tersebut harus
berdimensi sama,atau paling tidak salah satunya berupa subset matematis dari yang
lainnya.
Jika sebuah dimensi digunakan pada dua data mart atau lebih,dan dimensi ini
tidak disinkronisasi,maka keseluruhan data warehouse akan gagal, karena dua data
mart tidak bisa digunakan secara bersama-sama
Langkah 4 : Pemilihan fakta
Sumber dari sebuah tabel fakta menentukan fakta mana yang bisa digunakan
dalam data mart.
Semua fakta harus diekspresikan pada tingkat yang telah ditentukan oleh sumber
Langkah 5 : Menyimpan pre-kalkulasi di tabel fakta
Hal ini terjadi apabila fakta kehilangan statement
Langkah 6 : Melengkapi tabel dimensi
Pada tahap ini kita menambahkan keterangan selengkap-lengkapnya pada tabel
dimensi
Keterangannya harus bersifat intuitif dan mudah dipahami oleh pengguna
Langkah 7 : Pemilihan durasi database
Misalnya pada suatu perusahaan asuransi, mengharuskan data disimpan selama
10 tahun atau lebih
Langkah 8 : Menelusuri perubahan dimensi yang perlahan
Ada tiga tipe perubahan dimensi yang perlahan, yaitu :
o Tipe 1. Atribut dimensi yang telah berubah tertulis ulang
o Tipe 2. Atribut dimensi yang telah berubah menimbulkan sebuah dimensi baru
o Tipe 3. Atribut dimensi yang telah berubah menimbulkan alternatif sehingga nilai
atribut lama dan yang baru dapat diakses secara bersama pada dimensi yang sama.
Langkah 9 : Menentukan prioritas dan mode query
Pada tahap ini kita menggunakan perancangan fisik.
Model Entity Relationship diperkenalkan pertama kali oleh P.P. Chen pada
tahun 1976. Model ini dirancang untuk menggambarkan persepsi dari pemakai dan
berisi obyek-obyek dasar yang disebut entity dan hubungan antar entity-entity tersebut
yang disebut relationship. Pada model ER ini semesta data yang ada dalam dunia nyata
ditransformasikan dengan memanfaatkan perangkat konseptual menjadik sebuah
diagram, yaitu diagram ER ( Entity Relationship)
Entitas adalah sesuatu yang memiliki keberadaan yang unik dan berbeda,
walaupun tidak harus dalam bentuk fisik. Relation (Relasi) merupakan sebuah tabel
dengan kolom-kolom dan baris-baris. Pada model relasional, relasi digunakan untuk
menyimpan informasi mengenai objek-objek yang direpresentasikan dalam sebuah
basis data. Normalisasi merupakan teknik analisis data yang mengorganisasikan
atribut-atribut data dengan cara mengelompokkan sehingga terbentuk entitas yang
non-redundant, stabil, dan fleksible
Tabel diatas adalah tabel normal karena setiap atribut tidak memiliki data yang
redudan. Tetapi masih dalam bentuk 1NF.
Nama bergantung dengan productCode , Time bergantung dengan product code .
Deskripsi bergantung dengan ComponenCode, Supplier bergantung dengan ComponenCode
,Cost bergantung dengan ComponentCode, Quantity bergantung pada ComponentCode dan
Product Code
Pada bentuk 3NF adan didapat kardinalitas sebagai berikut :
product : ProductCode -> Name , Time
Parts : ProductCode -> ComponentCode , Qty
Component: ComponentCode -> description , supplier, Cost
Didapat seperti pada slide diatas merupakan tabel yang sudah dinormalisasi.
Suatu model yang menggabungkan dimensi dan fact bersamaan dikenal dengan
dimensional model. Di dalam model ini, tabel fact terdiri dari pengukuran numerik yang
disertakan ke seperangkat tabel dimensi yang dipenuhi atribut deksriptif. Di dalam model ini,
Tabel fact berada di tengah dan tabel dimensi bergelantungan disekitarnya seperti sebuah
bintang. Struktur dengan karakteristik demikian seringkali dikenal dengan star schema. Saat
id pelanggan, id produk dan periode waktu digunakan untuk menentukan baris-baris manakah
yang dipilih dari tabel fact, cara pengumpulan data demikian dikenal dengan istilah star
schema join.
Sale merupakan tabel fact dengan atribut : time key, store key , costumer key, product
key , dollars sales , unit sales ,
Time merupakan dimensi degan atribut : time key , day , month
Store merupakan dimensi dengan atribut : store key , address , region
Customer merupakan dimensi dengan atribut : customer key , name , customer type
Product merupakan dimensi dengan atribut : product key , product type, weight
Snowflake Schema Merupakan pengembangan dari star schema, ia juga mempunyai
satu atau lebih dimensi. Hanya saja pada snowflake, tabel yang berelasi pada fact table hanya
tabel dimensi utama, sedangkan tabel yang lain dihubungkan pada tabel dimensi utama
Kelebihan Snowflake Schema
a. Ukuran penyimpanan kecil didalam tempat penyimpanan.
b. Struktur yang normal lebih mudah untuk di-update dan di-maintenance
Kekurangan Snowflake Schema
a. Kurang jelas dan penggunaan akhir terhambat oleh kompleksitas.
b. Sulit untuk mencari isi, karena kompleks.
c. Performa query menurun karena adanya join table antar dimensi.
Pengembangan model dilakukan berdasarkan eksplorasi model dan data dari
sumber data. Beberapa ahli yang menyarankan metode ini adalah Golfarelli, Inmon,
serta Phipps dan Davis. Model konseptual untuk sebuah data warehouse berasal dari
model data sumber yang ditransformasi.
Adalah sistem perangkat lunak yang di design untuk memungkinkan proses
penyimpanan yang nyaman dan efisien dan sistem pemanggilan dari data yang berukuran
besar, bersifat sangat berkaitan dan dapat disimpan, ditampilkan, dianalisa dalam tujuan
berbeda. Atribut yang terasosiasikan adalah atribut yang saling berhubungan satu yang lain
Cube adalah struktur yang berisi nilai untuk satu atau lebih pengukuran untuk setiap
kombinasi unik dari anggota dalam semua dimensi. Dimensi dapat dipandang sebagai entitas
, dan setiap atribut akan menjelaskan isi dari suatu entitas tersebut Slicing dan dicing adalah
operasi untuk melihat data sebagai visualisasi dari kubus. Dengan slicing dan dicing
pengguna dapat melihat data dari beberapa perspektif Slicing memotong kubus sehingga
dapat memfokuskan pada perspektif yang spesifik (pada suatu dimensi) Sedangkan dicing
memberikan kemampuan untuk melihat pemilihan data pada dua dimensi atau lebih. report
adalah program yang menerima data dari data warehouse dan mempresentasikan ke user.
(Codd et al., 1995). OLAP memungkinkan user untuk mendapatkan
pemahaman yang lebih dalam pengetahuan tentang berbagai aspek data perusahaan
mereka dengan cepat, konsisten, dan interaktif. OLAP memungkinkan untuk melihat
tampilan data perusahaan sedemikian rupa dimana memberikan sebuah gambaran
yang lebih baik dari dimensi sebenarnya dari perusahaan. Umumnya OLAP meliputi
aktivitas-aktivitas seperti pembangkitan query, permintaan laporan khusus dan grafik,
dan melakukan analisis statistik. Relational OLAP, menggunakan Relational Database
baik untuk menyimpan Detail data maupun untuk menyimpan Aggregate nya.
Agregat adalah nilai yang dibentuk dengan menggabungkan nilai-nilai dari dimensi
tertentu atau seperangkat dimensi untuk menciptakan nilai tunggal. Beberapa software
OLAP yang dipasarkan antara lain :PowerPlay (Cagnos Software) , Express Server
(Oracle) Metacube (Informix/Stanford Technology Group) ,HighGate (Sybase) .
Suatu model yang menggabungkan dimensi dan fact bersamaan dikenal dengan
dimensional model. Table fact adalah sebuah tabel adalah tabel primer di dalam
model dimensional dimana pengukuran kinerja secara numerik dari bisnis disimpan.
Tabel fact berada di tengah dan tabel dimensi bergelantungan disekitarnya seperti
sebuah bintang. Struktur dengan karakteristik demikian seringkali dikenal dengan star
schema. Star schema digunakan untuk database dengan dimensi
yang cukup banyak antara 10-15.
Indentifikasi area bisnis
Mengidentifikasi dan mengukur inti tabel fact
Identifikasi dimensi dengan menentukanm dimensi untuk setiap baris tabel fact
Mengidentifikasi fakta numerik yang akan mengisi setiap baris tabel fakta
Melengkapi tabel data dan memperbaiki data yang masih tidak normal (normalisasi)
Pemodelan ini adalah teknik desain untuk menstrukturkan dimensi bisnis dan matrik
yang dianalisis bersama dengan dimensi-dimensi . Model juga memberikan kinerja
tinggi untuk analisis dan kueri. Kelemahan dari model kimbal adalah belum
terintegrasi dan belum adanya penyesuaian model dengan sistem yang sudah ada.
Untuk tahapan merancang data warehouse adalah sesuai dengan kebutuhan bisnis dari
pihak perusahaan.
Perancangan data model data warehouse berdasarkan dari tabel fakta dan dimensi,
untuk pemilihan sumber harus mengacu pada kemampuan untuk merepresentasikan
fakta-fakta yang di ambil dari berbagi sumber dimensi pada OLTP
Pemilihan sumber dari sebuah tabel fakta akan menentukan fakta mana yang akan
digunakan.
Dimensi ini untuk menggambarkan fakta-fakta pada tabel fakta
Pada tahap ini kita menambahkan keterangan selengkap-lengkapnya pada tabel
dimensi dan harus bersifat intuitif dan mudah dipahami oleh pengguna.
Ada tiga tipe perubahan dimensi yaitu atribut dimensi yang telah berubah tertulis
ulang, menimbulkan sebuah dimensi baru dan dimensi yang telah berubah
menimbulkan alternatif, sehingga nilai atribut lama dan yang baru dapat
diakses secara bersama pada dimensi yang sama. Menyimpan pre-kalkulasi di tabel
fakta karena hal ini akan terjadi jika tabel fakta kehilangan statement sesuai dengan
fakta yang dibutuhkan. Menentukan prioritas dan mode query, berkaitan dengan
perancangan fisik.
Adalah star schema ,tabel sales merupakan tabel fact dan tabel dimensi
time, promotion, product dan store
Dalam sebuah Data Warehouse atau Data Mart, Pengukuran disimpan
dalam tabel fact dengan tingkat ketelitian sedemikian rupa sehingga pengguna
dapat melacak ringkasan berdasarkan levelnya. Hal ini dikenal dengan agregasi.
Sebagai contoh, jika data penjualan dalam sebuah toko grosirdijaga dalam level
sebuah pelanggan tunggal yang membeli item tertentu pada hari tertentu dalam
toko tertentu, sehingga kita dapat meringkas atau menjumlahkan data untuk
hari, minggu, bulan, kuartal dan tahun tertentu; dan semua hal ini adalah untuk
sebuah toko, zona, wilayah dan negara sebagaimana beradasarkan produk,
kelompok produk, departemen dan seterusnya.
Hanya data penjualan pada level terendah yang dijaga dalam tabel fact,
namun deskripsi dari berbagai level data di jaga dalam tabel dimensi,sehingga
tool yang sesuai dapat digunakan untuk meringkas data dalam level yang
bervariasi.
Sebuah hierarki mendefinisikan sebuah urutan pemetaan dari
seperangkat konsep low-level hingga level yang lebih tinggi, konsep level yang
lebih umum. Bayangkan sebuah hierarki dimensi Lokasi. Jika Kota adalah level
terendah dari hierarki , maka semua kota dapat dipetakan ke level yang lebih
tinggi lagi, yakni provinsi, dan semua provinsi dapat dipetakan ke level yang
lebih tinggi lagi yakni negara. Dst.
Level dimensional membentuk struktur seperti sebuah pohon dan
anggota level terendah dari hieararki dikenal dengan leaf. Hanya ada satu
anggota pada level paling atas. Sebuah dimensi tidak dapat eksis tanpa
anggota leafnya, namun hal yang mungkin untuk memiliki sebuah dimensi
tanpa anggota leaf – yakni yang hanya memiliki sebuah level.