edmund & hady

17
Tugas Kelompok Dosen Pengampu Data Warehouse Megawati S.Kom M.Kom Slide Lecture 3 DISUSUN OLEH : EDMUND ANDRIANO [11353104438] = Halaman 1 - 6 HADY EKA SAPUTRA [11353106489] = Halaman 6 - 11 KELAS V F JURUSAN SISTEM INFORMASI FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS ISLAM NEGERI SULTAN SYARIF KASIM RIAU T.A.2015/2016

Upload: tajie-famecco

Post on 18-Feb-2016

241 views

Category:

Documents


11 download

DESCRIPTION

EDMUND

TRANSCRIPT

Page 1: Edmund & Hady

Tugas Kelompok Dosen Pengampu

Data Warehouse Megawati S.Kom M.Kom

Slide Lecture 3

DISUSUN OLEH :

EDMUND ANDRIANO [11353104438] = Halaman 1 - 6

HADY EKA SAPUTRA [11353106489] = Halaman 6 - 11

KELAS V F

JURUSAN SISTEM INFORMASI

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI SULTAN SYARIF KASIM RIAU

T.A.2015/2016

Page 2: Edmund & Hady

Model entity relationship (ER) adalah teknik untuk mengidentifikasi hubungan antar

entitas. Sasaran utama dari pemodelan ER ini adalah untuk menghilangkan redudansi dari

data. Hal ini sangat berguna pada proses transaksi karena dalam transaksi harus dibuat

sederhana dan deterministik. Dimensional Modeling adalah teknik pemodelan favorit dalam

Data Warehouse. Di dalam Dimensional Modeling, sebuah model tabel dan relasi digunakan

untuk tujuan pengoptimalan kinerja kueri pengambilan keputusan dalam database relasional,

relatif terhadap pengukuran atau seperangkat pengukuran proses bisnis yang akan dimodel.

langkah-langkah perancangan pembuatan database pada warehouse

Menurut Kimball ada sembilan tahap metodologi dalam perancangan database

untuk data warehouse, yaitu :

Langkah 1 : Pemilihan proses

Data mart yang pertama kali dibangun haruslah data mart yang dapat dikirim

Page 3: Edmund & Hady

tepat waktu dan dapat menjawab semua pertanyaan bisnis yang penting

Pilihan terbaik untuk data mart yang pertama adalah yang berhubungan dengan

sales, misal property sales, property leasing,property advertising.

Langkah 2 : Pemilihan sumber

Untuk memutuskan secara pasti apa yang diwakili atau direpresentasikan oleh

sebuah tabel fakta.

Misal, jika sumber dari sebuah tabel fakta properti sale adalah properti sale

individual maka sumber dari sebuah dimensi pelanggan berisi rincian pelanggan

yang membeli properti utama

Langkah 3 : Mengidentifikasi dimensi

Set dimensi yang dibangun dengan baik, memberikan kemudahan untuk

memahami dan menggunakan data mart

Dimensi ini penting untuk menggambarkan fakta-fakta yang terdapat pada tabel

fakta

Misal, setiap data pelanggan pada tabel dimensi pembeli dilengkapi dengan

id_pelanggan,no_pelanggan,tipe_pelanggan,tempat_tinggal, dan lain sebagainya.

Jika ada dimensi yang muncul pada dua data mart,kedua data mart tersebut harus

berdimensi sama,atau paling tidak salah satunya berupa subset matematis dari yang

lainnya.

Jika sebuah dimensi digunakan pada dua data mart atau lebih,dan dimensi ini

tidak disinkronisasi,maka keseluruhan data warehouse akan gagal, karena dua data

mart tidak bisa digunakan secara bersama-sama

Langkah 4 : Pemilihan fakta

Sumber dari sebuah tabel fakta menentukan fakta mana yang bisa digunakan

dalam data mart.

Semua fakta harus diekspresikan pada tingkat yang telah ditentukan oleh sumber

Langkah 5 : Menyimpan pre-kalkulasi di tabel fakta

Hal ini terjadi apabila fakta kehilangan statement

Page 4: Edmund & Hady

Langkah 6 : Melengkapi tabel dimensi

Pada tahap ini kita menambahkan keterangan selengkap-lengkapnya pada tabel

dimensi

Keterangannya harus bersifat intuitif dan mudah dipahami oleh pengguna

Langkah 7 : Pemilihan durasi database

Misalnya pada suatu perusahaan asuransi, mengharuskan data disimpan selama

10 tahun atau lebih

Langkah 8 : Menelusuri perubahan dimensi yang perlahan

Ada tiga tipe perubahan dimensi yang perlahan, yaitu :

o Tipe 1. Atribut dimensi yang telah berubah tertulis ulang

o Tipe 2. Atribut dimensi yang telah berubah menimbulkan sebuah dimensi baru

o Tipe 3. Atribut dimensi yang telah berubah menimbulkan alternatif sehingga nilai

atribut lama dan yang baru dapat diakses secara bersama pada dimensi yang sama.

Langkah 9 : Menentukan prioritas dan mode query

Pada tahap ini kita menggunakan perancangan fisik.

Model Entity Relationship diperkenalkan pertama kali oleh P.P. Chen pada

tahun 1976. Model ini dirancang untuk menggambarkan persepsi dari pemakai dan

berisi obyek-obyek dasar yang disebut entity dan hubungan antar entity-entity tersebut

yang disebut relationship. Pada model ER ini semesta data yang ada dalam dunia nyata

Page 5: Edmund & Hady

ditransformasikan dengan memanfaatkan perangkat konseptual menjadik sebuah

diagram, yaitu diagram ER ( Entity Relationship)

Entitas adalah sesuatu yang memiliki keberadaan yang unik dan berbeda,

walaupun tidak harus dalam bentuk fisik. Relation (Relasi) merupakan sebuah tabel

dengan kolom-kolom dan baris-baris. Pada model relasional, relasi digunakan untuk

menyimpan informasi mengenai objek-objek yang direpresentasikan dalam sebuah

basis data. Normalisasi merupakan teknik analisis data yang mengorganisasikan

atribut-atribut data dengan cara mengelompokkan sehingga terbentuk entitas yang

non-redundant, stabil, dan fleksible

Tabel diatas adalah tabel normal karena setiap atribut tidak memiliki data yang

redudan. Tetapi masih dalam bentuk 1NF.

Page 6: Edmund & Hady

Nama bergantung dengan productCode , Time bergantung dengan product code .

Deskripsi bergantung dengan ComponenCode, Supplier bergantung dengan ComponenCode

,Cost bergantung dengan ComponentCode, Quantity bergantung pada ComponentCode dan

Product Code

Pada bentuk 3NF adan didapat kardinalitas sebagai berikut :

product : ProductCode -> Name , Time

Parts : ProductCode -> ComponentCode , Qty

Component: ComponentCode -> description , supplier, Cost

Page 7: Edmund & Hady

Didapat seperti pada slide diatas merupakan tabel yang sudah dinormalisasi.

Suatu model yang menggabungkan dimensi dan fact bersamaan dikenal dengan

dimensional model. Di dalam model ini, tabel fact terdiri dari pengukuran numerik yang

disertakan ke seperangkat tabel dimensi yang dipenuhi atribut deksriptif. Di dalam model ini,

Tabel fact berada di tengah dan tabel dimensi bergelantungan disekitarnya seperti sebuah

bintang. Struktur dengan karakteristik demikian seringkali dikenal dengan star schema. Saat

id pelanggan, id produk dan periode waktu digunakan untuk menentukan baris-baris manakah

yang dipilih dari tabel fact, cara pengumpulan data demikian dikenal dengan istilah star

schema join.

Page 8: Edmund & Hady

Sale merupakan tabel fact dengan atribut : time key, store key , costumer key, product

key , dollars sales , unit sales ,

Time merupakan dimensi degan atribut : time key , day , month

Store merupakan dimensi dengan atribut : store key , address , region

Customer merupakan dimensi dengan atribut : customer key , name , customer type

Product merupakan dimensi dengan atribut : product key , product type, weight

Snowflake Schema Merupakan pengembangan dari star schema, ia juga mempunyai

satu atau lebih dimensi. Hanya saja pada snowflake, tabel yang berelasi pada fact table hanya

tabel dimensi utama, sedangkan tabel yang lain dihubungkan pada tabel dimensi utama

Kelebihan Snowflake Schema

a. Ukuran penyimpanan kecil didalam tempat penyimpanan.

Page 9: Edmund & Hady

b. Struktur yang normal lebih mudah untuk di-update dan di-maintenance

Kekurangan Snowflake Schema

a. Kurang jelas dan penggunaan akhir terhambat oleh kompleksitas.

b. Sulit untuk mencari isi, karena kompleks.

c. Performa query menurun karena adanya join table antar dimensi.

Pengembangan model dilakukan berdasarkan eksplorasi model dan data dari

sumber data. Beberapa ahli yang menyarankan metode ini adalah Golfarelli, Inmon,

serta Phipps dan Davis. Model konseptual untuk sebuah data warehouse berasal dari

model data sumber yang ditransformasi.

Page 10: Edmund & Hady

Adalah sistem perangkat lunak yang di design untuk memungkinkan proses

penyimpanan yang nyaman dan efisien dan sistem pemanggilan dari data yang berukuran

besar, bersifat sangat berkaitan dan dapat disimpan, ditampilkan, dianalisa dalam tujuan

berbeda. Atribut yang terasosiasikan adalah atribut yang saling berhubungan satu yang lain

Cube adalah struktur yang berisi nilai untuk satu atau lebih pengukuran untuk setiap

kombinasi unik dari anggota dalam semua dimensi. Dimensi dapat dipandang sebagai entitas

, dan setiap atribut akan menjelaskan isi dari suatu entitas tersebut Slicing dan dicing adalah

operasi untuk melihat data sebagai visualisasi dari kubus. Dengan slicing dan dicing

pengguna dapat melihat data dari beberapa perspektif Slicing memotong kubus sehingga

dapat memfokuskan pada perspektif yang spesifik (pada suatu dimensi) Sedangkan dicing

Page 11: Edmund & Hady

memberikan kemampuan untuk melihat pemilihan data pada dua dimensi atau lebih. report

adalah program yang menerima data dari data warehouse dan mempresentasikan ke user.

(Codd et al., 1995). OLAP memungkinkan user untuk mendapatkan

pemahaman yang lebih dalam pengetahuan tentang berbagai aspek data perusahaan

mereka dengan cepat, konsisten, dan interaktif. OLAP memungkinkan untuk melihat

tampilan data perusahaan sedemikian rupa dimana memberikan sebuah gambaran

yang lebih baik dari dimensi sebenarnya dari perusahaan. Umumnya OLAP meliputi

aktivitas-aktivitas seperti pembangkitan query, permintaan laporan khusus dan grafik,

dan melakukan analisis statistik. Relational OLAP, menggunakan Relational Database

baik untuk menyimpan Detail data maupun untuk menyimpan Aggregate nya.

Agregat adalah nilai yang dibentuk dengan menggabungkan nilai-nilai dari dimensi

tertentu atau seperangkat dimensi untuk menciptakan nilai tunggal. Beberapa software

OLAP yang dipasarkan antara lain :PowerPlay (Cagnos Software) , Express Server

(Oracle) Metacube (Informix/Stanford Technology Group) ,HighGate (Sybase) .

Page 12: Edmund & Hady

Suatu model yang menggabungkan dimensi dan fact bersamaan dikenal dengan

dimensional model. Table fact adalah sebuah tabel adalah tabel primer di dalam

model dimensional dimana pengukuran kinerja secara numerik dari bisnis disimpan.

Tabel fact berada di tengah dan tabel dimensi bergelantungan disekitarnya seperti

sebuah bintang. Struktur dengan karakteristik demikian seringkali dikenal dengan star

schema. Star schema digunakan untuk database dengan dimensi

yang cukup banyak antara 10-15.

Indentifikasi area bisnis

Mengidentifikasi dan mengukur inti tabel fact

Identifikasi dimensi dengan menentukanm dimensi untuk setiap baris tabel fact

Mengidentifikasi fakta numerik yang akan mengisi setiap baris tabel fakta

Page 13: Edmund & Hady

Melengkapi tabel data dan memperbaiki data yang masih tidak normal (normalisasi)

Pemodelan ini adalah teknik desain untuk menstrukturkan dimensi bisnis dan matrik

yang dianalisis bersama dengan dimensi-dimensi . Model juga memberikan kinerja

tinggi untuk analisis dan kueri. Kelemahan dari model kimbal adalah belum

terintegrasi dan belum adanya penyesuaian model dengan sistem yang sudah ada.

Untuk tahapan merancang data warehouse adalah sesuai dengan kebutuhan bisnis dari

pihak perusahaan.

Perancangan data model data warehouse berdasarkan dari tabel fakta dan dimensi,

untuk pemilihan sumber harus mengacu pada kemampuan untuk merepresentasikan

fakta-fakta yang di ambil dari berbagi sumber dimensi pada OLTP

Page 14: Edmund & Hady

Pemilihan sumber dari sebuah tabel fakta akan menentukan fakta mana yang akan

digunakan.

Dimensi ini untuk menggambarkan fakta-fakta pada tabel fakta

Pada tahap ini kita menambahkan keterangan selengkap-lengkapnya pada tabel

dimensi dan harus bersifat intuitif dan mudah dipahami oleh pengguna.

Ada tiga tipe perubahan dimensi yaitu atribut dimensi yang telah berubah tertulis

ulang, menimbulkan sebuah dimensi baru dan dimensi yang telah berubah

menimbulkan alternatif, sehingga nilai atribut lama dan yang baru dapat

diakses secara bersama pada dimensi yang sama. Menyimpan pre-kalkulasi di tabel

fakta karena hal ini akan terjadi jika tabel fakta kehilangan statement sesuai dengan

fakta yang dibutuhkan. Menentukan prioritas dan mode query, berkaitan dengan

perancangan fisik.

Page 15: Edmund & Hady

Adalah star schema ,tabel sales merupakan tabel fact dan tabel dimensi

time, promotion, product dan store

Page 16: Edmund & Hady

Dalam sebuah Data Warehouse atau Data Mart, Pengukuran disimpan

dalam tabel fact dengan tingkat ketelitian sedemikian rupa sehingga pengguna

dapat melacak ringkasan berdasarkan levelnya. Hal ini dikenal dengan agregasi.

Sebagai contoh, jika data penjualan dalam sebuah toko grosirdijaga dalam level

sebuah pelanggan tunggal yang membeli item tertentu pada hari tertentu dalam

toko tertentu, sehingga kita dapat meringkas atau menjumlahkan data untuk

hari, minggu, bulan, kuartal dan tahun tertentu; dan semua hal ini adalah untuk

sebuah toko, zona, wilayah dan negara sebagaimana beradasarkan produk,

kelompok produk, departemen dan seterusnya.

Hanya data penjualan pada level terendah yang dijaga dalam tabel fact,

namun deskripsi dari berbagai level data di jaga dalam tabel dimensi,sehingga

tool yang sesuai dapat digunakan untuk meringkas data dalam level yang

bervariasi.

Sebuah hierarki mendefinisikan sebuah urutan pemetaan dari

seperangkat konsep low-level hingga level yang lebih tinggi, konsep level yang

lebih umum. Bayangkan sebuah hierarki dimensi Lokasi. Jika Kota adalah level

terendah dari hierarki , maka semua kota dapat dipetakan ke level yang lebih

tinggi lagi, yakni provinsi, dan semua provinsi dapat dipetakan ke level yang

lebih tinggi lagi yakni negara. Dst.

Level dimensional membentuk struktur seperti sebuah pohon dan

anggota level terendah dari hieararki dikenal dengan leaf. Hanya ada satu

anggota pada level paling atas. Sebuah dimensi tidak dapat eksis tanpa

Page 17: Edmund & Hady

anggota leafnya, namun hal yang mungkin untuk memiliki sebuah dimensi

tanpa anggota leaf – yakni yang hanya memiliki sebuah level.