bab 06 - normalisasi data(1)

38
DBMS – Arif Djunaidy – FTIF ITS Bab 6 - 1 /38 Database Management Systems Database Management Systems Bab 6 Bab 6 Penyempurnaan Skema Penyempurnaan Skema dan dan Bentuk-bentuk Normal Bentuk-bentuk Normal (Chap. 19 – Ramakrishnan) (Chap. 19 – Ramakrishnan)

Upload: anthony-hardin

Post on 30-Jul-2015

366 views

Category:

Documents


2 download

TRANSCRIPT

Database Management SystemsBab 6 Penyempurnaan Skema dan Bentuk-bentuk Normal (Chap. 19 Ramakrishnan)

DBMS Arif Djunaidy FTIF ITS

Bab 6 - 1/38

Pokok Bahasan

Persoalan-persoalan apa yang dapat ditimbulkan oleh adanya redundansi penyimpanan informasi? Apa yang dimaksud dengan functional dependencies? Apa yang dimaksud dengan bentuk-bentuk normal (normal forms) dan apa tujuannya? Apa manfaat dari BCNF dan 3NF? Apa pertimbangan dalam mendekomposisi relasi-relasi menjadi bentuk-bentuk normal? Dimana proses normalisasi dapat digunakan dalam proses desain basis data? Adakah bentuk kebergantungan (dependency) umum yang lebih bermanfaat dalam desain basis data?Bab 6 - 2/38

DBMS Arif Djunaidy FTIF ITS

Pengantar Penyempurnaan Skema: Persoalan yang Ditimbulkan oleh Redundansi

Redundansi ruang penyimpanan: beberapa data disimpan secara berulang Update anomaly: Jika satu copy data terulang tsb diubah, inkonsistensi data dpt terjadi kecuali kalau semua copy dari data tsb diubah dengan cara yang sama Insertion anomaly: Mungkin dpt terjadi kesulitan utk menyisipkan data tertentu kecuali kalau beberapa data tidak terkait lainnya juga ikut disisipkan Deletion anomaly: Mungkin dpt terjadi kesulitan utk menghapus data tertentu tanpa harus kehilangan beberapa data tidak terkait lainnya

DBMS Arif Djunaidy FTIF ITS

Bab 6 - 3/38

Persoalan yang Ditimbulkan oleh Redundansi: ContohSSN123-22-3666 231-31-5368 131-24-3650 434-26-3751 612-67-4134

NameAttishoo Smiley Smethurst Guldu Madayan

Lot Rating48 22 35 35 35 8 8 5 5 8

Wages Hours10 10 7 7 10 40 30 30 32 40

Asumsi: nilai attribut wages ditentukan oleh nilai rating (utk satu nilai rating yang diberikan, hanya diperbolehkan terdapat satu nilai wages

Redundansi ruang penyimpanan: nilai rating 8 yang berkorespondensi dg wages 10 diulang tiga kali Update anomaly: Nilai wages (yg terkait dengan nilai rating) dlm baris pertama dpt diubah tanpa membuat perubahan yg sama pada baris kedua dan kelima Insertion anomaly: Kesulitan utk menyisipkan employee baru kecuali nilai wage untuk rating dari employee tsb sudah diketahui Deletion anomaly: Jika semua baris yang terkait dg nilai rating tertentu dihapus (misalnya baris utk employee Smethurst dan Guldu dihapus), maka kita akan kehilangan informasi ketergantungan antara nilai rating dan nilai wages yang diasosiasikan dengan nilai rating tsb (yaitu rating = 5 dan wages = 7)Bab 6 - 4/38

DBMS Arif Djunaidy FTIF ITS

Persoalan yang Ditimbulkan oleh Redundansi: Null Values

Untuk kasus-kasus khusus, adanya nilai-nilai null yang berlebihan dalam suatu relasi dpt menimbulkan pemborosan pengunaan ruang penyimpanan Hal ini terutama dpt terjadi pada suatu relasi dengan jumlah attribut yang besar dan jumlah baris yang juga besar, sehingga untuk kasus tertentu dapat terjadi banyak nilai-nilai kolom yang tidak memenuhi (not applicable) untuk sejumlah baris dalam relasi harus dibiarkan bernilai null

Sebagai contoh, utk relasi Hourly Employees, misalkan ditambah satu kolom baru (OfficeLocCode) utk mencatat kode lokasi kantor dari para pemimpin perusahaan. Jika misalnya terdapat ribuan employee, dan hanya ada sekitar 10%pemimpin, maka sebagian besar (90%) nilai kolom tersebut akan terisi dengan nilai null (pemborosan ruang penyimpan).Bab 6 - 5/38

DBMS Arif Djunaidy FTIF ITS

Pengantar Penyempurnaan Skema: Dekomposisi Skema Relasi

Proses Dekomposisi sebuah skema relasi R berupa penggantian skema relasi menjadi dua (atau lebih) skema-skema baru yang masing-masing berisikan subset dari attribut-attribut relasi R dan kesemuanya memuat semua attribut yang ada dalam relasi R. Proses dekomposisi dilakukan dengan menggunakan konsep ketergantungan fungsional (functional dependencies)

Contoh: skema relasi Hourly_Employees dpt didekomposisi menjadi: Hourly_Emps2 (ssn, name, lot, rating, hours) Wages (rating, wages)

Hourly_Emps2N Attishoo Smiley Smethurst Guldu Madayan L 48 22 35 35 35 R 8 8 5 5 8 H 40 30 30 32 40Bab 6 - 6/38

Wage s R W8 5 10 7

S 123-22-3666 231-31-5368 131-24-3650 434-26-3751 612-67-4134

DBMS Arif Djunaidy FTIF ITS

Dekomposisi Skema Relasi: Beberapa Persoalan Terkait

Dekomposisi terhadap suatu skema relasi harus digunakan dengan penuh pertimbangan. Dua pertanyaan yang harus selalu dipertimbangkan:1. Adakah alasan untuk mendekomposisi suatu relasi ? 2. Persoalan-persoalan apa saja (jika ada) yang akan diakibatkan oleh dekomposisi ?

Jawaban thdp pertanyaan pertama dpt dibantu dengan bentuk-bentuk normal (Normal Forms/NF) terhadap relasi yang akan didekomposisi. Utk ini jika suatu skema relasi berada dlm salah satu NF, maka beberapa persoalan yang terkait dengan dekomposisi tidak akan muncul Untuk jawaban thdp pertanyaan kedua, dua sifat penting dari dekomposisi harus dipertimbangkan:

Sifat lossless-join yang memungkinkan untuk membentuk kembali (recovery) nilai-nilai relasi yang didekomposisi dari relasi-relasi hasil dekomposisi Sifat dependency-preservation yang memungkinkan untuk memaksa agar constraints yang berlaku pada relasi asal tetap berlaku pada sejumlah relasi-relasi yang lebih kecil DBMS Arif Djunaidy FTIF ITS Bab 6 - 7/38

Functional Dependencies (FDs)

Suatu functional dependency X Y dikatakan berlaku pada relai R jika, utk setiap nilai r dari R yang diperbolehkan, berlaku keadaan:

t1 r , t2 r, X (t1) = X (t2) mengimplikasikan Y (t1) = Y (t2) yaitu, jika diberikan dua tuples dalam r, jika nilai proyeksi X pada kedua tuples sama, maka nilai proyeksi Y pada kedua tuples juga sama. (X dan Y adalah sets dari attributes pada relasi yang sama.)

Sebuah FD adalah pernyataan yang berlaku pada semua relasi-relasi yang dimungkinkan.

Harus diidentifikasi berdasarkan semantik dari aplikasi Jika diberikan beberapa nilai r1 dari R yang mungkin, kita dpt melakukan pengecekan apakah nilai tersebut melanggar beberapa FD f, tetapi kita tidak dapat mengatakan bahwa f berlaku pada R!

Jika K adalah sebuah candidate key untuk R, maka berarti bahwa K R

Tetapi, K R tidak mengharuskan K terdiri dari satu set attribut yang minimal !Bab 6 - 8/38

DBMS Arif Djunaidy FTIF ITS

Contoh: Constraints pada Entity Set

Perhatikan relasi Hourly_Emps berikut:

Hourly_Emps (ssn, name, lot, rating, hrly_wages, hrs_worked)

Notasi: Utk penyederhaan penulisan, skema relasi tsb akan dinotasikan dengan menggabungkan singkatan dari attribut-attributnya: SNLRWH

Notasi ini menyatakan satu set attributes {S,N,L,R,W,H}. Dalam beberapa kasus, nama sebuah relasi akan digunakan untuk mengacu ke semua attribut dari relasi tersebut. (contoh, Hourly_Emps untuk SNLRWH)

Beberapa FD yang berlaku pada Hourly_Emps:

ssn adalah sebuah key: S SNLRWH rating menentukan hrly_wages: R WBab 6 - 9/38

DBMS Arif Djunaidy FTIF ITS

Contoh (Lanjutan)

S123-22-3666 231-31-5368 131-24-3650 434-26-3751 612-67-4134

NAttishoo Smiley Smethurst Guldu Madayan

L48 22 35 35 35

R8 8 5 5 8

W H10 10 7 7 10 40 30 30 32 40

Beberapa persoalan akibat R W : Update anomaly: Dapatkah W diubah hanya pada tuple pertama dari SNLRWH ? Insertion anomaly: Bgm jika diinginkan utk menyisipkan seorang employee tetapi hourly wage utk rating yang bersangkutan tidak diketahui ? Deletion anomaly: Jika semua employee dengan rating 5 dihapus, maka informasi mengenai hourly wage utk rating 5 juga akan ikut terhapus !

Hourly_Emps2S 123-22-3666 231-31-5368 131-24-3650 434-26-3751 612-67-4134 N Attishoo Smiley Smethurst Guldu Madayan L 48 22 35 35 35 R 8 8 5 5 8 H 40 30 30 32 40

WagesR8 5

W10 7

DBMS Arif Djunaidy FTIF ITS

Bab 6 - 10/38

Penyempurnaan ER Diagram

Pemetaan diagram pertama: Sebelum (Workers): Workers(S,N,L,D,S) Departments(D,M,B) since name dname Lots diasosiasikan dengan ssn lot did budget relasi workers. Jika diasumsikan bhw semua Works_In Employees Departments workers dlm sebuah dept ditentukan sebuah lot yang sama, maka D L (Redundansi) Redundansi dpt diatasi dg: Sesudah (Workers2): Workers2(S,N,D,S) budget since Dept_Lots(D,L) name dname Departments(D,M,B) ssn did lot Dapat disempurnakan (fine-tune) menjadi: Works_In Employees Departments Workers2(S,N,D,S) Departments(D,M,B,L)Bab 6 - 11/38

DBMS Arif Djunaidy FTIF ITS

Alasan Mengenai FD

Jika diberikan satu set FDs, kita dapat menurunkan (infer) tambahan FDs:

ssn did, did lot mengimplikasikan ssn lot

Sebuah FD f dikatakan dapat diimplikasikan oleh (implied by) satu set FDs F jika f berlaku bilamana semua FDs dalam F berlaku.

F+ (closure of F) adalah set dari semua FDs yang diimplikasikan oleh F. Reflexivity: Jika X Y, maka X Y Augmentation: Jika X Y, maka XZ YZ utk sembarang Z Transitivity: Jika X Y dan Y Z, maka X Z

Aksioma Armstrong (X, Y, Z adalah sets dari attributes):

Aksioma di atas merupakan aturan-aturan penyimpulan (inference rules ) untuk FDs yang logis (sounds) dan lengkap (complete) ! Dua aturan tambahan yang menyertai Aksioma Armstrong:

Union: Jika X Y dan X Z, maka X YZ Decomposition: Jika X YZ, maka X Y dan X ZBab 6 - 12/38

DBMS Arif Djunaidy FTIF ITS

Alasan Mengenai FD (Lanjutan)

Suatu FD disebut trivial jika sisi kanan dari FD hanya terdiri dari attribut yang juga muncul di sisi kiri dari FD (akibat rumus reflexivity). Selain trivial FDs, selebihnya disebut nontrivial FDs. Dengan menggunakan rumus reflexivity, semua trivial dependencies dapat diturunkan.

Contoh: Contracts(cid,sid,jid,did,pid,qty,value), dan:

C adalah key: C CSJDPQV Project membeli setiap part menggunakan contract tunggal: JP C Dept membeli paling banyak satu part dari sebuah supplier: SD P

Nontrivial FDs yang dapat diperoleh dari relasi Contracts: JP C, C CSJDPQV mengimplikasikan JP CSJDPQV SD P mengimplikasikan SDJ JP SDJ JP, JP CSJDPQV mengimplikasikan SDJ CSJDPQV

DBMS Arif Djunaidy FTIF ITS

Bab 6 - 13/38

Alasan Mengenai FD: Attribute Closure

Untuk hanya mengecek apakah sebuah depedensi, misalnya X Y terdapat dlm closure dari satu set FDs F, kita dapat melakukannya secara efisien tanpa harus menghitung F+: Hitung attribute closure X+ dg mengacu pada F, yaitu hitung satu attributes A sehingga X A dpt diturunkan menggunakan Aksioma Armstrong (Algoritma utk menghitung attribute closure X+ dari set attribut X dg mengacu pada satu set FDs F): closure = X; REPEAT { IF there is an FD U V in F such that U closure THEN set closure = closure V } UNTIL there is no change; Kemudian cek apakah Y ada dalam X+

Latihan: Apakah F = {A B, B C, CD E} mengimplikasikan A E ? Algoritma di atas dpt dimodifikasi utk memperoleh keys dari suatu skema relasi dengan cara memulai dengan set X yang terdiri dari satu attribut tunggal dan berhenti begitu closure berisikan semua attribut dari skema relasi.Bab 6 - 14/38

DBMS Arif Djunaidy FTIF ITS

Bentuk-Bentuk Normal (Normal Forms)

Normal Forms (NF) digunakan utk membantu kita dlm memutuskan apakah suatu skema relasi sudah merupakan hasil desain yang baik atau masih perlu didekomposisi menjadi relasi-relasi yang lebih kecil.Jika suatu relasi skema sudah berada dalam salah satu NF, berarti bhw beberapa jenis persoalan redundansi dapat dihindari/diminimalkan.

NF yang didasarkan pada FDs: 1NF, 2NF, 3NF dan Boyce-Codd NF (BCNF): Setiap relasi dlm BCNF juga berada dlm 3 NF Setiap relasi dlm 3 NF juga berada dlm 2 NF, dan Setiap relasi dlm 2 NF juga berada dlm 1NF

DBMS Arif Djunaidy FTIF ITS

Bab 6 - 15/38

Bentuk-Bentuk Normal (Normal Forms)

Setiap relasi yang berada dlm 1NF berlaku constraint bhw setiap field hanya berisikan nilai-nilai atomic (tidak boleh berisikan lists atau sets, atau dengan kata lin tidak boleh berisikan repeating groups). Dlm perkuliahan, constraint ini dianggap berlaku sebelum dilakukan proses normalisasi

Setiap relasi yang berada dlm 2NF berlaku constraint bhw setiap non-key attributes dalam sebuah relasi, secara fungsional hanya bergantung penuh pada key dari relasi tersebut (tidak boleh berisikan partial dependency) Oleh karena 2NF dibuat atas dasar sejarah perkembangan database (dari network model ke hierarchical model), maka pembahasan hanya ditekankan pada proses pembentukan 3NF dan BCNF yang merupakan langkah penting dalam proses desain database.Bab 6 - 16/38

DBMS Arif Djunaidy FTIF ITS

Bentuk-Bentuk Normal (Lanjutan)

Peran FD dalam mendeteksi redundansi: Perhatikan sebuah relasi R dengan 3 attributes ABC.

Jika tidak ada FD yang harus diberlakukan pada relasi R, maka dapat dipastikan tidak akan terdapat persoalan redundansi. Namun, jika dimisalkan berlaku A B, maka jika terdapat beberapa tuples yang mempunyai nilai A yang sama maka baris-baris tersebut juga harus mempunyai nilai B yang sama. Untuk ini, potensi terjadinya redundansi dapat diperkirakan dengan menggunakan informasi FDs

DBMS Arif Djunaidy FTIF ITS

Bab 6 - 17/38

Boyce-Codd Normal Form (BCNF)

Relasi R dg FDs F dikatakan berada dalam BCNF jika, utk semua FD X A dalam F, salah satu dari pernyataan berikut harus berlaku:

A X (disebut trivial FD), atau X adalah key dari R.

Dengan kata lain, R dikatakan berada dalam BCNF jika nontrivial FDs yang berlaku pada R hanya berupa key constraints.

Tidak ada redundansi yang dpt diprediksi hanya dengan menggunakan FDs saja X Y Jika terdapat dua tuples yang mempunyai nilai X x y1 yang sama, maka tidak dapat disimpulkan x y2 bahwa nilai A dalam satu tuple dapat diperoleh dari nilai A dalam tuple lainnya Namun, jika relasi contoh berada dalam BCNF, maka kedua tuples harus identik (karena X adalah sebuah key).

A a ?

DBMS Arif Djunaidy FTIF ITS

Bab 6 - 18/38

Third Normal Form (3NF)

Relasi R dengan FDs F dikatakan berada dlm 3NF jika, untuk semua FD X A dalam F, salah satu dari pernyataan berikut harus berlaku:

A X (disebut trivial FD), atau X adalah key dari R, atau A adalah bagian dari beberapa key dari R (A adalah prime attribute)

Minimality dari key dalam kondisi ketiga di atas menjadi sangat penting ! Jika R berada dlm BCNF, sudah tentu R juga berada dlm 3NF Jika R berada dlm 3NF, beberapa redundansi masih mungkin terjadi. Bentuk 3NF dapat dipakai sebagai bentuk yang kompromistis dan digunakan bilamana BCNF tidak dapat diupayakan (misalnya karena tidak ada dekomposisi yang baik, atau karena alasan pertimbangan kinerja dari database)

DBMS Arif Djunaidy FTIF ITS

Bab 6 - 19/38

Apa yang Dapat Dicapai oleh 3NF?

Jika depedensi X A menyebabkan pelanggaran dari 3NF, maka salah satu kasus di bawah ini akan terjadi: X adalah subset dari beberapa key K (partial dependency) Pasangan nilai (X, A) yang sama akan tersimpan secara redundan

X bukan subset dari sembarang key K (transitive dependency) Terdapat rantai FDs K X A, yang berarti bhw kita tdk dpt mengasosiasikan sebuah nilai A dengan sebuah nilai K kecuali kalau kita juga mengasosiasikan sebuah nilai A dengan sebuah nilai X

Namun demikian, walaupun seandainya relasi berada dalam 3NF, persoalan-persoalan berikut masih dpt terjadi:

Contoh: relasi Reserves SBDC (C=Credit Card ID), S C, C S berada dalam 3NF, tetapi utk setiap reservasi dari sailor S, pasangan nilai (S, C) yang sama akan tersimpan dalam database.

Dengan demikian, 3NF memang merupakan bentuk normal yang relatif kompromistis dibandingkan BCNF.Bab 6 - 20/38

DBMS Arif Djunaidy FTIF ITS

Proses Dekomposisi dari sebuah Skema Relasi

Asumsikan relasi R terdirid ari attributes A1 ... An. Proses dekomposisi dari R meliputi penggantian R oleh dua atau lebih relasi, sehingga :

Setiap skema relasi yang baru terdiri dari subset attribut dari R (dan tidak satupun attribut yang tidak muncul dalam R), dan Setiap attribut dari R muncul sebagai sebuah attribut dari salah satu atau lebih relasi-relasi yang baru

Secara intuitif, pendekomposisian R berarti bahwa kita akan menyimpan nilai-nilai dari skema-skema relasi yang dihasilkan oleh proses dekomposisi, bukan nilai-nilai dari relasi R Contoh, relasi SNLRWH dapat didekomposisi menjadi SNLRH dan RW (lihat slide berikutnya).Bab 6 - 21/38

DBMS Arif Djunaidy FTIF ITS

Contoh Dekomposisi-1

Perhatikan relasi:DeptProj (Ename, SSN, Bdate, Address, Dnumber, Dname, DMgrSSN) ESBADNM

FDs: S EBAD, D NM S EBAD : memenuhi 3NF dan BCNF D MN : menyalahi 3NF atau BCNF, dekomposisi ESBADNM menjadi:

ESBAD dan DMN Hasil proses dekompoisi ESBADNM : ESBAD dan DMN (3NF & BCNF)

ESBAD DeptProj1 (Ename, SSN, Bdate, Address, Dnumber) DMN Department (Dnumber, Dname, DMgrSSN)

DBMS Arif Djunaidy FTIF ITS

Bab 6 - 22/38

Contoh Dekomposisi-2

Perhatikan relasi:EmpProj (SSN, Pnumber, Hours, Ename, Pname, Plocation) SPHEJL

FDs: SP H, S E, P JL SP H : memenuhi 3NF dan BCNF S E : menyalahi 3NF atau BCNF, dekomposisi SPHEJL menjadi:

SPHJL dan SE

P JL : menyalahi 3NF atau BCNF, dekomposisi SPHJL menjadi:

SPH dan PJL Hasil proses dekompoisi SPHEJL : SPH, SE, dan PJL (3NF & BCNF)

SPH EmpProj1 (SSN, Pnumber, Hours) SE Employee (SSN, Ename) PJL Project (Pnumber, Pname, Plocation)DBMS Arif Djunaidy FTIF ITS Bab 6 - 23/38

Contoh Dekomposisi-3

Perhatikan relasi:LOTS (PropertyID#, CountyName, Lot#, Area, Price, TaxRate) ICLAPT

FDs: I CLAPT, CL IAPT, C T, A P I CLAPT : memenuhi 3NF dan BCNF CL IAPT : memenuhi 3NF dan BCNF C T : menyalahi 3NF dan BCNF, dekomposisi ICLAPT menjadi: ICLAP dan CT A P : menyalahi 3NF dan BCNF, dekomposisi ICLAP menjadi: ICLA dan AP

Hasil proses dekompoisi ICLAPT : ICLA, CT, dan AP (3NF dan BCNF): ICLA LOTS1 (PropertyID#, CountyName, Lot#, Area) CT TaxRate (CountyName, TaxRate) AP Price (Area, Price)Bab 6 - 24/38

DBMS Arif Djunaidy FTIF ITS

Contoh Dekomposisi-4

Perhatikan relasi:LOTS (PropertyID#, CountyName, Lot#, Area, Price, TaxRate) ICLAPT FDs: I CLAPT, CL IAPT, C T, A P, dan A C (tambahan) I CLAPT : memenuhi 3NF dan BCNF CL IAPT : memenuhi 3NF dan BCNF C T : menyalahi 3NF dan BCNF, dekomposisi ICLAPT menjadi: ICLAP dan CT A P : menyalahi 3NF dan BCNF, dekomposisi ICLAP menjadi: ICLA dan AP A C : menyalahi BCNF (tapi memenuhi 3NF) Atruan 3NF, relasi AC TIDAK perlu dipisah (hasil proses dekomposisi seperti dalam contoh slide sebelumnya) Aturan BCNF, relasi AC harus dipisah, sehingga hasil akhir menjadi (FD CL IAPT hilang dari hasil TIDAK mempertahankan property dependency preservation) : o IL LOTS1 (PropertyID#, Lot#) o CT TaxRate (CountyName, TaxRate) o AP Price (Area, Price) o AC Area (Area, CountyName)

DBMS Arif Djunaidy FTIF ITS

Bab 6 - 25/38

Contoh Dekomposisi-5 (Untuk didiskusikan)

Dari potongan contoh data mengenai penerbangan di bawah ini, bagaimana proses normalisasi data dapat dilakukan?Flight-No BA069 AircraftType B747 AirportCode LHR ZRH BAH SEZ MRU LIS NCE CPH ARN CPH ATH DAM CPH VIE NBO JNB Airport-City Heathrow Zurich Bahrain Seychelles Mauritus Lisbon Nice Compenhagen Stockholm Compenhagen Athens Damascus Compenhagen Vienna Nairobi Johannesburg DepartureTime 14:30 23:00 5:45 9:10 18:15 21:10 2:55 14:00 17:00 19:50 5:50 9:35 Arrivaltime 13:00 15:30 0:15 6:45 15:00 18:55 21:45 9:40 15:00 18:10 20:40 6:40 Number-ofSeats 402 402 402 402 402 154 154 154 154 154 154 154 270 270 270 270Bab 6 - 26/38

SK586

AB10

SK783

AB10

SK961

MD11

DBMS Arif Djunaidy FTIF ITS

Persoalan-persoalan yang Dapat Ditimbulkan oleh Dekomposisi (Lanjutan)

Terdapat 3 persoalan potensial yang perlu diperhatikan:1. Beberapa queries menjadi lebih mahal. Contoh, Brp gaji yang diterima oleh Joe? (gaji = W*H)

2. Untuk nilai-nilai relasi hasil dekomposisi, mungkin kita tidak dapat merekonstruksi nilai-nilai relasi asal yang bersesuaian (losless joins) ! Kebetulan tidak terjadi pada contoh relasi SNLRWH

3. Pengecekan beberapa dependensi bisa jadi membutuhkan penggabungan (joining) nilai-nilai relasi hasil dekomposisi (dependency preservation) ! Kebetulan tidak terjadi pada contoh relasi SNLRWH, tetapi terjadi pada contoh relasi ICLAPT (contoh dekomposisi-4)

Tradeoff: Harus mempertimbangkan persoalan ini, selain persoalan redundansi (persoalan utama).Bab 6 - 27/38

DBMS Arif Djunaidy FTIF ITS

Persoalan-persoalan yang Dapat Ditimbulkan oleh Dekomposisi

Proses dekomposisi sebaiknya digunakan hanya bilamana diperlukan.

SNLRWH mempunyai FDs S SNLRWH dan R W FD kedua menimbulkan pelanggaran 3NF; nilai-nilai W secara berulang diasosiasikan dg nilai-nilai R. Cara yang termudah utk memperbaiki ini adalah menciptakan relasi baru RW utk menyimpan asosiasi-asosiasi tersebut, dan untuk menghapus W dari skema utama, yaitu: SNLRWH didekomposisi menjadi SNLRH dan RW

Informasi yang akan disimpan terdiri dari SNLRWH tuples. Namun, jika kita hanya menyimpan proyeksi dari tuples ini pada SNLRH dan RW, adakah persoalanpersoalan potensial lain yang perlu dipertimbangkan? (lihat slide berikutnya)Bab 6 - 28/38

DBMS Arif Djunaidy FTIF ITS

Dekomposisi yang Bersifat Lossless Join

Dekomposisi R menjadi X dan Y disebut lossless-join dg mengacu pada satu set FDs F jika, untuk setiap instance r yang memenuhi F, berlaku: X (r) Y (r) = rKeadaan yang selalu harus benar: r X (r) Y (r)

Secara umum, arah sebaliknya tidak berlaku! Jika berlaku, maka dekomposisi bersifat lossless-join.

Definisi di atas dapat secara mudah diperluas utk proses dekomposisi menjadi 3 relasi atau lebih Penting untuk diperhatikan bhw semua jenis dekomposisi yang digunakan untuk menangani redundansi harus bersifat lossless! (Hindari persoalan ke-2)DBMS Arif Djunaidy FTIF ITS Bab 6 - 29/38

Lossless Join (Lanjutan)

A B C Dekomposisi R menjadi X dan Y 1 2 3 bersifat lossless-join dg mengacu 4 5 6 pada FDs F, jika dan hanya jika 7 2 8 closure dari F (F+) berisikan: X Y X, atau A B C XYY 1 2 3 Secara umum, dekomposisi R 4 5 6 menjadi UV dan R - V bersifat 7 2 8 lossless-join, jika U V berlaku 1 2 8 pada R dan U V = .

A 1 4 7B 2 5 2

B 2 5 2C 3 6 8

7

2

3

Spurious Tuples (Baris-baris nyeleneh)DBMS Arif Djunaidy FTIF ITS Bab 6 - 30/38

Dekomposisi yang Mempertahankan Dependensi

Perhatikan CSJDPQV, C adalah key, JP C dan SD P.

Dekomposisi BCNF : CSJDQV dan SDP Persoalan: Utk mengecek JP C diperlukan operasi join! Jika R didekomposisi menjadi X, Y dan Z, dan kita memaksa agar FDs tetap berlaku pada X, Y dan Z, maka semua FDs yang diberikan utk berlaku pada R hrs juga tetap berlaku. (Mengindari persoalan ke-3)

Dekomposisi yg mempertahankan dependensi (Intuitif):

Projection dari set FDs F: Jika R didekomposisi menjadi X, ..., projection dari F pada X (disimbolkan FX ) adalah set dari FDs U V dalam F+ (closure of F) sedemikian rupa sehingga U, V ada dalam X.

DBMS Arif Djunaidy FTIF ITS

Bab 6 - 31/38

Dekomposisi yang Mempertahankan Dependensi (Lanjutan)

Dekomposisi R menjadi X dan Y bersifat mempertahankan dependensi (dependency preserving) jika (FX FY )+ = F +, yaitu:

Jika kita hanya memperhatikan dependensi dalam F + yang dapat dicek dalam X tanpa memperhatikan Y, dan dalam Y tanpa memperhatikan X, maka hal ini mengimplikasikan bahwa semua dependensi ada dalam F +.

Penting utk memperhatikan F + (BUKAN F) dalam definisi ini:ABC, dengan FD: A B, B C, C A, didekomposisi menjadi AB dan BC. Apakah bersifat dependency preserving? apakah C A dipertahankan??

Dependency preserving tidak mengimplikasikan lossless join:

ABC, dengan FD: A B, didekomposisi menjadi AB dan BC.

Demikian juga sebaliknya, sifat lossless-join tidak mengimplikasikan dependency preservingBab 6 - 32/38

DBMS Arif Djunaidy FTIF ITS

Dekomposisi menjadi BCNF

Perhatikan relasi R dengan FDs F. Jika X Y melanggar BCNF, lakukan dekomposisi R menjadi R - Y and XY.

Penggunaan secara berulang dari ide ini akan menghasilkan sekumpulan relasi yang berada dalam BCNF & lossless join decomposition, dan dijamin utk mengalami terminasi. Contoh, CSJDPQV, key C, JP C, SD P, J S Utk menangani SD P, dekomposisi menjadi SDP, CSJDQV. Utk menangani J S, dekomposisi CSJDQV menjadi JS dan CJDQV Bagaimana jika penanganan J S dilakukan terlebih dahulu??

Secara umum, beberapa dependensi yang diberikan dapat menimbulkan pelanggaran BCNF. Ingat, urutan penanganan dekomposisi seperti di atas dapat memberikan relasi hasil dekomposisi yang berbeda !Bab 6 - 33/38

DBMS Arif Djunaidy FTIF ITS

BCNF dan Dependency Preservation

Secara umum, dimungkinkan dekompoisis menjadi BCNF yang mempertahankan lossless join, tetapi tidak mempertahankan dependensi.

Contoh, CSZ, CS Z, Z C Tdk dapat didekomposisi utk mempertahankan FD pertama (tidak dpt dilakukan dekompoisi BCNF).

Dengan cara yang sama, dekomposisi CSJDQV menjadi SDP, JS dan CJDQV tidak mempertahankan dependensi (dengan mengacu ke FDs JP C, SD P dan J S).

Namun demikian, dekomposisi di atas bersifat lossless-join. Dalam kasus ini, penambahan JPC pada set relasi hasil dekomposisi akan mememberikan dekomposisi yang dpt mempertahankan dependensi. Penyimpanan tuples JPC hanya untuk tujuan pengecekan FD! (Persaoalan Redundansi!)

DBMS Arif Djunaidy FTIF ITS

Bab 6 - 34/38

Dekomposisi menjadi 3NFAlgoritma untuk lossless join decomposition menjadi BCNF dapat digunakan utk memperoleh lossless join decomposition menjadi 3NF (dapat berhenti lebih awal). Untuk menjamin dependency preservation, suatu ide:

Jika X Y tdk dipertahankan, tambahkan relasi XY. Persoalan yang timbul adalah XY dpt melanggar 3NF! Contoh, perhatikan penambahan CJP utk mempertahankan JP C. Apa yang terjadi jika juga berlaku utk J C ?

Penyempurnaan: Sebagai pengganti set dari FDs F, gunakan minimal cover dari F.Bab 6 - 35/38

DBMS Arif Djunaidy FTIF ITS

Minimal Cover untuk Set dari FDs

Minimal cover G utk sebuah set dari FDs F:

Bagian sisi kanan dari setiap FD dalam G berupa sebuah attribut tunggal. Closure dari F = closure dari G. Jika G diubah dengan menghapus sebuah FD atau dengan menghapus beberapa attributes dari sebuah FD dalam G, maka closure akan berubah.

Secara intuitif, setiap FD dalam G diperlukan, dan harus seminimal mungkin untuk memperoleh closure yang sama seperti F. Contoh, A B, ABCD E, EF GH, ACDF EG mempunyai minimal cover berikut:

A B, ACD E, EF G dan EF H

Minimal Cover dapat menghasilkan dekomposisi yang bersifat Lossless-Join dan Dependency Preserving Decomposition !!Bab 6 - 36/38

DBMS Arif Djunaidy FTIF ITS

Algoritma utk mencari Minimal Cover

Algoritma untuk memperoleh minimal cover dari satu set F dari FDs: 1. Susun FDs dalam bentuk standar (canonical form) Dapatkan satu set FDs G yang ekivalen dengan sisi kanan dari setiap FD berupa satu attribut tunggal (gunakan aksioma dekomposisi) 2. Lakukan minimisasi sisi kiri dari setiap FD Untuk detiap FD dalam G, periksa apakah setiap attribut pada sisi kiri dpt dihapus dengan tetap mempertahankan ekivalensi terhadap F+ 3. Hapus FDs yang redundan Untuk setiap FD yang dihasilkan dalam G, periksa apakah FD tersebut dapat dihapus dengan tetap ekivalensi terhadap F+

Contoh: Perhatikan satru set FD F yang sudah berada dalam bentuk standar: ABCD E, E D, A B, dan AC D ABCD E dapat diminimisasi menjadi AC E (dan tetap mempertahankan ekivalensi terhadap F+). Selain itu, tidak ada lagi sisi kiri yang dpt diminimumkan lagi. Tapi hasilnya masih belum berupa minimal cover: AC E, E D, A B, dan AC D Dari hasil di atas, AC D dapat dihapus karena dpt diperoleh dari AC E, E D (aturan transitivity)

DBMS Arif Djunaidy FTIF ITS

Bab 6 - 37/38

Rangkuman

Jika sebuah relasi berada dalam BCNF, maka relasi tersebut bebas dari redundansi yang dapat dideteksi dengan menggunakan FDs. Dengan demikian, upaua untuk menjamin bhw semua relasi berada dalam BCNF merupakan upaya heuristik yang baik.

Jika sebuah relasi tidak berada dalam BCNF, coba lakukan dekomposisi menjadi sekumpulan relasi-relasi BCNF.

Harus mempertimbangkan apakah semua FDs dipertahankan. Jika dekomposisi menjadi BCNF yang bersifat lossless-join dan dependency preserving tidak dimungkinkan (atau tidak cocok, untuk beberapa queries yang tipikal), pertimbangkan dekomposisi menjadi 3NF. Dekomposisi sebaiknya dilakukan dan/atau diperiksa kembali dengan mempertimbangkan performance requirements yang diinginkan.

DBMS Arif Djunaidy FTIF ITS

Bab 6 - 38/38