tugas 2 abdul karim

10
Nama : Abdul Karim NIM : 1412401054 MK : Advanced Database Systems Revisi Personal Assignment 2 Tinjau Pertanyaan 1. Jelaskan integrasi data 2. Jelaskan tiga teps dari proses ETL 3. Mengapa proses ETL sangat penting bagi upaya data warehouse? 4. Apa yang dimaksud dengan data warehouse real-time 5. Sebutkan berbagai keuntungan dari data warehouse real-time 6. Sebutkan berbagai perbedaan antara data ware house tradisional dengan data warehouse real-time 7. Jelaskan berbagai motivasi yang mendorong dikembangkannya data warehouse real-time Jawaban No 1 Asli Integrasi data adalah meliputi kombinasi data yang berada pada sumber berbeda dan menyediakan user dengan tampilan terpadu untuk data-data tersebut. Proses ini menjadi sangat signifikan dalam beberapa situasi, yang mencakup domain komersial (saat 2 perusahaan harus menggabungkan database mereka) maupun secara ilmiah (mengkombinasikan hasil pencarian, misalnya dari

Upload: abdul-karim

Post on 26-Dec-2015

47 views

Category:

Documents


0 download

DESCRIPTION

Tugas 2 Advanced database

TRANSCRIPT

Page 1: Tugas 2 Abdul Karim

Nama : Abdul Karim

NIM : 1412401054

MK : Advanced Database Systems

Revisi Personal Assignment 2

Tinjau Pertanyaan

1. Jelaskan integrasi data

2. Jelaskan tiga teps dari proses ETL

3. Mengapa proses ETL sangat penting bagi upaya data warehouse?

4. Apa yang dimaksud dengan data warehouse real-time

5. Sebutkan berbagai keuntungan dari data warehouse real-time

6. Sebutkan berbagai perbedaan antara data ware house tradisional dengan data warehouse

real-time

7. Jelaskan berbagai motivasi yang mendorong dikembangkannya data warehouse real-time

Jawaban No 1 Asli

Integrasi data adalah meliputi kombinasi data yang berada pada sumber berbeda dan

menyediakan user dengan tampilan terpadu untuk data-data tersebut. Proses ini menjadi sangat

signifikan dalam beberapa situasi, yang mencakup domain komersial (saat 2 perusahaan harus

menggabungkan database mereka) maupun secara ilmiah (mengkombinasikan hasil pencarian,

misalnya dari repositori bioinformatik). Integrasi data muncul dengan frekuensi yang meningkat

seperti volume dan kebutuhan untuk berbagi ledakan data yang ada.Halini telah menjadi fokus

dari pekerjaan teoritis yang luas, dan beberapa masalah terbuka tetap belum terpecahkan. Dalam

lingkaran manajemen, orang sering merujuk pada integrasi data sebagai “Enterprise Information

Integration” (Informasi Integrasi Perusahaan) atau EII.

Page 2: Tugas 2 Abdul Karim

Sumber Data

Sistem integrasi data biasanya disebut secara formal sebagai tripel GSM. G untuk global

schema (skema global), S untuk set dari skema sumber yang heterogen, dan M untuk mapping

(pemetaan) antara query dari sumber dan skema global. G dan S diekspresikan dalam bahasa

alfabetis yang disusun oleh simbol untuk tiap hubungan respektifnya. Pemetaan M terdiri dari

pernyataan antara query dari G dan query dari S. Saat user mengajukan query dari sistem data

integrasi, mereka mengajukan query dari G dan pemetaannya kemudian menegaskan koneksi

antara elemen di skema global dengan skema sumber.

Revisi

1. Yang dimaksud dengan integrasi data adalah proses penggabungan antara dua data atau lebih agara dapat mempermudah dalam menggunakan dan menganalisisi data tersebut dalam mendukung manajemen informasi sebuah pekerjaan. Integrasi data dapat terpenuhi dengan cara konsitensi dalam menenetukan variable, ukuran variable, struktur pengkodean dan atribut data. Inilah contoh gambar integrasi data.

awaban No2 Asli

Tiga teps dari proses ETL

ETL istilah yang merupakan singkatan dari ekstraksi, transformasi, & loading batch atau

dijadwalkan proses integrasi data yang meliputi penggalian data dari sumber data operasional

atau eksternal, mengubah data ke dalam format yang sesuai, dan memuat data ke dalam

repositori data warehouse. ETL memungkinkan gerakan fisik data dari sumber ke target

penyimpanan data. Langkah pertama, ekstraksi, adalah untuk mengumpulkan atau ambil data

dari dari sumbernya (s). Langkah kedua, transformasi, adalah untuk mengkonversi, memformat,

membersihkan data ke dalam format yang dapat digunakan menjadi database target. Akhirnya

Page 3: Tugas 2 Abdul Karim

langkah terakhir, pemuatan, adalah mengimpor data berubah menjadi database target, data

warehouse, atau data mart.

Langkah 1 - Ekstraksi 

Langkah ekstraksi dari proses ETL melibatkan menghubungkan ke sistem sumber, dan

keduanya memilih dan mengumpulkan data yang diperlukan yang diperlukan untuk pengolahan

analisis dalam data warehouse atau data mart. Biasanya data konsolidasi dari berbagai sistem

sumber yang berbeda yang dapat menyimpan tanggal dalam format yang berbeda. Dengan

demikian proses ekstraksi harus mengkonversi data ke format yang sesuai untuk pengolahan

transformasi.Kompleksitas dari proses ekstraksi dapat bervariasi dan tergantung pada jenis dan

jumlah sumber data.

Langkah 2 - Transformasi 

Langkah transformasi proses ETL melibatkan pelaksanaan serangkaian aturan atau fungsi

untuk data yang diambil untuk mengubahnya menjadi format standar. Ini mencakup validasi

catatan dan penolakan mereka jika mereka tidak dapat diterima. Jumlah manipulasi yang

dibutuhkan untuk proses transformasi tergantung pada data. Sumber data yang baik akan

memerlukan sedikit transformasi, sedangkan yang lain mungkin memerlukan satu atau lebih

teknik transformasi untuk memenuhi kebutuhan bisnis dan teknis dari database target atau data

warehouse. Proses yang paling umum digunakan untuk transformasi adalah konversi,

membersihkan duplikat, standardisasi, penyaringan, pemilahan, menerjemahkan dan mencari

atau memverifikasi jika sumber data tidak konsisten.

Langkah 3 - Peta 

Beban adalah langkah terakhir dari proses ETL melibatkan mengimpor diekstraksi dan

diubah data ke dalam database target atau data warehouse. Beberapa proses beban fisik

memasukkan setiap record sebagai baris baru ke dalam tabel gudang sasaran memanfaatkan

pernyataan SQL insert. Sedangkan proses beban lainnya mencakup memasukkan massal besar

data menggunakan rutin beban massal. SQL insert adalah rutinitas lambat untuk impor data,

tetapi tidak memungkinkan untuk memeriksa integritas dengan setiap record. Rutinitas beban

Page 4: Tugas 2 Abdul Karim

massal mungkin lebih cepat untuk banyak data dalam jumlah besar, tetapi tidak memungkinkan

untuk memeriksa integritas pada beban setiap catatan individu.

Revisi

2. Penegertian ETL adalah proses yang harus dilakukan dalam pembuatan datawarehous. Di dalam ETL ada tiga proses yaitu.a. Ekstraksi data (Extract) proses pengambilan data dari berbagai system baik menggunaka

query ataupun aplikasi ETK itu sendiri. Ada lima pungsi eksterak data1. Ekstrak data secara otomatis dari data sumber2. Penyaringan data dari hasil ekstrak 3. Pengiriman data dari berbagai platform aplikasi dumber4. Perubahan format tampilan dari format aslinya5. Penympanan file sementara untuk penggabungan hasil ekstrak data sumber yang lain

b. Tranformasi data (Transformation) proses pengambilan data mentah dari hasil ekstraksi disaring dan diubah sesuai dengan ketentuan yang berlaku. Ada beberapa langkah dalam tranformasi data.1. Memetakan input data dari skema aslinya ke skema data warehouse2. Melakukan koversi dari tipe atau format data3. Pembersian duplikat dan kesalahan data4. Perhitungan nilai derivate5. Perhitungan nilai agregat6. Pemeriksaan integritas data7. Pengisian nilai kosong dengan nilai aslinya8. Pengabungan data

c. Pengisian Data (loading) proses yang dilakukan adalah proses pemuatan data dari hasil tranformasi kedalam datawarehous dengan menjalankan SQL Script secara teratur.

Jawaban No 3 Asli

Proses ETL sangat penting bagi upaya data warehouse Karena Extract, transform, dan

load ( ETL ) merupakan sebuah sistem yang dapat membaca data dari suatu data store, merubah

bentuk data, dan menyimpan ke data store yang lain. Data store yang dibaca ETL disebut data

source, sedangkan data store yang disimpan ETL disebut target. Proses pengubahan data

digunakan agar data sesuai dengan format dan kriteria, atau sebagai validasi data dari source

system. Proses ETL tidak hanya menyimpan data ke data warehouse, tetapi juga digunakan

untuk berbagai proses pemindahan data.

Page 5: Tugas 2 Abdul Karim

Kebanyakan ETL mempunya mekanisme untuk membersihkan data dari source system

sebelum disimpan ke warehouse. Pembersihan data merupakan proses identifikasi dan koreksi

data yang kotor. Proses pembersihan ini menerapkan aturan-aturan tertentu yang mendefinisikan

data bersih. Sehingga ETL Sangat di butuhkan di database warehouse.

3. Proses ETL (Extract, Tranformation, Loading) bagi penggunaan datawarehous proses ekstrak, tranformasi dan pengisian data merupakan system yang dapat membaca dari suatu penyimpanan data, merubah dan meyimpan data ketempat penyimpanan data yang lainya. Penyimpanan data yang dibaca oleh ETL disebut data source, perubahan data dilakukan agar data sesuai dengan format yang ditentukan.

Jawaban No 4 Asli

Yang dimaksud dengan data warehouse real-time adalah komponen historis dan analitik dari

aliran data tingkat perusahaan. Aliran data ini mendukung terus menerus, asynchronous,

pengiriman multipoint data. Dengan kata lain, data yang bergerak lurus dari sumber yang berasal

untuk semua penggunaan yang tidak memerlukan beberapa bentuk pementasan. Gerakan ini

terjadi segera setelah data asli ditulis. Setiap penundaan waktu karena semata-mata untuk

mengangkut latency dan (opsional) waktu pengolahan sangat kecil untuk mengirimkan atau

mengubah contoh data yang disampaikan.

Revisi

4. Yang dimaksud degan database warehouse real time adalah sebuah gudang data yang terdapat beberapa database sehingga datawarehous rieal time berperan meyediakan data yang diperlukan oleh Manager, kapanpun data dibutuhkan maka datawarehous rieal time siam memberikan data tersebut.

Jawaban No 5 Asli

Keuntungan dari data warehouse real-time Adalah Data warehouse merupakan pendekatan

untuk menyimpan data dimana sumber-sumber data yang heterogen(yang biasanya tersebar pada

beberapa database OLTP) dimigrasikan untuk penyimpanan data yang homogen dan terpisah.

Page 6: Tugas 2 Abdul Karim

Keuntungan yang didapatkan dengan menggunakan data warehouse tersebut dibawah ini

(Ramelho).

o Data diorganisir dengan baik untuk query analisis dan sebagai bahan untuk pemrosesan

transaksi.

o Perbedaan diantara struktur data yang heterogen pada beberapa sumber yang terpisah

dapat diatasi.

o Aturan untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data

apabila data dipindahkan dari database OLTP kedata warehouse.

o Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu mengubah sistem produksi.

Revisi

5. Keuntungan dari data warehouse real time adalah dapat memberikan sebuah data yang dibutuhkan setiap waktu. Dan ada bebrapa keuntungan lainya

a. Data tertata dengan baik untuk analisis sebagai bahan pemrosesan transaksib. Penggabungan data dari sumber yang beebedah c. Tranformasi data untuk memvalidasi dan mengkonsulidasi data saat data dipindahkan dari

OLTP ke datawarehoued. Masalah keamanan dapat diatasi dengan baik

Jawaban No 6 Asli

Perbedaan antara data ware house tradisional dengan data warehouse real-time Adalah : Data

warehouse memisahkan beban kerja analisis dari beban kerja transaksi dan memungkinkan

organisasi menggabung/konsolidasi data dari berbagai macam sumber. Jadi, data warehouse

merupakan metode dalam perancangan database, yang menunjang DSS(Decission Support

System) dan EIS (Executive Information System). Secara fisik data warehouse adalah database,

tapi perancangan data warehouse dan database sangat berbeda. Dalam perancangan database

tradisional menggunakan normalisasi, sedangkan pada data warehouse normalisasi bukanlah cara

yang terbaik. Dan Data warehouse rial-time melakukan perubahan kapan saja bisa.

Page 7: Tugas 2 Abdul Karim

Revisi

6. Perbedaan data warehouse tradisional dan datawarehous real time adalah didalam perancangan untuk pengolahan databasenya. Datawarehous tradisional menggunakan normalisasi sedangkat datawarehous real time normalisasi tidak menjadipatokan melainkan perubahan data kapan saja bisa dilakukan disaat top manager memerlukan

Jawaban No 7 Asli

Motivasi yang mendorong dikembangkannya data warehouse real-time Adalah Membangun

data warehouse tentu saja memberikan keuntungan lebih bagi suatu perusahaan, karena data

warehouse dapat memberikan keuntungan strategis pada perusahaan tersebut melebihi pesaing-

pesaing mereka. Keuntungan tersebut diperoleh dari beberapa sumber (Sean Nolan,Tom

Huguelet):

Kemampuan untuk mengakses data yang besar

Kemampuan untuk memiliki data yang konsistent

Kemampuan kinerja analisa yang cepat

Mengetahui adanya hasil yang berulang-ulang

Menemukan adanya celah pada business knowledge atau business process.

Mengurangi biaya administrasi

Memberi wewenang pada semua anggota dari perusaahan dengan menyediakan kepada

mereka informasi yang dibutuhkan agar kinerja bisa lebih ef

Revisi

7. Motivasi Dalam pembangunan datawarehous real time adalah keuntungan lebih banyak yang didapat oleh perusahaan karena datawarehous memberikan keuntungan strategis kepada perusahaan itu sendiri dan dengan banyaknya pesaing sehingga perusahaan harus menggunakan data warehouse. Ada banyak keuntungan yang didapat dari datawarehous yaitu

a. Kemanpuan akses data yang besarb. Kemampuan data yang konsistec. Kemanpuan kinerja yang cepatd. Mengetahui adanya hasi yang berulang

Page 8: Tugas 2 Abdul Karim

e. Menemukan adanya celah pad ape getahun bisnis dan proses bisnisf. Mengurangi biaya administrasig. Memberikan wewenang pada semua anggota dari perusahaan dan informasi yang

dibutuhkan agar kinerja menjadi lebih baik.