[data warehouse] · 2016. 4. 6. · dalam bidang data warehouse kebutuhan yang dimaksud adalah...

32
[Data Warehouse] [6/C2 & 6/D2] [ Chapter 5] Metodologi Pengembangan Data Warehouse Dedy Alamsyah, S.Kom, M.Kom [NIDN : 0410047807]

Upload: others

Post on 27-Jan-2021

8 views

Category:

Documents


0 download

TRANSCRIPT

  • [Data Warehouse][6/C2 & 6/D2]

    [ Chapter 5]Metodologi Pengembangan Data Warehouse

    Dedy Alamsyah, S.Kom, M.Kom[NIDN : 0410047807]

  • Methodology didefinisian sebagai “a set of system of method, principles and rules of regulating a given discipline” (dictionary.com/methodology).

    Method artinya: “a procedure, technique, or way of doing somethings, especially in accordance with a definite plan” (dictionary.com/method).

    Dalam rekayasa perangkat lunak, disiplin yang mempelajari proses yang digunakan untuk mengembangkan suatu sistem informasidisebut system development life cycle(SDLC) yaitu siklus hiduppengembangan sistem atau metodologi pengembangan sistem.

    Terdapat dua varian utama: waterfall dan iterasi. Metode waterfall diketahui juga sebagai metode sekuensial atau metodeberurutan. Sedangkan metode iterasi disebut juga sebagaimetode spiral atau metode perulangan.

    Metodology Pengembangan Data Warehouse

  • Metodologi pengembangan Data Warehouse terbagi 2 yaitu:

    1. Waterfall (Bertingkat)

    2. Itaretative (Perulangan)

    Metodologi Pengembangan Data

    Warehouse

  • Pada metodologi waterfall, langkah – langkahpengembangan dilakukan secara berurutan. Satu setelahlainnya. Seperti ketika menuruni anak tangga atau sepertiair terjun berundak sesuai dengan namanya.

    Terdapat beberapa variasi nama langkah, namun secaraumum langkah – langkah tersebut adalah sebagai berikut: studi kelayakan, kebutuhan, arsitektur, desain, pengembangan, pengujian, penyebaran, danpengoperasian.

    1. Metodologi Waterfall (Air Terjun)

  • SDLC

  • Planning

    Analyzing

    Design

    Implementation

    Maintenance

  • Feasibility Study (Studi Kelayakan)

    Requirement (Analisa Kebutuhan)

    Architecture (Arsitektur)

    Design (Disain)

    Development (Pengembangan)

    Testing (Pengujian)

    Deployment (Penyebaran)

    Operation (Operasional)

    Step-step Metodologi Waterfall

  • Studi Kelayakan : Mengumpulkan segala info mengenaimanfaat penerapan data warehouse, kebutuhan waktupengembangan, biaya, kemungkinan mendapat sample data, dan solusi apabila terjadi masalah baik selama proses pengembangan atau setelah selesai pengembangan.

    Kebutuhan : Langkah komunikasi dengan user untukmemahami proses bisnis, kemudian penggunaan data dan user interface serta keamaan yang dibutuhkan, lalumendokumentasikannya.

    Arsitektur : Menentukan arsitektur aliran data yang digunakanserta arsitektur sistem. Termasuk spesifikasi database, jaringan, dansolusi penyimpanan.

    Desain : Mendesain tiga bagian utama, yaitupenyimpanan data, sistem ETL, dan front-end aplikasi.

    Pengembangan : Membangun tiga bagian utama yang telahdidesain sebelumnya.

    Penjelasan Waterfall

  • Pengujian : Menguji tiga bagian utama yang dibangun, yang merupakan titik – titik terlemah

    Penyebaran : Mengintegrasi tiga bagian yang dibangun danmemuat data – data yang diperlukan untuk pertama kali. Proyek ditutup dan sistem diserahkan pada tim operasi.

    Operasi : Langkah bimbingan dan pemecahan masalahpenggunaan sistem yang dialami user oleh tim operasi.

    Pengaturan Infrastruktur : Mempersiapkan lingkungan produksi

    Manajemen Proyek : Memantau dan mengevaluasi jalannyaproduksi agar sesuai dengan rencana proyek

    Penjelasan Metode Waterfall (2)

  • Prinsip dasar dari metodologi berulang adalah untukmelakukan rilis sebuah sistem secara keseluruhan dan lengkapuntuk menemukan masalah awal dan membuat penyesuaianyang diperlukan ketika persyaratan tidak dapat didefinisikansecara memadai oleh pengguna. Dalam metodologiwaterfall, Anda melakukan release system dalam dalam satufase, dan sebelum itu Anda memiliki periode pengujian ketikaAnda mencoba untuk memperbaiki kesalahan. Dalammetodologi berulang, kita merilis versi dari sistem beberapakali ke dalam produksi untuk digunakan oleh pengguna yang dipilih. Misalnya, butuh delapan bulan untuk membangunsistem data warehouse; jika menggunakan metodologiwaterfall, itu akan selesai dalam 8 bulan. Jika menggunakanmetodologi berulang, Anda akan merilis versi di bulan 3, 6, dan 8 (tiga kali rilis).

    2. Metodologi Iterasi (Perulangan/Berulang)

  • Metodologi waterfall umumnya digunakan dalam pengembanganperangkat lunak termasuk dalam data warehouse. Ada tiga proses utama yaitu: ETL (Exstract, Transform dan Load), menyimpan data, dan membuat aplikasi front-end.

    Dalam metodologi waterfall, Anda melakukan rilis sekali, sedangkandalam metodologi Iterasi Anda melakukan rilis berkali-kali. Denganwaterfall, periode paling berisiko adalah selama pengujian. Karenahal ini adalah pertama kalinya seluruh arsitektur berjalan sebagaisistem, pertama kalinya pengguna melihat data warehouse, danpertama kalinya lingkungan produksi yang digunakan. Hal ini jugaberisiko karena peluncuran sudah mendekati batas waktu (dead line), dan Anda tidak bisa mengambil risiko kesalahan dalamlingkungan produksi.

    Metodologi Iterasi mengatasi masalah-masalah dengan membuatproses produksi dan pengembangan berada di awal produksi. Dengan melakukan ini, Anda melakukan semua hal penting dalamiterasi pertama dengan hal itu anda telah meminimalisir resiko.

    Penjelasan

  • Alasan utama untuk melakukan proyek melalui caraini adalah untukmeminimalkan risiko. Salah satu hambatan dalam metodologiwaterfall adalah periode pengujian. Periode pengujian adalahwaktu paling berisiko dalam metodologi waterfall karena alasanberikut:

    1. Ini adalah pertama kalinya semua komponen digabungkanbersama-sama dan pertama kalinya seluruh arsitektur berjalansebagai sebuah sistem.

    2. Ini adalah pertama kalinya pengguna melihat danmenggunakan data warehouse.

    3. Ini adalah pertama kalinya lingkungan pengujian danlingkungan produksi yang digunakan.

    4. Ini adalah pertama kalinya Anda mencoba untuk menjalankansistem pada kapasitas maksimum (untuk kinerja pengujian).

    5. Tanggal go-live (dead line) mendekati cepat, dan Anda tidakbisa mengambil risiko kesalahan dalam lingkungan produksi. Ada banyak “resiko pertama" terjadi pada saat pengujian.

    Hambatan selama proses development

  • Metodologi berulang menghilangkan lima risiko dan masalahyang disebutkan sebelumnya. Lima hal tersebut sudah selesaidilakukan sejak iterasi 1 hingga pada akhir tanggal go-live (iterasi 3), sistem akan berjalan jauh lebih lancar. Adapun proses tersebut langkah demi langkahmya adalah:

    1. Pada iterasi pertama, Anda menjalankan seluruh arsitektursebagai suatu sistem.

    2. Pada iterasi pertama, pengguna melihat dan menggunakandata warehouse.

    3. Pada iterasi pertama, tes dan lingkungan produksi yang digunakan.

    4. Pada iterasi pertama, Anda menjalankan sistem padakapasitas maksimum untuk pengujian kinerja.

    5. Pada iterasi pertama, Anda menyebarkan produksi(ditayangkan).

    Alasan penggunaan metodologi iterasi

  • 1. Identifying Business AreasIdentifikasi area bisnis dari organisasi

    2. Understanding Business OperationsPahami Operasi-operasi bisnis yang ada

    3. Defining Functional RequirementsTentukan Kebutuhan-kebutuhan fungsional (kebutuhan utam)

    4. Defining Nonfunctional RequirementsTentukan kebutuhan-kebutuhan non fungsional (kebutuhantambahan)

    5. Conducting a Data Feasibility StudyLakukan studi kelayakan dari berbagai sisi

    Tahap Planning - Dalam Membangun Data

    Warehouse

  • Top-down design (Bill Inmon): Kebutuhan pengguna padatingkat organisasi yang berbeda digabung sebelum proses desain dimulai, dan satu skema untuk seluruh data warehouse dibangun. Kemudian, data mart yang terpisahdisesuaikan sesuai dengan karakteristik masing-masing area bisnis atau proses.

    Bottom-up design (Ralph Kimball): Skema terpisah dibangununtuk setiap data mart, dengan mempertimbangkankebutuhan pengguna pengambilan keputusan yang bertanggung jawab untuk area bisnis tertentu yang sesuaiatau proses. Kemudian, skema ini digabung dalam skemaglobal untuk seluruh data warehouse.

    Tahap Disain - Pendekatan Dalam

    Membangun Data Warehouse.

  • Dalam pendekatan top down, kebutuhan penggunapada tingkat organisasi yang berbeda digabung sebelumproses desain dimulai, dan satu skema untuk seluruh data warehouse dibangun, dari asal data mart diperoleh.

    Dalam pendekatan bottom-up, skema dibangun untuksetiap data mart, sesuai dengan kebutuhan penggunamasing-masing area bisnis baru digabung

  • Pendekatan Bawah ke Atas

  • Pendekatan Atas ke Bawah

  • Tahap Development - Metode Pengembangan Data

    Warehouse

    Metode Pengembangan

    Data Driven Approach

    Requirement Driven

    Approach

    User-Driven Approach

    Process-Driven Approach

    Goal-Driven Approach

  • Pengembangan model dilakukan berdasarkan eksplorasimodel dan data dari sumber data.

    Model konseptual untuk sebuah data warehouse berasal dari model data sumber yang ditransformasi.

    Kebutuhan organisasi tidak diidentifikasi sama sekali ataudiidentifikasi sebagian.

    Beberapa ahli yang menyarankan metode ini adalahGolfarelli, Inmon, serta Phipps dan Davis.

    Inmon bahkan mengusulkan agar tahap analisiskebutuhan pengguna dilakukan setelah implementasidata warehouse.

    Data-driven Approach

  • Dalam bidang data warehouse kebutuhan yang dimaksud adalah kebutuhan informasi, bukankebutuhan fungsional sebagaimana digunakan dalamSDLC.

    Terdapat beberapa cara yang berbeda dalammemperoleh kebutuhan pengguna, yaitu :

    user-driven approach [Westerman, Goeken, dan Kimball ]

    process-driven approach [Kaldeich dan Oliveira ]

    goal-driven approach [Georgini]

    Sebuah metode dapat menggunakan lebih dari satupendekatan.

    Requirement-Driven Approach

  • Metode 9 Tahap Kimball (1996)

    Metode 4 Tahap Kimball (2002)

    Perbaikan dari metode sebelumnya

    Metode Powell

    Metodologi Pengembangan Data Dimensional

  • 1. Menentukan proses bisnis (Choosing the process)

    2. Menentukan granularity (Choosing the grain)

    3. Identifikasi dan penyesuaikan dimensi (Identifying and conforming the dimensions)

    4. Menentukan fakta (Choosing the fact)

    5. Menyimpan hasil perhitungan sementara pada tabel fakta (Storing pre-calculations in the fact table)

    6. Melengkapi tabel-tabel dimensi (Rounding-out the dimension tables)

    7. Menentukan durasi dimensi (Choosing the duration of the dimension)

    8. Menelusuri dimensi yang termasuk slowly changing dimension (Tracking slowly changing dimension)

    9. Memutuskan prioritas query dan bentuknya (Deciding the query priorities and the query modes)

    9 Tahapan Model Kimball

  • Dalam perkembangannya, Kimball (2002) mempersempitmetodologi 9 langkah tersebut menjadi empat langkah, yaitu :

    1. Memilih proses bisnis (Select the business process to model)

    2. Menyatakan granularity proses bisnis (Declare the grain of business process)

    3. Menentukan dimensi untuk setiap baris tabel fakta (Choose the dimensions that apply to each fact table row)

    4. Mengidentifikasi fakta numerik yang akan mengisi setiapbaris tabel fakta (Identify the numeric fact that will populate each fact table row)

    Metode 4 Tahap Kimball

  • Dalam metode empat tahap yang direkomendasikanKimbal, pengguna diwawancarai untuk mendapatkankebutuhan.

    Tujuan dari wawancara adalah untuk memahamipekerjaan yang dilakukan pengguna dan carapengguna mengambil keputusan.

    Tenaga Teknologi Informasi juga diwawancarai untukmengetahui ketersediaan sumber data.

    Selain menggunakan user-driven approach, metodetersebut juga menggunakan process-driven approach.

    Proses Metode Kimball

  • Menurut Powell (2006), langkah-langkah membuat model data dimensional dimulai dari end-user. Karena end-user adalah pemakai informasi hasil query data warehouse.

    Dari perspektif tersebut, langkah-langkah dalam merancangdata dimensional menurut Powell adalah sebagai berikut.

    1. Proses bisnis (Business processes)

    2. Granularity

    3. Identifikasi dan membentuk dimensi (Identify and build dimensions)

    4. Membentuk fakta (Build fact)

    Metode Powell

  • 1. Proses bisnis (Business processes)

    Menentukan dan menggambarkan subyek area bisnis dari functional requirement yang ada.

    Subyek dianalisis sebagai dasar menentukan tabel fakta pada langkahselanjutnya.

    2. Granularity

    Granularity adalah tingkat dari rincian kebutuhan.

    Pilihan yang paling aman menurut Powell adalah menyertakan semuadata historis pada level yang terendah.

    Keuntungan menyertakan data level terendah adalah menghindari data yang hilang ketika dibutuhkan manajer eksekutif.

    Keuntungan lain adalah menghindari kekurangan data ketika dibutuhkanbahan analisis di masa datang meskipun untuk saat ini belum digunakan.

    Proses Metode Powell

  • 3. Identifikasi dan membentuk dimensi (Identify and build dimensions)

    Menentukan data-data yang dibutuhkan untukmendukung subyek untuk dapat dibentuk dalambeberapa tabel dimensi.

    Tabel dimensi nantinya akan mendeskripsikan tabel faktadengan menyimpan detil transaksi tabel fakta.

    4. Membentuk fakta (Build fact)

    Pembentukan fakta atas dasar subyek yang telahditentukan.

    Lanjutan

  • Pendekatan yang dilakukan Powell sama denganpendekatan terakhir Kimball.

    Namun demikian empat langkah tersebut dapatdijalankan dengan mengikuti detilnya (sembilan langkahKimball).

    Kimball vs Powell

  • Kesimpulan

  • Selesai

    Ada pertanyaan ???