bab 2 landasan teori - library.binus.ac.idlibrary.binus.ac.id/ecolls/ethesisdoc/bab2/2014-1-00680-si...
TRANSCRIPT
7
BAB 2
LANDASAN TEORI
2.1 Teori-teori dasar/ umum
Dalam teori-teori ini berisikan berisikan pengertian dari data, quality,
service, data quality, data quality service (DQS), data warehouse, serta
perbedaan antara data quality service (DQS) dan data warehouse. Pengertian
teori dasar/umum tersebut diambil dari beberapa referensi buku dan jurnal.
2.1.1 Pengertian Data
Menurut Yakub (Yakub, 2008, p1) data merupakan
representasi fakta dunia nyata yang mewakili suatu objek seperti
manusia (pegawai, siswa, klien, dan lainnya), barang, hewan,
peristiwa, konsep, keadaan, dan sebagainya yang direkam dalam
bentuk angka, huruf, simbol, teks, gambar, bunyi, atau kombinasinya.
2.1.2 Pengertian Quality
Menurut Norbert Becser (Norbert Becser, 2007, p9), quality
adalah obyektif dan subyektif pada saat bersamaan, serta memiliki
beberapa faktor yang mempunyai spesifikasi yang dapat diukur.
Kualitas disini dapat berarti setiap tingkatan mempunyai efisiensi
yang berbeda-beda dari awalnya.
2.1.3 Pengertian Service
Menurut Norbert Becser (Nobert Becser, 2007, p14), service
adalah hasil dari kegiatan yang memenuhi kebutuhan. Biasanya
dengan membentuk hubungan langsung dengan klien dan suatu
tindakan atau kinerja yang diberikan salah satu pihak kepada pihak
lainnya.
2.1.4 Pengertian Data Quality
Menurut Reza Rad (Reza Rad, 2014, p143) Data quality
adalah mengenai data mana yang bagus untuk bisnis. Data quality
8
dapat dibedakan berdasarkan sumbernya, kualitas datanya, dan
sebagainya. Data quality itu penting karena data yang kurang baik
dapat menyebabkan bisnis yang buruk.
2.1.5 Pengertian Data Quality Service
Menurut Reza Rad (Reza Rad, 2014, p145) Data quality
service adalah sebuah aplikasi berbasis layanan yang bekerja
berdasarkan knowledge-base-driven data quality. Knowledge-base-
driven data quality bekerja dengan basis pengetahuan yang terdiri dari
domain, DQS juga dilengkapi dengan fungsi untuk membuat aturan
pencocokan data dan menerapkan aturan tersebut pada data.
2.1.6 Perbedaan Data Quality Service dan Data Warehouse
Menurut Torben Bach Pedersen (Tapan Kumar Das dan
Manas Ranjan Mishra, 2007, p22) Data Warehouse dan Data Quality
Service masing masing memiliki tools, yaitu tools data warehouse
seperti Oracle Warehouse, IBM DB2 dan Warehouse Manager,
sedangkan data quality service yaitu Microsoft Integration Service.
Dalam data warehouse, setelah proses ETL akan berlanjut ketahap
selanjutnya sedangkan data quality service setelah proses ETL akan
masuk kedalam data warehouse.
2.2 Teori Khusus
2.2.1 Pengertian Registrasi
Menurut Kamus Besar Bahasa Indonesia (Kamus Besar
Bahasa Indonesia, 2008, p285), pendaftaran adalah proses, cara,
perbuatan mendaftar (mendaftarkan); pencatatan nama, alamat, dan
sebagainya kedalam daftar. Jadi, pendaftaran merupakan proses
pencatatan identitas pendaftar yang akan disimpan kedalam suatu
tempat penyimpanan yang nantinya akan digunakan dalam proses
pendaftaran.
2.2.2 Pengertian Klaim
9
Menurut Dr. H. Mulyadi Notosusastro (Dr. H. Mulyadi
Notosusastro, 2013, p94), Klaim adalah tuntutan ganti rugi yang
dimajukan oleh tertanggung kepada penanggung atas perusahaan
asuransi. Klaim menjurus pada hak dan kepemilikan yang diperoleh
berdasarkan kerugian yang diderita seseorang sesuai dengan
perjanjian tertulis didalam polis.
2.2.3 Pengertian Sales/Penjualan
Menurut Marwan (Marwan, 2008, p345), penjualan adalah
suatu usaha yang terpadu untuk mengembangkan rencana-rencana
strategis yang diarahkan pada usaha pemuasan kebutuhan dan
keinginan pembeli, guna mendapatkan penjualan yang menghasilkan
laba.
2.3 Analisa dan Perancangan Data Quality Service
2.3.1 Pengertian Extract, Transform, dan Load
Menurut Reza Rad (Reza Rad, 2014, p84) Extract adalah
proses mengambil data dari sumber data yang berbeda, Transform
adalah langkah di mana kita menerapkan transformasi data, seperti
agregasi, bergabung dengan dataset lain, menerapkan aturan, split
atau menggabungkan hasil set, dan sebagainya. Pada langkah Load,
kita memiliki data yang siap ke tabel tujuan, dan melakukan load ke
tabel fakta atau tabel dimensi dalam data warehouse.
2.3.2 Pengertian SSIS (SQL Server Integration Service)
Menurut Reza Rad (Reza Rad, 2014, p85) SSIS adalah sebuah
ETL tools yang merupakan bagian dari Microsoft SQL Server. SSIS
adalah rapid application development tool yang biasa disebut SQL
Server Data Tools yang dikenal sebagai Business Intelegence
Development Studio. Business Intelegence Development Studio ini
membangun banyak komponen dalam SSIS yang membantu
melindungi semua aspek dari ETL.
10
2.3.3 Activity Diagram
Menurut Satzinger, Jackson, dan Burd (Satzinger, Jackson,
dan Burd 2010, p141) activity diagram merupakan diagram yang
menjelaskan aktifitas pengguna sistem secara sekuensial. Activity
diagram merupakan salah satu diagram Unified Modelling Language
(UML) yang terasosiasi dengan pendekatan object-oriented, tetapi
bisa digunakan dengan pendekatan lainnya.
Di dalam Activity Diagram terdapat beberapa notasi, diantaranya;
- Synchronation Bar, simbol/notasi yang menunjukkan bahwa
didalam proses bisnis terdapat aktifitas yang dijalankan secara
bersamaan sehingga aktifitas tersebut dipisah melalui
synchronation bar.
- Swimlane, area yang berbentuk kotak dalam activity diagram
yang merepresentasikan aktifitas yang dilakukan oleh agen
tunggal.
Gambar 2.1 Activity Diagram
Sumber: (Satzinger, Jackson, dan Burd, 2010)
2.3.4 Use Case Diagram
Menurut Satzinger, Jackson, dan Burd (Satzinger, Jackson,
dan Burd, 2010, p160) use case adalah diagram yang menggambarkan
aktifitas yang dilakukan oleh sistem. Notasi yang terdapat didalam use
case diantaranya:
11
- Actor merupakan orang yang melakukan interaksi dengan sistem.
Digambarkan dengan stickfigure.
- Boundary batasan dalam sistem.
- Connecting Line garis yang menunjukkan actor mana saja
yang berpartisipasi dalam sebuah use case.
Gambar 2.2 Use Case Diagram
Sumber: (Satzinger, Jackson, dan Burd, 2010)
2.3.5 Event Table Menurut Satzinger, Jackson, dan Burd (Satzinger, Jackson,
dan Burd, 2010, p168) event table berisi baris dan kolom, yang
merepresentasikan sebuah peristiwa yang mengakibatkan sistem
berjalan beserta detailnya, secara berturut-turut. Tiap baris didalam
event table menyimpan informasi tentang satu event beseta use case-
nya. Tiap kolom dalam event table merepresentasikan informasi
kunci/inti tentang sebuah event beserta use case-nya.
Menurut Satzinger, Jackson, dan Burd (Satzinger, Jackson, dan
Burd, 2010, p169), penjelasan masing-masing kolom pada Event
Table:
- Event, kolom yang berisi penjelasan mengapa sistem
menjalankan sebuah use case.
- Trigger, sebuah peringatan yang memberitahu sistem bahwa
sebuah event telah terjadi.
- Source, agen eksternal atau actor yang mengirim data kepada
sistem.
12
- Response, sebuah output yang dihasilkan oleh sistem, yang
menuju kepada destination.
- Destination, agen eksternal atau actor yang menerima data
dari sistem.
Gambar 2.3 Event Table
Sumber: (Satzinger, 2010)
2.3.6 Use Case Full Description
Menurut Satzinger, Jackson, dan Burd (Satzinger, Jackson,
dan Burd, 2010, p171) use case description berisi informasi detail
yang menjelaskan sebuah use case, use case description berisi daftar,
penggunaan, dan menjelaskan rincian proses use case. Use case
description terbagi menjadi 3, yaitu;
- Brief Description, berisi penjelasan singkat mengenai sebuah use
case.
Gambar 2.4 Brief Description
Sumber: (Satzinger, Jackson, dan Burd, 2010)
- Intermediate Description, mengembangkan informasi yang
berasal dari brief description serta menjelaskan alur dari tiap use
case.
13
Gambar 2.5 Intermediate Description
Sumber: (Satzinger, Jackson, dan Burd, 2010)
- Full Developed Description, merupakan metode yang paling
formal untuk mendokumentasikan sebuah use case.
Gambar 2.6 Full Developed Description
Sumber: (Satzinger, Jackson, dan Burd, 2010)
2.3.7 Class Diagram
Menurut Satzinger, Jackson, dan Burd (Satzinger, Jackson,
dan Burd, 2010, p60) class diagram merupakan diagram yang
menunjukkan semua class yang terdapat dalam sistem. Class diagram
berisi atribut yang diperlukan untuk pembangunan sistem.
14
Gambar 2.7 Class Diagram
Sumber: (Satzinger, Jackson, dan Burd 2010)
2.3.8 System Sequence Diagram
Menurut Satzinger, Jackson, dan Burd (Satzinger, Jackson, dan
Burd, 2010, p242) System Sequence Diagram merupakan diagram
yang menunjukkan urutan pesan antara actor eksternal dengan sistem
selama use case berjalan.
Salah satu cara untuk membangun system sequence diagram
adalah berdasarkan activity diagram. Pembangunan ini melalui 4
tahap, yaitu;
- Mengidentifikasi pesan input.
- Menjelaskan pesan dari actor eksternal kepada sistem
menggunakan notasi message.
- Identifikasi dan tambahkan beberapa kondisi khusus kedalam
pesan input, termasuk iteration dan kondisi true/false.
- Identifikasi dan tambahkan pesan output berupa return message.
Gambar 2.8 System Sequence Diagram
Sumber: (Satzinger, Jackson, dan Burd, 2010)
15
2.3.9 Package Diagram
Menurut Satzinger, Jackson, dan Burd (Satzinger, Jackson,
dan Burd, 2010, p459) Package Diagram merupakan diagram UML
(Unified Modelling Language) yang mengizinkan designer untuk
mengasosiasikan class yang terkait dengan grup tertentu.
Nama package biasanya ditampilkan pada tab, namun
terkadang nama package juga ditempatkan didalam bagian persegi
untuk view tingkat tinggi apabila tidak ada detail yang ditampilkan
didalam package.
Gambar 2.9 Package Diagram
Sumber: (Satzinger, Jackson, dan Burd, 2010)
2.3.10 Communication Diagram
Menurut Satzinger, Jackson, dan Burd (Satzinger, Jackson,
dan Burd, 2010, p454) communication diagram dan sequence
diagram merupakan diagram yang keduanya sama-sama interaction
diagram, dan kedua diagram ini menangkap informasi yang sama.
Communication diagram juga berguna untuk menunjukkan kegunaan
use case dari sudut pandang yang berbeda.
16
Communication diagram menggunakan simbol yang sama
dengan UML lainnya untuk actor, object, dan message untuk
menunjukkan sequence diagram. Actor didalam communication
diagram merupakan pengguna sistem yang mengirimkan pesan inisial
kepada sistem. Object didalam communication diagram merupakan
notasi yang menunjukkan bahwa pesan telah diterima dari pengguna,
dan kemudian object akan mengirimkan pesan tersebut kepada object
lain yang diperlukan.
Gambar 2.10 Communication Diagram
Sumber: (Satzinger, Jackson, dan Burd, 2010)
2.3.11 User Interface
Menurut Satzinger, Jackson, dan Burd (Satzinger, Jackson,
dan Burd, 2010, p531) user interface adalah bagian-bagian dari suatu
sistem informasi yang memerlukan interaksi pengguna untuk
membuat input dan ouput. User interface melibatkan input dan output
yangs secara langsung melibatkan pengguna, sebuah user interface
memungkinkan pengguna untuk berinteraksi dengan komputer untuk
merekam suatu record.
2.3.12 State Chart Diagram
Menurut Satzinger, Jackson, dan Burd (Satzinger, Jackson,
dan Burd, 2010, p242) state chart diagram adalah diagram yang
menunjukkan kehidupan obyek dalam suatu state dan transition. State
chart digunakan untuk mengidentifikasi berbagai state dari sistem itu
sendiri dan peristiwa yang terjadi.
17
Gambar 2.11 State Chart Diagram
Sumber: (Satzinger, 2010)
2.3.13 Deployement Architecture and Software Architecture
Menurut Satzinger, Jackson, dan Burd (Satzinger, Jackson,
dan Burd, 2010, p339) deployement architecture and software
architecture merupakan suatu pemilihan untuk penerapan arsitektur,
lalu langkah berikutnya yaitu memberikan penjelasan rinci untuk
merancang software dan aplikasi yang melibatkan struktur dan
organisasi terkait sebuah software sistem baru.
Gambar 2.12 Deployement Architecture and Software Architecture
Sumber: (Satzinger, Jackson, dan Burd, 2010)
2.3.14 Developing The First-Cut Design Class Diagram
Menurut Satzinger, Jackson, dan Burd (Satzinger, Jackson,
dan Burd, 2010, p413) developing the first-cut design class diagram
dikembangkan dengan memperluas domain class diagram. Hal ini
membutuhkan dua langkah:
1. Menjelaskan lebih lanjut tentang atribut dengan jenis dan nilai awal
informasi.
18
2. Menambahkan panah dalam tampilan navigasi.
Gambar 2.13 Developing The First-Cut Design Class Diagram
Sumber: (Satzinger, Jackson, dan Burd, 2010)
2.3.15 Three Layer Design Systems Sequence Diagram
Menurut Satzinger, Jackson, dan Burd (Satzinger, Jackson,
dan Burd, 2010, p473) three layer design system sequence diagram
adalah bagian dari aksi secara keseluruhan dalam desain sistem
berdasarkan pola desain. Sebuah pola desain adalah template yang
telah terbukti efektif untuk persyaratan tertentu dalam sistem desain.
19
Gambar 2.14 Three Layer Design Systems Sequence Diagram
Sumber: (Satzinger, Jackson, dan Burd, 2010)
2.3.16 Updated Class Diagram
Menurut Satzinger, Jackson, dan Burd (Satzinger, Jackson,
dan Burd, 2010, p457) updated class diagram merupakan bentuk yang
dikembangkan dari class diagram, pada view layer dan data access
layer beberapa kelas baru harus ditentukan. Lapisan domain juga
memiliki beberapa kelas baru yang ditambahkan untuk use case
controller.
20
Gambar 2.15 Updated Class Diagram
Sumber: (Satzinger, Jackson, dan Burd, 2010)
2.3.17 Navigation Diagram
Menurut Satzinger, Jackson, dan Burd (Satzinger, Jackson,
dan Burd, 2010, p504) navigation diagram merupakan suatu objek
yang melakukan proses ekstraksi pada identifier objeknya dari objek
lain yang terkait.
21
Gambar 2.16 Navigation Diagram
Sumber: (Satzinger, Jackson, dan Burd, 2010)
2.3.18 Persistence Object
Menurut Alan, Barbara dan David (Alan, Barbara dan David,
2009, p362) persistence object menjelaskan bagaimana project team
mendesain sebuah penyimpanan untuk objek (object persistence).
2.4 Metode Data Quality Service
2.4.1 Metode Data Cleansing
Dalam menyelesaikan masalah kualitas data, Data Quality
Service menyediakan fitur sebagai berikut:
• Data Cleansing: Menurut Microsoft (Microsoft, 2012, p115)
Pembersihan data adalah proses menganalisis kualitas data dalam
sumber data, secara manual menyetujui/menolak saran oleh
sistem, dan dengan demikian membuat perubahan pada data.
Pembersihan data dalam Data Quality Service (DQS) termasuk
proses yang dibantu komputer yang menganalisis bagaimana data
sesuai dengan knowledge dalam knowledge base, dan proses
interaktif yang memungkinkan data steward untuk meninjau dan
22
mengubah hasil proses dibantu komputer-untuk memastikan
bahwa pembersihan data adalah persis seperti yang mereka
inginkan untuk dilakukan.
Fitur dalam cleansing data di dalam DQS:
• Mengidentifikasi data yang tidak lengkap atau tidak benar
dalam sumber data (Excel file atau SQL Server Database),
dan kemudian mengoreksi atau memberitahu pengguna
tentang data yang tidak valid.
• Menyediakan proses dua langkah untuk membersihkan data:
computer-assisted and interactive. Proses bantuan komputer
menggunakan pengetahuan dalam knowledge base didalam
DQS secara otomatis memproses data, dan menyarankan
penggantian/koreksi. Langkah selanjutnya yaitu interaktif,
memungkinkan data steward untuk menyetujui, menolak,
atau memodifikasi perubahan yang diusulkan oleh DQS
selama pembersihan dengan bantuan komputer.
• Standarisasi dan meningkatkan kualitas data dengan
menggunakan nilai-nilai domain, aturan domain, dan data
referensi. Sebagai contoh, standarisasi dengan mengubah "St"
ke "street", memperkaya data dengan mengisi elemen dengan
mengubah "1 Microsoft way Redmond 98006" ke "1
Microsoft Way, Redmond, WA 98006".
• Menyediakan interface yang sederhana, intuitif, dan konsisten
kepada pengguna untuk menavigasi data dan memeriksa
kesalahan antara satu set data yang sangat besar.
Menurut Heiko Muller, Johann-Christoph Freytag (Heiko
Muller & Johann-Christoph Freytag, 2005, p19) menjelaskan
tentang metode data cleansing yaitu
• Parsing Data Membersihkan dilakukan untuk mendeteksi kesalahan
sintaks. Parser akan memutuskan apakah string data dapat
diterima dalam spesifikasi data yang diperbolehkan.
23
• Transformasi Data
Memungkinkan pemetaan data dari format yang
diberikan ke dalam format yang diharapkan oleh aplikasi. Ini
termasuk konversi nilai atau fungsi terjemahan, serta nilai-
nilai numerik normalisasi untuk menyesuaikan diri dengan
nila-nilai minimum dan maksimum.
2.4.2 Metode Data Matching
Menurut Microsoft (Microsoft, 2012, p133) Matching
memungkinkan pengguna untuk menghilangkan perbedaan antara
nilai-nilai data yang harus sama, menentukan nilai yang benar dan
mengurangi kesalahan yang dapat menyebabkan perbedaan data.
Sebagai contoh, nama dan alamat sering mengidentifikasi data
untuk sumber data, terutama data nasabah, namun data dapat menjadi
data yang kotor dan memburuk dari waktu ke waktu. Melakukan
pencocokan untuk mengidentifikasi dan memperbaiki kesalahan ini
dengan menggunakan knowledge base yang berfungsi untuk membuat
domain management, knowledge discovery, dan matching policy
untuk digunakan dalam DQS matching.
• Matching memungkinkan pengguna untuk memastikan bahwa
nilai-nilai yang setara, tetapi dimasukkan dalam format yang
berbeda.
• DQS Matching memungkinkan pengguna untuk membuat
kebijakan yang cocok menggunakan proses yang dibantu
komputer, memodifikasi secara interaktif berdasarkan hasil
pencocokan, dan menambahkannya ke knowledge base yang
dapat digunakan kembali.
• Profiling Data Quality Service (DQS) adalah proses menganalisis
data dalam sumber data yang ada, dan menampilkan statistik
tentang data dalam kegiatan DQS. Profiling DQS terintegrasi ke
dalam manajemen pengetahuan DQS. Profiling memiliki dua
tujuan utama: pertama, untuk membimbing pengguna melalui
24
proses kualitas data dan mendukung keputusan pengguna, dan
kedua, untuk menilai efektivitas proses.
Fitur dalam profiling data di dalam DQS:
• Profiling memberikan wawasan kualitas sumber data
pengguna, dan membantu pengguna mengidentifikasi
masalah kualitas data.
• Profiling menilai efektivitas proses kualitas data, membimbing
pengguna dalam penemuan pengetahuan pengguna,
pembersihan data, pencocokan kebijakan, dan mencocokkan
pekerjaan.
• Profiling menyajikan pengguna dengan informasi yang paling
relevan pada saat yang paling relevan.
• Proses profiling menghasilkan pemberitahuan yang
menekankan statistik penting atau peristiwa yang mungkin
memerlukan tindakan. Dalam banyak kasus, pemberitahuan
DQS akan menunjukkan kondisi dan merekomendasikan
tindakan yang dapat pengguna ambil untuk memperbaiki
kondisi itu.