bab ii landasan teori 2.1. dataeprints.umm.ac.id/36072/3/jiptummpp-gdl-miftahuddi... · model...

12
7 BAB II LANDASAN TEORI 2.1. Data Data adalah sebuah rekaman dari fakta-fakta, konsep-konsep, atau instruksi- instruksi pada media penyimpanan untuk komunikasi perolehan, dan pemrosesan dengan cara otomatis dan presentasi sebagai informasi yang dapat dimengerti oleh manusia (Inmon, 2005). Pendapat lain mengatakan, bahwa data merupakan sebuah rekaman dari fakta, konsep, atau instruksi yang harus diproses untuk menjadi sebuah informasi yang dapat dimerti oleh manusia. Tempat penyimpanan data bisa di media penyimpanan berupa media komputer yang bisa menyimpan data berupa video, gambar, suara, dan teks. Maka dari itu pengertian data pada era ini dapat diperluas menjadi data berupa fakta, konsep, instruksi, grafik, suara, serta video (Hariyanto, 2004). Dari kedua pendapat di atas yang dimaksud data pada penelitian ini adalah rekaman berupa fakta, konsep, instruksi, grafik, suara, dan video. 2.2. Informasi Informasi adalah data yang dikelola untuk digunakan sebagai proses pengambil keputusan (Bodnar, 2000). Informasi juga memiliki tujuan tertentu. Tujuan tersebut adalah untuk menghasilkan sebuah keputusan yang berdasar (Meliono, 1990). Secara umum informasi dapat diartikan sebagai sebuah data yang dikelola dan diproses sehingga memiliki tujuan tertentu untuk menghasilkan sebuah keputusan yang berdasarkan fakta yang ada di dunia nyata yang berjalan berdasarkan siklus informasi yang dimulai dari dasar data yang kemudia di proses sehingga menghasilkan output informasi yang bisa digunakan sebagai keputusan tindakan.

Upload: others

Post on 02-Jun-2020

8 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: BAB II LANDASAN TEORI 2.1. Dataeprints.umm.ac.id/36072/3/jiptummpp-gdl-miftahuddi... · Model dimensional merupakan rancangan logikal suatu sistem yang bertujuan untuk mendapatkan

7

BAB II

LANDASAN TEORI

2.1. Data

Data adalah sebuah rekaman dari fakta-fakta, konsep-konsep, atau instruksi-

instruksi pada media penyimpanan untuk komunikasi perolehan, dan pemrosesan

dengan cara otomatis dan presentasi sebagai informasi yang dapat dimengerti oleh

manusia (Inmon, 2005).

Pendapat lain mengatakan, bahwa data merupakan sebuah rekaman dari

fakta, konsep, atau instruksi yang harus diproses untuk menjadi sebuah informasi

yang dapat dimerti oleh manusia. Tempat penyimpanan data bisa di media

penyimpanan berupa media komputer yang bisa menyimpan data berupa video,

gambar, suara, dan teks. Maka dari itu pengertian data pada era ini dapat diperluas

menjadi data berupa fakta, konsep, instruksi, grafik, suara, serta video (Hariyanto,

2004).

Dari kedua pendapat di atas yang dimaksud data pada penelitian ini adalah

rekaman berupa fakta, konsep, instruksi, grafik, suara, dan video.

2.2. Informasi

Informasi adalah data yang dikelola untuk digunakan sebagai proses

pengambil keputusan (Bodnar, 2000). Informasi juga memiliki tujuan tertentu.

Tujuan tersebut adalah untuk menghasilkan sebuah keputusan yang berdasar

(Meliono, 1990).

Secara umum informasi dapat diartikan sebagai sebuah data yang dikelola

dan diproses sehingga memiliki tujuan tertentu untuk menghasilkan sebuah

keputusan yang berdasarkan fakta yang ada di dunia nyata yang berjalan

berdasarkan siklus informasi yang dimulai dari dasar data yang kemudia di proses

sehingga menghasilkan output informasi yang bisa digunakan sebagai keputusan

tindakan.

Page 2: BAB II LANDASAN TEORI 2.1. Dataeprints.umm.ac.id/36072/3/jiptummpp-gdl-miftahuddi... · Model dimensional merupakan rancangan logikal suatu sistem yang bertujuan untuk mendapatkan

8

.

Gambar 2.1 Siklus Informasi (Sutabri, 2005)

2.3. Sistem Informasi

Sistem informasi adalah suatu sistem dalam suatu organisasi yang

mempertemukan kebutuhan pengolahan transaksi harian, mendukung operasi,

bersifat manajerial, kegiatan strategi, dan menyediakan pihak luar tertentu

(outsourcing) dengan laporan-laporan yang diperlukan (Jogiyanto, 2005).

Sekumpulan strategi, kegiatan prosedural, dan kegiatan manajerial yang dilakukan

oleh organisasi ini dilaksanakan untuk mencapai suatu tujuan yaitu pengambil

keputusan dan mengendalikan kegiatan organisasi.

2.4. Database

Database ialah koleksi atau kumpulan data yang mekanis, terbagi(shared),

terdefinisi secara formal dan juga dikontrol terpusat pada suatu organisasi (Everest,

1974). Di lain pendapat database memiliki definisi yaitu koleksi “data operasional”

yang tersimpan dan juga dipakai oleh sistem aplikasi dari suatu organisasi (Date,

2003). Dari kedua pendapat itu dapat ditarik kesimpulan bahwa database

merupakan sebuah sistem aplikasi yang menyimpan semua koleksi data operasional

maupun mekanis yang digunakan pada suatu organisasi dan dikontrol terpusat.

Page 3: BAB II LANDASAN TEORI 2.1. Dataeprints.umm.ac.id/36072/3/jiptummpp-gdl-miftahuddi... · Model dimensional merupakan rancangan logikal suatu sistem yang bertujuan untuk mendapatkan

9

2.5. Data Warehouse

2.5.1. Pengertian Data Warehouse

Data Warehouse adalah koleksi data hasil kelola dari database OLTP

(Online Transaction Processing) menjadi OLAP (Online Analytical Processing)

dan menghasilkan sebuah data mart. Data warehouse juga mempunyai sifat

berorientasi subjek, terintegrasi, time-variant, dan bersifat tetap (nonvolatile) dari

koleksi data dalam mendukung proses pengambilan keputusan manajemen (Inmon,

2005). Sedangkan menurut pendapat lain data warehouse merupakan basis data

yang bersifat analisis dan read-only yang digunakan sebagai fondasi dari sistem

penunjang keputusan (Poe, 1996). Menurut Paul Lane, data warehouse merupakan

database relasional yang dirancang lebih untuk query dan analisis proses transaksi,

biasanya mengandung sejarah data transaksi dan mungkin juga data dari sumber

lain. Data warehouse memisahkan beban kerja analisis dari beban kerja transaksi

dan memungkinkan organisasi untuk menggabungkan / konsolidasi data dari

berbagai sumber. Dari ketiga pendapat tersebut dapat disimpulkan bahwa data

warehouse adalah sebuah koleksi data bersifat analisis dan read-only yang

disimpan dalam kurun waktu tertentu lalu diproses secara analitik untuk

pengambilan keputusan manajemen. Dari kesimpulan itu muncul sebuah ide bahwa

sebuah tabel yang berisikan transaksi atau biasa disebut dengan tabel fakta selalu

memiliki dimensi-dimensi yang memperjelas data-data yang ada di tabel fakta.

Salah satu dimensi yang selalu ada adalah dimensi waktu karena sifat data

warehouse yang time-variant.

2.5.2. Karakteristik Data Warehouse

Menurut Inmon, data warehouse memiliki beberapa karakteristik yang

selalu ada, yang pertama adalah subject oriented, integrated, nonvolatile, dan time-

variant

2.5.2.1. Subject Oriented

Data warehouse memiliki ciri subject-oriented yang berarti dalam desain

sistem untuk menganalisis didasari oleh subjek-subjek tertentu yang berkaitan

dengan organisasi. Misalnya untuk organisasi asuransi subjek yang terkait dan

dalam skala mayor adalah pelanggan, kebijakan, dan klaim. Untuk penjualan,

Page 4: BAB II LANDASAN TEORI 2.1. Dataeprints.umm.ac.id/36072/3/jiptummpp-gdl-miftahuddi... · Model dimensional merupakan rancangan logikal suatu sistem yang bertujuan untuk mendapatkan

10

subjek yang berskala mayor contohnya adalah transaksi penjualan, produk, toko

atau cabang. Dapat ditarik kesimpulan bahwa setiap organisasi maupun perusahaan

memiliki subjek tertentu yang berhubungan dengan operasional sistem. Dalam studi

kasus saya, perpustakaan memiliki subjek berupa peminjam buku, transaksi

peminjaman, transaksi pengembalian, dan buku yang dipinjamkan.

2.5.2.2. Integration

Dalam sistem data warehouse sangat memungkinkan untuk mendapatkan

sumber database operasional dari luar (external source). Dari kejadian ini

menimbulkan kemungkinan adanya perbedaan satuan antara database operasional

(internal source) dengan database-database dari luar. Maka dari itu dilakukanlah

sebuah integrasi pada satuan bilangan tertentu. Misalnya jika di internal memiliki

satuan ukur panjang dengan satuan cm, sedangkan di external source menggunakan

mm, maka bisa di pilih salah satu satuan yang menjadi patokan sehingga semua

satuan terintegrasi menjadi satu dan sama.

Berikut adalah gambaran kasus lain.

Gambar 2.2 Contoh kasus integrasi dari berbagai satuan pada database operasional lalu diintegrasi pada

data warehouse (Inmon, 2005)

2.5.2.3. Nonvolatile

Database operasional sering kali mengalami manipulasi data seperti insert,

delete, dan update data. Setiap kali ada data baru, maka akan dilakukan

Page 5: BAB II LANDASAN TEORI 2.1. Dataeprints.umm.ac.id/36072/3/jiptummpp-gdl-miftahuddi... · Model dimensional merupakan rancangan logikal suatu sistem yang bertujuan untuk mendapatkan

11

penambahan data pada waktu itu juga. Demikian dengan menghapus dan mengedit

data. Data operasional yang ada di database berubah secara real-time. Data

dimanipulasi dan saat itu juga data berubah. Berbeda dengan data warehouse, data

warehouse hanya melakukan load (mengambil) data dari database operasional

sehingga dapat diakses oleh pengguna. Jadi setiap perubahan yang ada di database

operasional tidak langsung dirubah di data warehouse melainkan akan berubah

ketika data warehouse melakukan load dari database operasional dan diakses oleh

pengguna sistem data warehouse. Data warehouse tidak berubah (nonvolatile)

namun biasanya setiap adanya perubahan yang ada di database operasional akan

membuat data warehouse menyerap data yang baru kemudian secara incremental

disatukan dengan data sebelumnya. Ini disebabkan data warehouse hanya memiliki

dua fungsi manipulasi data, yaitu load data dan access data.

Gambar 2.3 Ilustrasi kerja database operasional dan data warehouse ketika terjadi manipulasi data (insert,

update, delete). (Inmon, 2005)

2.5.2.4. Time-variant

Database operasional selalu berhubungan dengan kegiatan manipulasi data

yang terjadi pada saat itu juga (real-time). Sedangkan data warehouse selalu

menyerap apa pun yang telah di-load oleh data warehouse dari awal terbentuknya

data warehouse hingga yang paling terbaru. Semua data akan dijadikan bahan

analisis dan pengambil keputusan yang valid pada rentan waktu tertentu, misalnya

harian, mingguan, bulanan, tahunan, dan nilai waktu lainnya. Database operasional

bisa bekeja dan tetap valid meskipun ada atau tidak adanya elemen waktu pada

datanya. Sedangkan pada data warehouse elemen waktu harus jelas untuk menjaga

Page 6: BAB II LANDASAN TEORI 2.1. Dataeprints.umm.ac.id/36072/3/jiptummpp-gdl-miftahuddi... · Model dimensional merupakan rancangan logikal suatu sistem yang bertujuan untuk mendapatkan

12

kevalidan data pada rentang waktu tertentu karena record data pada data warehouse

rentang waktunya lebih besar daripada database operasional demi kepentingan

analisis data secara periodik.

Karena rentang waktu kevalidan database operasional dan data warehouse

berbeda menyebabkan time horizon dari database operasional berlaku dari data

yang terkini hingga 60-90 hari kemudian. Sedangkan untuk data warehouse

memiliki time horizon 5-10 tahun (Inmon, 2005).

Gambar 2.4 Perbandingan time variancy dari database operasional dengan data warehouse (Inmon, 2005)

2.5.3. Struktur Data Warehouse

Struktur data warehouse terdiri dari older level of detail, current level of

detail, lightly summarized data, dan highly summarized data. Current level of detail

adalah sebuah level data dimana data mengalir ke data warehouse dari database

operasional. Setelah data warehouse me-load data yang baru lagi dari database

operasional, maka data yang tadinya current level of detail berubah menjadi older

level of detail. Older level of detail adalah data historik dari current level of detail

yang masih disimpan sebagai back-up dan historik data secara keseluruhan. Setelah

data tersimpan di data warehouse, maka dilakukan rangkuman data sehingga

terbentuklah lightly summarized data. Lightly summarized data sendiri adalah hasil

rangkuman data yang masih bisa dibilang terkini. Jika sudah melampaui waktu

tertentu maka lightly summarized data akan berubah menjadi highly summarized

data.

Page 7: BAB II LANDASAN TEORI 2.1. Dataeprints.umm.ac.id/36072/3/jiptummpp-gdl-miftahuddi... · Model dimensional merupakan rancangan logikal suatu sistem yang bertujuan untuk mendapatkan

13

Gambar 2.5 Struktur data warehouse (Inmon, 2005)

2.5.4 Data Mart yang Bisa Dihasilkan oleh Proses Data Warehouse

Data mart yang bisa didapatkan dalam proses data warehouse pada

penelitian ini adalah:

1. Perbandingan persentase pengembalian buku tiap tahun.

2. Penunjang data pengadaan buku dari frekuensi tipe-tipe buku yang sering

dipinjam.

2.6. Perbedaan OLAP dan OLTP

OLTP atau biasa disebut dengan Online Transaction Processing adalah

sebuah sistem yang memiliki orientasi fungsi berupa proses pada segala transaksi

yang terjadi. OLTP terjadi pada sebuah jaringan komputer yang memiliki sebuah

sistem penyimpanan data untuk mencatat semua kegiatan dan proses transaksi yang

terjadi pada instansi atau organisasi yang terkait. Seperti misalnya penjaga

perpustakaan yang memasukkan setiap kegiatan peminjaman yang terjadi ketika

buku perpustakaan dipinjam oleh anggota perpustakaan. Kegiatan OLTP lebih

bersifat pendek dan cepat yang dapat dimanipulasi datanya pada saat itu juga.

Karena disetiap ada proses transaksi, data akan di-update untuk memperoleh

kevalidan data. Sedangkan OLAP atau biasa disebut dengan Online Analytical

Processing adalah sebuah kegiatan yang bersifat managerial dimana terdapat query-

query kompleks yang berfungsi untuk menarik hasil analisis. Hasil analisis inilah

Page 8: BAB II LANDASAN TEORI 2.1. Dataeprints.umm.ac.id/36072/3/jiptummpp-gdl-miftahuddi... · Model dimensional merupakan rancangan logikal suatu sistem yang bertujuan untuk mendapatkan

14

yang akan dijadikan sebagai pengambil keputusan yang dilakukan oleh manager

instansi atau orang yang mengatur dan mengontrol instansi tersebut.

2.7. Model Dimensional

Model dimensional merupakan rancangan logikal suatu sistem yang

bertujuan untuk mendapatkan akses data dalam bentuk standar, intuitif, dengan

performa tinggi. Model dimensional terbentuk dari beberapa entitiy relation (ER)

yang ditandai dengan adanya primary key dan foreign key. Terdapat dua model

dimensional yang sering digunakan dalam praktek data warehouse, yaitu star

schema dan snowflake karena mudah dimengerti dan query yang digunakan

memiliki performa superior dengan meminimalisasi tabel-tabel join.

2.7.1. Star Schema

Star Schema adalah skema yang tabel dimensinya terpusat pada sebuah

tabel fakta. Setiap tabel dimensi terbentuk dari hasil collapse (penggabungan) tanpa

adanya normalisasi sehingga bisa saja terbentuk sebuah tabel dimensi yang

redundan. Pada model ini tabel dimensi hanya terhubung dengan tabel fakta.

Tabel Fakta

Tabel fakta merupakan tabel yang memiliki atribut transaksi ataupun atribut

hasil agregasi yang memiliki nilai yang dapat dikomputasi. Selain memiliki atribut

transaksi juga memiliki foreign key dari setiap tabel dimensi yang terhubung pada

tabel fakta.

Tabel Dimensi

Tabel dimensi merupakan tabel yang memperjelas subjek yang ada pada

tabel fakta. Primary key pada tabel dimensi selalu ada dalam tabel fakta yang

berhubungan langsung.

2.7.2. Snowflake Schema

Snowflake Schema adalah sebuah skema data warehouse yang memiliki

tabel fakta dan dimensi sama seperti star schema namun pada Snowflake Schema

tidak ada redundansi karena pada proses collapse (penggabungan) tabel dimensi

dilakukan normalisasi sehingga tidak ada atribut yang redundan. Ini menyebabkan

beberapa tabel dimensi tidak berhubungan langsung dengan tabel fakta namun tetap

berhubungan dengan tabel dimensi yang masih memiliki entity relation.

Page 9: BAB II LANDASAN TEORI 2.1. Dataeprints.umm.ac.id/36072/3/jiptummpp-gdl-miftahuddi... · Model dimensional merupakan rancangan logikal suatu sistem yang bertujuan untuk mendapatkan

15

2.8. ETL

Kepanjangan dari ETL adalah extract, transform, dan load. Proses ETL

berfungsi sebagai mengubah jenis data agar terintegrasi yang awalnya di-extract

dari database operasional lalu pada aplikasi ETL (seperti talend) akan mengalami

perubahan jenis data lalu di-load ke bentuk data warehouse OLAP sehingga user

bisa memulai analisis data dari OLAP itu untuk kebutuhan pengambilan keputusan.

2.9. Nine Step Design Method

Menurut Kimball et al (2002), data warehouse dirancang dengan sembilan

cara yaitu:

2.9.1. Memilih Proses Bisnis yang Bersangkutan dengan Kebutuhan

Data warehouse memiliki karakteristik subject-oriented yang berarti kita

harus menentukan subyek permasalahan yang akan dianalisis lalu kita bisa

mengidentifikasi proses bisnis yang sesuai dengan permasalahan sehingga

terbentuk batasan-batasan dalam pembuatan data warehouse.

2.9.2. Menentukan Grain Bersumberkan Proses Bisnis

Maksud dari grain sendiri adalah cikal bakal tabel fakta yang ada pada tabel

OLAP. Grain ditentukan pada database operasional dengan mempertimbangkan

tabel tersebut memiliki fungsi transaksi yang terbentuk karena telah ada atribut

transaksi maupun ditabel tersebut bisa dilakukan agregasi atribut.

2.9.3. Mengidentifikasi dan Menyesuaikan Tabel Dimensi dengan yang Lain

Setelah kita menentukan cikal bakal tabel fakta, selanjutnya kita

menentukan cikal bakal tabel dimensi yang akan dimasukkan pada OLAP. Setelah

terbentuk cikal bakal tabel dimensi, tentu primary key yang ada pada tabel dimensi

akan menjadi sebuah identifikasi suatu tabel dimensi

2.9.4. Memilih Data-Data Fakta

Setelah memilih cikal bakal fakta, akan ditambahkan fakta-fakta yang akan

mengisi setiap tabel fakta yang sesuai dengan grain yang telah ditentukan.

2.9.5. Menyimpan Kalkulasi Awal dalam Tabel Fakta

Seperti yang telah dijelaskan sebelumnya, bahwa setiap tabel fakta selalu

ada transaksi yang dapat dihitung, pada tahap inilah perhitungan dilakukan.

Page 10: BAB II LANDASAN TEORI 2.1. Dataeprints.umm.ac.id/36072/3/jiptummpp-gdl-miftahuddi... · Model dimensional merupakan rancangan logikal suatu sistem yang bertujuan untuk mendapatkan

16

2.9.6. Melihat Kembali Tabel Dimensi

Pada tahap ini dilakukan pelengkapan keterangan pada tabel dimensi

selengkap-lengkapnya sehingga dapat dipahami dengan mudah oleh penggunanya.

2.9.7. Memilih Durasi Database

Pada tahap ini yang dilakukan adalah memberi batasan waktu analisis dan

range analisis yang akan dilakukan.

2.9.8. Menelusuri Perubahan-Perubahan yang Terjadi pada Dimensi

Pada tahap ini dilakukan pengecekan pada tabel dimensi. Hal-hal yang biasa

berubah pada tabel dimensi adalah:

1. Atribut dimensi yang berubah tertulis ulang

2. Atribut dimensi yang berubah menimbulkan dimensi baru

3. Atribut dimensi yang berubah menimbulkan alternatif sehingga atribut

sebelumnya dan yang baru dapat diakses bersamaan pada dimensi yang sama.

2.9.9. Memutuskan Prioritas Query, Tipe Query, dan Memilih Physical Design

Pada tahap ini difokuskan untuk memilih Physical Design, query, dan query

type yang sesuai dengan kasus yang terjadi.

2.10. Tools Pembuatan Data Warehouse

Untuk pembuatan data warehouse sendiri dibutuhkan alat / aplikasi yang

digunakan untuk membantu dalam pembuatannya. Dalam kasus saya, saya

menggunakan penyimpanan database berupa MySQL, untuk proses ETL

menggunakan aplikasi talend, dan untuk keluaran data mart-nya saya menggunakan

pivot table yang biasanya bisa menggunakan program Ms. Excel.

2.11. Perpustakaan Daerah Kabupaten Lumajang

Perpustakaan adalah tempat untuk menyimpan dan membagikan informasi

pada halayak umum. Beberapa peranan perpustakaan pada kehidupan manusia

adalah sebagai sarana simpan karya manusia, sebagai fungsi informasi, sebagai

fungsi rekreasi, fungsi pendidikan, dan fungsi kultural.

Perpustakaan Daerah Kabupaten Lumajang memiliki dua macam proses

bisnis yang berkaitan dengan data warehouse dalam penelitian ini yaitu proses

Page 11: BAB II LANDASAN TEORI 2.1. Dataeprints.umm.ac.id/36072/3/jiptummpp-gdl-miftahuddi... · Model dimensional merupakan rancangan logikal suatu sistem yang bertujuan untuk mendapatkan

17

bisnis peminjaman dan pengembalian. Pada Perpustakaan Daerah Kabupaten

Lumajang tidak terdapat sistem denda dikarenakan tidak ada peraturan daerah

(perda) yang mengharuskan adanya denda.

Gambar 2.6 Proses bisnis peminjaman buku perpustakaan

Gambar 2.7 Proses bisnis pengembalian buku perpustakaan

Page 12: BAB II LANDASAN TEORI 2.1. Dataeprints.umm.ac.id/36072/3/jiptummpp-gdl-miftahuddi... · Model dimensional merupakan rancangan logikal suatu sistem yang bertujuan untuk mendapatkan

18