basis data lanjutan

18
BASIS DATA LANJUTAN BASIS DATA LANJUTAN

Upload: wayne-norman

Post on 04-Jan-2016

35 views

Category:

Documents


0 download

DESCRIPTION

BASIS DATA LANJUTAN. Distributed Database. Basis data terdistribusi adalah kumpulan database yang disimpan di banyak komputer pada lokasi yang berbeda-beda dan menampilkan ke user sebagai single database - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: BASIS DATA LANJUTAN

BASIS DATA LANJUTANBASIS DATA LANJUTAN

Page 2: BASIS DATA LANJUTAN

Distributed DatabaseDistributed Database

Basis data terdistribusi adalah kumpulan Basis data terdistribusi adalah kumpulan database yang disimpan di banyak database yang disimpan di banyak komputer pada lokasi yang berbeda-beda komputer pada lokasi yang berbeda-beda dan menampilkan ke user sebagai single dan menampilkan ke user sebagai single databasedatabase

Komputer-komputer tersebut terhubung Komputer-komputer tersebut terhubung dengan jaringan dan user dapat mengkases, dengan jaringan dan user dapat mengkases, mengupdate dan memodifikasi data pada mengupdate dan memodifikasi data pada database melalui jaringandatabase melalui jaringan

Page 3: BASIS DATA LANJUTAN

Why A Distributed Why A Distributed Database?Database?

Distribution and autonomy of business unitsDistribution and autonomy of business unitsdivisi dan departemen dari suatu organisasi divisi dan departemen dari suatu organisasi tersebar secara geografistersebar secara geografis

Data sharingData sharingproses sharing data harus dilakukan secara mudah proses sharing data harus dilakukan secara mudah dan tepatdan tepat

Data communications costs and reliabilityData communications costs and reliabilityproses pertukaran data dalam jumlah yang besar proses pertukaran data dalam jumlah yang besar melalui jaringan membutuhkan biaya yang besar melalui jaringan membutuhkan biaya yang besar dan berpengaruh pada performance jaringandan berpengaruh pada performance jaringan

Page 4: BASIS DATA LANJUTAN

Homogenous Distributed Homogenous Distributed DatabaseDatabase

Page 5: BASIS DATA LANJUTAN

Homogenous Distributed Homogenous Distributed Database (2)Database (2)

Menggambarkan sistem terdistribusi yang Menggambarkan sistem terdistribusi yang mengkoneksikan 3 database hq, mfg, dan mengkoneksikan 3 database hq, mfg, dan salessales

User dapat mengakses atau memodifikasi User dapat mengakses atau memodifikasi data pada beberapa database pada suatu data pada beberapa database pada suatu lingkungan terdistribusilingkungan terdistribusi

Misalnya manufacturing melakukan join Misalnya manufacturing melakukan join antara tabel yang ada di local database mfg antara tabel yang ada di local database mfg dengan tabel yang berada di database hq dengan tabel yang berada di database hq (remote access)(remote access)

Page 6: BASIS DATA LANJUTAN

Heterogeneous Distributed Heterogeneous Distributed DatabaseDatabase

Oracle Database server mengakses Oracle Database server mengakses non-Oracle Database system non-Oracle Database system menggunakan Oracle Heterogeneous menggunakan Oracle Heterogeneous Services:Services:

- Oracle Transparent Gateway - Oracle Transparent Gateway - Generic Connectivity (ODBC,OLEDB)- Generic Connectivity (ODBC,OLEDB)

Page 7: BASIS DATA LANJUTAN

Data WarehouseData Warehouse

Data warehouse adalah relasional Data warehouse adalah relasional database yang didesain untuk proses database yang didesain untuk proses query dan analisaquery dan analisa

Meliputi: extraction, transportation, Meliputi: extraction, transportation, transformation, loading solution, online transformation, loading solution, online analytical processing (OLAP),client analytical processing (OLAP),client analysis tool, dan aplikasi lain yang analysis tool, dan aplikasi lain yang mengatur proses pengumpulan data dan mengatur proses pengumpulan data dan mengirimkan ke business usermengirimkan ke business user

Page 8: BASIS DATA LANJUTAN

Data WarehouseData Warehouse

Data warehouse didesain untuk Data warehouse didesain untuk proses analisa dataproses analisa data

Contoh: data penjualan pada suatu Contoh: data penjualan pada suatu perusahaan. Dengan data warehouse perusahaan. Dengan data warehouse maka dapat menjawab pertanyaan maka dapat menjawab pertanyaan “siapakah customer terbesar pada “siapakah customer terbesar pada akhir pada akhir tahun?”akhir pada akhir tahun?”

Page 9: BASIS DATA LANJUTAN

Data warehouve vs OLTPData warehouve vs OLTP(Online Transaction (Online Transaction

Processing)Processing)

Salah satu perbedaan utama data warehouse dengan Salah satu perbedaan utama data warehouse dengan OLTP adalah data warehouse tidak selalu dalam bentuk OLTP adalah data warehouse tidak selalu dalam bentuk normal ketiga (3NF), sedangkan OLTP biasanya dalam normal ketiga (3NF), sedangkan OLTP biasanya dalam bentuk normal ketiga (3NF)bentuk normal ketiga (3NF)

Page 10: BASIS DATA LANJUTAN

Data warehouve vs OLTPData warehouve vs OLTP

Data modificationData modification

Data warehouse biasanya ternormalisai secara sebagian Data warehouse biasanya ternormalisai secara sebagian bahkan dalam keadaan tidak ternormalisasibahkan dalam keadaan tidak ternormalisasi

OLTP ternormalisasi penuh untuk meningkatkan proses OLTP ternormalisasi penuh untuk meningkatkan proses update/insert/delete dan meningkatkan konsistensi dataupdate/insert/delete dan meningkatkan konsistensi data

WorkloadWorkload

Data warehouse diupdate data secara regular (setiap minggu atau Data warehouse diupdate data secara regular (setiap minggu atau setiap hari) menggunakan teknik modifikasi data sehingga user tidak setiap hari) menggunakan teknik modifikasi data sehingga user tidak secara langsung mengupdate data warehousesecara langsung mengupdate data warehouse

Pada OLTP, user melakukan proses update data secara rutin dan Pada OLTP, user melakukan proses update data secara rutin dan langsunglangsung

Schema DesignSchema Design

Data warehouse didesain untuk menampung query Data warehouse didesain untuk menampung query dalam jumlah yang besardalam jumlah yang besar

OLTP hanya mendukung operasi tertentuOLTP hanya mendukung operasi tertentu

Page 11: BASIS DATA LANJUTAN

Data warehouve vs OLTPData warehouve vs OLTP

Typical operationTypical operation Data warehouse menjalankan query yang memproses banyak baris Data warehouse menjalankan query yang memproses banyak baris

(ratusan atau milyaran), contoh :total penjualan semua customer pada (ratusan atau milyaran), contoh :total penjualan semua customer pada akhir bulan akhir bulan

OLTP hanya mengkases record tertentu, contoh :mencari data order OLTP hanya mengkases record tertentu, contoh :mencari data order untuk customer tertentuuntuk customer tertentu

Historical dataHistorical data Data warehouse menyimpan data selama beberapa bulan Data warehouse menyimpan data selama beberapa bulan

atau tahun. Hal ini mendukung proses historical analysisatau tahun. Hal ini mendukung proses historical analysis OLTP menyimpan data hanya beberapa minggu atau bulanOLTP menyimpan data hanya beberapa minggu atau bulan

Page 12: BASIS DATA LANJUTAN

Arsitektur data warehouseArsitektur data warehouse

End user secara langsung mengakses data dari beberapa End user secara langsung mengakses data dari beberapa sistem melalui data warehousesistem melalui data warehouse

Page 13: BASIS DATA LANJUTAN

Data MiningData Mining

Suatu metode yang digunakan untuk mengekstrak Suatu metode yang digunakan untuk mengekstrak pola dari suatu datapola dari suatu data

Nama lain: Knowledge Discovery in Database (KDD)Nama lain: Knowledge Discovery in Database (KDD) Proses KDD:Proses KDD:

Identifikasi masalahIdentifikasi masalah Menyiapkan dataMenyiapkan data Membangun model data (data mining)Membangun model data (data mining) Menggunakan dan memonitoring modelMenggunakan dan memonitoring model

Page 14: BASIS DATA LANJUTAN

Application Data MiningApplication Data Mining

Data analysis and decision supportData analysis and decision support Managemen dan analisa pasarManagemen dan analisa pasar

Target marketing, customer relationship management Target marketing, customer relationship management (CRM), market basket analysis, cross selling, market (CRM), market basket analysis, cross selling, market segmentationsegmentation

Managemen dan analisa resikoManagemen dan analisa resiko Forecasting, improved underwriting, quality control, Forecasting, improved underwriting, quality control,

competitive analysiscompetitive analysis Other ApplicationsOther Applications

Text mining (news group, email, documents) Text mining (news group, email, documents) and Web miningand Web mining

Stream data miningStream data mining DNA and bio-data analysisDNA and bio-data analysis

Page 15: BASIS DATA LANJUTAN

Data Mining Task’sData Mining Task’s

Association, Association, menemukan hubungan dan korelasi antara menemukan hubungan dan korelasi antara berbagai data itemberbagai data item

Classification, Classification, menganalisa data percobaan dan menganalisa data percobaan dan membangun model berdasarkan fitur dari datamembangun model berdasarkan fitur dari data

Prediction,Prediction, memprediksi nilai-nilai yang mungkin terjadi memprediksi nilai-nilai yang mungkin terjadi dari data yang hilang atau distribusi nilai dari atribut dari data yang hilang atau distribusi nilai dari atribut tertentu dalam kumpulan obyektertentu dalam kumpulan obyek

ClusteringClustering, mengidentifikasi cluster yang tersimpan dalam , mengidentifikasi cluster yang tersimpan dalam data, dimana cluster tersebut merupakan kumpulan data data, dimana cluster tersebut merupakan kumpulan data yang memiliki kesamaan dengan yang lainyang memiliki kesamaan dengan yang lain

Time-series analysisTime-series analysis, mencari urutan kesamaan, pola , mencari urutan kesamaan, pola (pattern), periode dan deviasi(pattern), periode dan deviasi

Page 16: BASIS DATA LANJUTAN

Data Mining Method’sData Mining Method’s

Classification and regressionClassification and regression

classification menghasilkan data categorical classification menghasilkan data categorical dan regression menghasilkan data numericdan regression menghasilkan data numeric

ClusteringClustering

menggunakan algoritma k-mean, k-medianmenggunakan algoritma k-mean, k-median AssociationAssociation

menemukan pola pada data transaksional. menemukan pola pada data transaksional. Berhubungan dengan market basket Berhubungan dengan market basket analysisanalysis

Page 17: BASIS DATA LANJUTAN

What Kind of Output?What Kind of Output?

RulesRules Decision TreesDecision Trees

WebWeb

Product B

Product F

Product C

Product E

Product G

Product D

Product A

Page 18: BASIS DATA LANJUTAN

KeunggulanKeunggulan

penyimpanan database besar, dalam penyimpanan database besar, dalam hitungan megabyte, gigabyte, hitungan megabyte, gigabyte, terabyteterabyte

Relationship yang komplek antar Relationship yang komplek antar field. Gabungan antara data field. Gabungan antara data numerical dan categoricalnumerical dan categorical

Skalabilitas tinggi.Skalabilitas tinggi.