basis data lanjutan
DESCRIPTION
BASIS DATA LANJUTAN. Distributed Database. Basis data terdistribusi adalah kumpulan database yang disimpan di banyak komputer pada lokasi yang berbeda-beda dan menampilkan ke user sebagai single database - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: BASIS DATA LANJUTAN](https://reader036.vdokumen.com/reader036/viewer/2022081603/5681387b550346895da02bf3/html5/thumbnails/1.jpg)
BASIS DATA LANJUTANBASIS DATA LANJUTAN
![Page 2: BASIS DATA LANJUTAN](https://reader036.vdokumen.com/reader036/viewer/2022081603/5681387b550346895da02bf3/html5/thumbnails/2.jpg)
Distributed DatabaseDistributed Database
Basis data terdistribusi adalah kumpulan Basis data terdistribusi adalah kumpulan database yang disimpan di banyak database yang disimpan di banyak komputer pada lokasi yang berbeda-beda komputer pada lokasi yang berbeda-beda dan menampilkan ke user sebagai single dan menampilkan ke user sebagai single databasedatabase
Komputer-komputer tersebut terhubung Komputer-komputer tersebut terhubung dengan jaringan dan user dapat mengkases, dengan jaringan dan user dapat mengkases, mengupdate dan memodifikasi data pada mengupdate dan memodifikasi data pada database melalui jaringandatabase melalui jaringan
![Page 3: BASIS DATA LANJUTAN](https://reader036.vdokumen.com/reader036/viewer/2022081603/5681387b550346895da02bf3/html5/thumbnails/3.jpg)
Why A Distributed Why A Distributed Database?Database?
Distribution and autonomy of business unitsDistribution and autonomy of business unitsdivisi dan departemen dari suatu organisasi divisi dan departemen dari suatu organisasi tersebar secara geografistersebar secara geografis
Data sharingData sharingproses sharing data harus dilakukan secara mudah proses sharing data harus dilakukan secara mudah dan tepatdan tepat
Data communications costs and reliabilityData communications costs and reliabilityproses pertukaran data dalam jumlah yang besar proses pertukaran data dalam jumlah yang besar melalui jaringan membutuhkan biaya yang besar melalui jaringan membutuhkan biaya yang besar dan berpengaruh pada performance jaringandan berpengaruh pada performance jaringan
![Page 4: BASIS DATA LANJUTAN](https://reader036.vdokumen.com/reader036/viewer/2022081603/5681387b550346895da02bf3/html5/thumbnails/4.jpg)
Homogenous Distributed Homogenous Distributed DatabaseDatabase
![Page 5: BASIS DATA LANJUTAN](https://reader036.vdokumen.com/reader036/viewer/2022081603/5681387b550346895da02bf3/html5/thumbnails/5.jpg)
Homogenous Distributed Homogenous Distributed Database (2)Database (2)
Menggambarkan sistem terdistribusi yang Menggambarkan sistem terdistribusi yang mengkoneksikan 3 database hq, mfg, dan mengkoneksikan 3 database hq, mfg, dan salessales
User dapat mengakses atau memodifikasi User dapat mengakses atau memodifikasi data pada beberapa database pada suatu data pada beberapa database pada suatu lingkungan terdistribusilingkungan terdistribusi
Misalnya manufacturing melakukan join Misalnya manufacturing melakukan join antara tabel yang ada di local database mfg antara tabel yang ada di local database mfg dengan tabel yang berada di database hq dengan tabel yang berada di database hq (remote access)(remote access)
![Page 6: BASIS DATA LANJUTAN](https://reader036.vdokumen.com/reader036/viewer/2022081603/5681387b550346895da02bf3/html5/thumbnails/6.jpg)
Heterogeneous Distributed Heterogeneous Distributed DatabaseDatabase
Oracle Database server mengakses Oracle Database server mengakses non-Oracle Database system non-Oracle Database system menggunakan Oracle Heterogeneous menggunakan Oracle Heterogeneous Services:Services:
- Oracle Transparent Gateway - Oracle Transparent Gateway - Generic Connectivity (ODBC,OLEDB)- Generic Connectivity (ODBC,OLEDB)
![Page 7: BASIS DATA LANJUTAN](https://reader036.vdokumen.com/reader036/viewer/2022081603/5681387b550346895da02bf3/html5/thumbnails/7.jpg)
Data WarehouseData Warehouse
Data warehouse adalah relasional Data warehouse adalah relasional database yang didesain untuk proses database yang didesain untuk proses query dan analisaquery dan analisa
Meliputi: extraction, transportation, Meliputi: extraction, transportation, transformation, loading solution, online transformation, loading solution, online analytical processing (OLAP),client analytical processing (OLAP),client analysis tool, dan aplikasi lain yang analysis tool, dan aplikasi lain yang mengatur proses pengumpulan data dan mengatur proses pengumpulan data dan mengirimkan ke business usermengirimkan ke business user
![Page 8: BASIS DATA LANJUTAN](https://reader036.vdokumen.com/reader036/viewer/2022081603/5681387b550346895da02bf3/html5/thumbnails/8.jpg)
Data WarehouseData Warehouse
Data warehouse didesain untuk Data warehouse didesain untuk proses analisa dataproses analisa data
Contoh: data penjualan pada suatu Contoh: data penjualan pada suatu perusahaan. Dengan data warehouse perusahaan. Dengan data warehouse maka dapat menjawab pertanyaan maka dapat menjawab pertanyaan “siapakah customer terbesar pada “siapakah customer terbesar pada akhir pada akhir tahun?”akhir pada akhir tahun?”
![Page 9: BASIS DATA LANJUTAN](https://reader036.vdokumen.com/reader036/viewer/2022081603/5681387b550346895da02bf3/html5/thumbnails/9.jpg)
Data warehouve vs OLTPData warehouve vs OLTP(Online Transaction (Online Transaction
Processing)Processing)
Salah satu perbedaan utama data warehouse dengan Salah satu perbedaan utama data warehouse dengan OLTP adalah data warehouse tidak selalu dalam bentuk OLTP adalah data warehouse tidak selalu dalam bentuk normal ketiga (3NF), sedangkan OLTP biasanya dalam normal ketiga (3NF), sedangkan OLTP biasanya dalam bentuk normal ketiga (3NF)bentuk normal ketiga (3NF)
![Page 10: BASIS DATA LANJUTAN](https://reader036.vdokumen.com/reader036/viewer/2022081603/5681387b550346895da02bf3/html5/thumbnails/10.jpg)
Data warehouve vs OLTPData warehouve vs OLTP
Data modificationData modification
Data warehouse biasanya ternormalisai secara sebagian Data warehouse biasanya ternormalisai secara sebagian bahkan dalam keadaan tidak ternormalisasibahkan dalam keadaan tidak ternormalisasi
OLTP ternormalisasi penuh untuk meningkatkan proses OLTP ternormalisasi penuh untuk meningkatkan proses update/insert/delete dan meningkatkan konsistensi dataupdate/insert/delete dan meningkatkan konsistensi data
WorkloadWorkload
Data warehouse diupdate data secara regular (setiap minggu atau Data warehouse diupdate data secara regular (setiap minggu atau setiap hari) menggunakan teknik modifikasi data sehingga user tidak setiap hari) menggunakan teknik modifikasi data sehingga user tidak secara langsung mengupdate data warehousesecara langsung mengupdate data warehouse
Pada OLTP, user melakukan proses update data secara rutin dan Pada OLTP, user melakukan proses update data secara rutin dan langsunglangsung
Schema DesignSchema Design
Data warehouse didesain untuk menampung query Data warehouse didesain untuk menampung query dalam jumlah yang besardalam jumlah yang besar
OLTP hanya mendukung operasi tertentuOLTP hanya mendukung operasi tertentu
![Page 11: BASIS DATA LANJUTAN](https://reader036.vdokumen.com/reader036/viewer/2022081603/5681387b550346895da02bf3/html5/thumbnails/11.jpg)
Data warehouve vs OLTPData warehouve vs OLTP
Typical operationTypical operation Data warehouse menjalankan query yang memproses banyak baris Data warehouse menjalankan query yang memproses banyak baris
(ratusan atau milyaran), contoh :total penjualan semua customer pada (ratusan atau milyaran), contoh :total penjualan semua customer pada akhir bulan akhir bulan
OLTP hanya mengkases record tertentu, contoh :mencari data order OLTP hanya mengkases record tertentu, contoh :mencari data order untuk customer tertentuuntuk customer tertentu
Historical dataHistorical data Data warehouse menyimpan data selama beberapa bulan Data warehouse menyimpan data selama beberapa bulan
atau tahun. Hal ini mendukung proses historical analysisatau tahun. Hal ini mendukung proses historical analysis OLTP menyimpan data hanya beberapa minggu atau bulanOLTP menyimpan data hanya beberapa minggu atau bulan
![Page 12: BASIS DATA LANJUTAN](https://reader036.vdokumen.com/reader036/viewer/2022081603/5681387b550346895da02bf3/html5/thumbnails/12.jpg)
Arsitektur data warehouseArsitektur data warehouse
End user secara langsung mengakses data dari beberapa End user secara langsung mengakses data dari beberapa sistem melalui data warehousesistem melalui data warehouse
![Page 13: BASIS DATA LANJUTAN](https://reader036.vdokumen.com/reader036/viewer/2022081603/5681387b550346895da02bf3/html5/thumbnails/13.jpg)
Data MiningData Mining
Suatu metode yang digunakan untuk mengekstrak Suatu metode yang digunakan untuk mengekstrak pola dari suatu datapola dari suatu data
Nama lain: Knowledge Discovery in Database (KDD)Nama lain: Knowledge Discovery in Database (KDD) Proses KDD:Proses KDD:
Identifikasi masalahIdentifikasi masalah Menyiapkan dataMenyiapkan data Membangun model data (data mining)Membangun model data (data mining) Menggunakan dan memonitoring modelMenggunakan dan memonitoring model
![Page 14: BASIS DATA LANJUTAN](https://reader036.vdokumen.com/reader036/viewer/2022081603/5681387b550346895da02bf3/html5/thumbnails/14.jpg)
Application Data MiningApplication Data Mining
Data analysis and decision supportData analysis and decision support Managemen dan analisa pasarManagemen dan analisa pasar
Target marketing, customer relationship management Target marketing, customer relationship management (CRM), market basket analysis, cross selling, market (CRM), market basket analysis, cross selling, market segmentationsegmentation
Managemen dan analisa resikoManagemen dan analisa resiko Forecasting, improved underwriting, quality control, Forecasting, improved underwriting, quality control,
competitive analysiscompetitive analysis Other ApplicationsOther Applications
Text mining (news group, email, documents) Text mining (news group, email, documents) and Web miningand Web mining
Stream data miningStream data mining DNA and bio-data analysisDNA and bio-data analysis
![Page 15: BASIS DATA LANJUTAN](https://reader036.vdokumen.com/reader036/viewer/2022081603/5681387b550346895da02bf3/html5/thumbnails/15.jpg)
Data Mining Task’sData Mining Task’s
Association, Association, menemukan hubungan dan korelasi antara menemukan hubungan dan korelasi antara berbagai data itemberbagai data item
Classification, Classification, menganalisa data percobaan dan menganalisa data percobaan dan membangun model berdasarkan fitur dari datamembangun model berdasarkan fitur dari data
Prediction,Prediction, memprediksi nilai-nilai yang mungkin terjadi memprediksi nilai-nilai yang mungkin terjadi dari data yang hilang atau distribusi nilai dari atribut dari data yang hilang atau distribusi nilai dari atribut tertentu dalam kumpulan obyektertentu dalam kumpulan obyek
ClusteringClustering, mengidentifikasi cluster yang tersimpan dalam , mengidentifikasi cluster yang tersimpan dalam data, dimana cluster tersebut merupakan kumpulan data data, dimana cluster tersebut merupakan kumpulan data yang memiliki kesamaan dengan yang lainyang memiliki kesamaan dengan yang lain
Time-series analysisTime-series analysis, mencari urutan kesamaan, pola , mencari urutan kesamaan, pola (pattern), periode dan deviasi(pattern), periode dan deviasi
![Page 16: BASIS DATA LANJUTAN](https://reader036.vdokumen.com/reader036/viewer/2022081603/5681387b550346895da02bf3/html5/thumbnails/16.jpg)
Data Mining Method’sData Mining Method’s
Classification and regressionClassification and regression
classification menghasilkan data categorical classification menghasilkan data categorical dan regression menghasilkan data numericdan regression menghasilkan data numeric
ClusteringClustering
menggunakan algoritma k-mean, k-medianmenggunakan algoritma k-mean, k-median AssociationAssociation
menemukan pola pada data transaksional. menemukan pola pada data transaksional. Berhubungan dengan market basket Berhubungan dengan market basket analysisanalysis
![Page 17: BASIS DATA LANJUTAN](https://reader036.vdokumen.com/reader036/viewer/2022081603/5681387b550346895da02bf3/html5/thumbnails/17.jpg)
What Kind of Output?What Kind of Output?
RulesRules Decision TreesDecision Trees
WebWeb
Product B
Product F
Product C
Product E
Product G
Product D
Product A
![Page 18: BASIS DATA LANJUTAN](https://reader036.vdokumen.com/reader036/viewer/2022081603/5681387b550346895da02bf3/html5/thumbnails/18.jpg)
KeunggulanKeunggulan
penyimpanan database besar, dalam penyimpanan database besar, dalam hitungan megabyte, gigabyte, hitungan megabyte, gigabyte, terabyteterabyte
Relationship yang komplek antar Relationship yang komplek antar field. Gabungan antara data field. Gabungan antara data numerical dan categoricalnumerical dan categorical
Skalabilitas tinggi.Skalabilitas tinggi.