presentation slide data cube
TRANSCRIPT
-
7/24/2019 Presentation Slide Data Cube
1/29
-
7/24/2019 Presentation Slide Data Cube
2/29
Data Cube
Data warehouse dan OLAP didasarkan padamultidimensional data model.
Model ini merepresentasikan data dalam bentukdata cube, yaitu data dimodelkan dan ditampilkan
sebagai multiple dimension. Data cube ini didasarkan pada dimensions table
dan facts table.
-
7/24/2019 Presentation Slide Data Cube
3/29
D data cube, according to the dimension time,location, item
-
7/24/2019 Presentation Slide Data Cube
4/29
Cube Materialization
!ull Cube
"ceberg Cube
Closed Cube
#hell Cube
-
7/24/2019 Presentation Slide Data Cube
5/29
General Strategies forCube Computation
$ #orting, hashing, and grouping
%& #imultaneous aggregation and cachingintermediate results
& Aggregation from the smallest child, when
there e'istmultiple child cuboids.
(& )he Apriori pruning method can be e'plored tocompute
iceberg cubes e*ciently
-
7/24/2019 Presentation Slide Data Cube
6/29
$. Multiway ArrayAggregation
-
7/24/2019 Presentation Slide Data Cube
7/29
%. +C
BUC: Computing Iceberg Cubes from the ApexCuboi !ownwar
-
7/24/2019 Presentation Slide Data Cube
8/29
4.2 Pengembangan lebih lanjut dari data Cube dan OLAP teknologi
1 Discovery-driven exploration Cubes data
Disco-erydri-en e'ploration adalah pendekataneksplorasi kubus tersebut. Dalam disco-ery dri-en
eksplorasi, tindakan precomputed menun/ukkanpengecualian data yang digunakan untukmemandu pengguna dalam proses analisis data, disemua tingkat agregasi.
)indakan ini sebagai indikator terkecuali. #ecara
intuitif, pengecualian adalah nilai sel kubus datayang berbeda secara signi0kan dari dana nilaiyang diantisipasi, berdasarkan modelstatistik.Model mempetimbangkan -ariasi dan polanilai ukuran di semua dimensi yang dimiliki sel.
-
7/24/2019 Presentation Slide Data Cube
9/29
-
7/24/2019 Presentation Slide Data Cube
10/29
" Agregasi #omple$s i Beberapagranular
3ubus Data memfasilitasi pen/awab pertanyaandata mining karena mereka memungkinkanperhitungan data agregat pada berbagai tingkatgranularity.
Pada bagian ini, akan membahas tentangmultifeature kubus, yang menghitung pertanyaankompleks yang melibatkan beberapa agregattergantung pada berbagai granularities . 3ubus inisangat berguna dalam praktek. banyak kompleks
4uery data mining dapat di/awab oleh multifeaturekubus tanpa signi0kan peningkatan biayakomputasi, dibandingkan dengan perhitungankubus untuk pertanyaan sederhana dengan batudata standar.
-
7/24/2019 Presentation Slide Data Cube
11/29
Penggunaan langkahlangkah ini untukeksplorasi penemuandidorong dari kubus data
yang digambarkan di contoh berikut.
-
7/24/2019 Presentation Slide Data Cube
12/29
%& 'embatasan Analisis Graient
+anyak aplikasi data kubus perlu menganalisisperubahan tindakan kompleks in multidimensionalruang
Misalnya, dalam real estate, kita mungkin ingin
bertanya apa sa/a perubahan harga rumah ratarata di daerah 5ancou-er pada tahun %66(dibandingkan dengan tahun %66,dan /awabannyabisa 7harga ratarata untuk yang di/ual untuk paraprofesional di thewest 2nd turun sebesar %68,
sedangkan yang di/ual kepada orangorang bisnisdi Metrotown naik sebesar $68, dll 72kspresiseperti7 profesional di thewest 2nd 7sesuai dengansel berbentuk kubus dan menggambarkan sektorbisnis dimodelkan dengan kubus data.
-
7/24/2019 Presentation Slide Data Cube
13/29
Perubahan pertambangan problemof tindakankompleks dalam ruang amultidimensional
adalah pertama kali diusulkan oleh "mielinski,
3hachiyan, andAbdulghani 9"3A6%: sebagaimasalah cubegrade,yang dapat dilihat sebagai
generalisasi dari asosiasi rules; dan kubusdata. "ni mempela/ari bagaimana perubahandalam serangkaian langkahlangkah
-
7/24/2019 Presentation Slide Data Cube
14/29
Di sini kita memeriksa -ersi terbatas tapi menarik dari masalahcubegrade, disebut dibatasi analisis gradien multidimensi, yangmengurangi ruang pencarian dan berasal hasil yang menarik.Menggabungkan /enis berikut kendala&
$. #igni0kansi kendala& >al ini memastikan bahwa kita meneliti
hanya selsel yang memiliki tertentu 7#igni0kansi statistik7 dalam data, seperti yang mengandung
setidaknya se/umlah tertentu
sel dasar atau total pen/ualan setidaknya tertentu. Dalamkonteks data kubus, kendala ini
bertindak sebagai kondisi gunung es, yang plum se/umlah besar
sel sepele dari men/awab ditetapkan.
%. Probe kendala& ini memilih subset sel
-
7/24/2019 Presentation Slide Data Cube
15/29
. kendala ?radient& ini menentukan kisaranpengguna dari bunga gradien
-
7/24/2019 Presentation Slide Data Cube
16/29
!ata Generalization yaitu merangkum data dengan
mengganti relatif nilai tingkat rendah (seperti nilai numerikuntuk atribut usia) dengan konsep-tingkat yang lebih tinggi
(seperti muda, middleaged, dan senior).
Concept !escription menghasilkan deskripsi untuk
karakterisasi dan perbandingan data. al ini kadang-kadang
disebut kelas deskripsi, ketika konsep yang akan di!elaskan
mengacu pada kelas ob!ek. "arakterisasi menyediakan
rangkuman yang ringkas dan singkat dari koleksi data yangdiberikan, sementara konsep atau perbandingan kelas (!uga
dikenal sebagai diskriminasi) memberikan deskripsi
membandingkan dua atau koleksi lebih dari data.
AttributeOriented "nduction@An Alternati-eMethod for Data ?eneraliation and Concept Description
-
7/24/2019 Presentation Slide Data Cube
17/29
"nduksi +erorientasi Atribut
Diusulkan tahun $BB
-
7/24/2019 Presentation Slide Data Cube
18/29
1#$%&
Contoh: #ara$terisasi Analitis 'ugas
enambang karakteristik umum yangmenerangkan graduate studentsmenggunakan karakterisasi analitis
Diberikan
tribut-atribut name, gender, major,birth_place, birth_date, phone#, dan
gpa
Gen(ai)* konsep hierarki atas ai
Ui* atribut ambang analitis untuk ai
Ti* atribut ambang general untuk aiR* atribut ambang yang relevan
-
7/24/2019 Presentation Slide Data Cube
19/29
1%$%&
Contoh: #ara$terisasi Analitis1. "oleksi data
"elas target+ graduate student "elas laannya+ undergraduate student
. eneralisasi analitis menggunakan /i
0enghapusan atribut enghapus namedanphone#
eneralisasi atribut enggeneralisasi major, birth_place, birth_date
dangpa
engumpulkan !umlah record
"andidat relasi+gender, major,birth_country, age_rangedangpa
-
7/24/2019 Presentation Slide Data Cube
20/29
&$%&
Contoh: #ara$terisasi Analitis
Kandidat relasi untuk kelas Target: Graduate
students (
=120)
Kandidat relasi untuk kelas lawan : Undergraduate
students (=130)
gender major birth_country age_range gpa count
cience Canada &-2 3ery4good 15
6 cience 6oreign 2-7& 8xcellent
8ngineering 6oreign 2-7& 8xcellent 1#
6 cience 6oreign 2-7& 8xcellent 2
cience Canada &-2 8xcellent 1
6 8ngineering Canada &-2 8xcellent 1#
gender major birth_country age_range gpa count
cience 6oreign 9& 3ery4good 1#
6 :usiness Canada 9& 6air &
:usiness Canada 9& 6air
6 cience Canada &-2 6air ;
8ngineering 6oreign &-2 3ery4good
6 8ngineering Canada 9& 8xcellent ;
-
7/24/2019 Presentation Slide Data Cube
21/29
1$%&
Contoh: #ara$terisasi Analitis7. nalisis
-
7/24/2019 Presentation Slide Data Cube
22/29
$%&
Contoh: #ara$terisasi Analitis7. nalisis umlah grad studentsdalam ?cience@
>umlah undergradstudents dalam
?cience@
A#A7.&;
;log
;
;
;
&log
;
&
2&
;
#
;5log
#
;5
#
75log
#
75
2&
#
15
;log
15
;
15
#;log
15
#;
2&
15)(
=
+
+
+
+
+
=majorE
-
7/24/2019 Presentation Slide Data Cube
23/29
7$%&
Contoh: #ara$terisasi Analitis enghitung perolehan informasi untuk
masing-masing atribut
=nformation gain untuk seluruh atribut
112.&A#A7.&%%##.&)(),()( 1 === majorESSImajorGain
-
7/24/2019 Presentation Slide Data Cube
24/29
;$%&
Contoh: #ara$terisasi Analitis;. =nitial orking relation (B&) derivation
< * &.1
:uang atribut yang tak relevan $ relevan tapi lemah
dari kandidat relasi * buanggender, birth_country
remove contrasting class candidate relation
2. elakukan induksi berorientasi atribut atas B&
menggunakan 'i
-
7/24/2019 Presentation Slide Data Cube
25/29
2$%&
#omparasi #elas Mining "omparasi+ membandingkan dua atau lebih kelas etoda+
0artisi himpunan data relevan kedalam kelas target dankelas kontrasnya
eneralisasi kedua kelas ke level tinggi konsep yang
sama embandingkan tuple dengan deskripsi level tinggi yang
sama emberikan setiap tuple deskripsinya dan ukuran+
support distribusi didalam kelas tunggal komparasi distribusi antara kelas
enon!olkan tuple dengan fitur deskriminan yang kuat
nalisis
-
7/24/2019 Presentation Slide Data Cube
26/29
5$%&
Contoh: #omparasi Analitis Diberikan
tribut-atribut name, gender, major,
birth_place, birth_date, reidence, phone#
dangpa
Gen(ai)* konsep hierarki atas atribut-atribut ai
Ui* ambang analitis atribut untuk atribut ai
Ti* ambang generalisasi atribut untukatribut ai
R* ambang relevan atribut
-
7/24/2019 Presentation Slide Data Cube
27/29
A$%&
Contoh: #omparasi Analitis
1. "oleksi data "elas target dan kontrasnya
. nalisis relevan atribut
embuang atribut name, gender,major, phone#
7. inkronisasi generalisasi
Dikontrol oleh ambang dimensiyang diberikan user
-
7/24/2019 Presentation Slide Data Cube
28/29
#$%&
Contoh: #omparasi Analitis
Relasi utama yang digeneralisasi untuk kelas target
!raduate students
Relasi utama yang digeneralisasi untuk kelas target
"ndergraduate students
-
7/24/2019 Presentation Slide Data Cube
29/29
%$%&
Contoh: #omparasi Analitis;. Eperasi EF0 drill don, roll up dan
operasi lainnya atas kelas target dankontras untuk menyesuaikan levelabstraksi dari hasil deskripsi
2. 0resentasi ebagai generalisasi relasi, crosstabs, bar
charts, pie charts, atau kaidah-kaidah
/kuran kontras untuk merefleksikan
komparasi antara kelas target dan kelaskontrasnya Contoh countG