analisis diskriminan dan klasifikasi
TRANSCRIPT
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
1/71
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
2/71
Analisis Diskriminan danKlasifikasi
1.Ayu Indri Astuti2.Yayan suyanto3.Yulli Anggraeni
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
3/71
PemisahanPengalokasian
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
4/71
Pemisahan dan Klasifikasi untuk 2Populasi
Pemisahan dan Klasifikasi untuklebih dari 2 Populasi
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
5/71
Pemisahan dan Klasifikasi untuk 2Populasi
1 2
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
6/71
ContohNo. Populasi dan Variabel X yang diukur
1. Kesanggupan dan kesulitan
membayar pertanggung
jawaban properti perusahaan
asuransi
Total aset, biaya saham dan
obligasi, nilai pasar dari saham
dan obligasi, kerugian,
kelebihan, jumlah hadiah yangtertulis
2. Nonulcer dyspeptics (orang
yang bermasalah dengan
penyakit perut) dan normal
Pengukuran dari kecemasan,
ketergantungan, kesalahan dan
kesempurnaan
3. Keberhasilan atau kegagalanmahasiswa Skor ujian masuk, nilai rata-ratakenaikan kelas SMA,
banyaknya kegiatan di SMA
4. Pembeli produk baru dan
laggard (orang yang selalu
datang terlambat)
Pendidikan, pendapatan, besar
keluarga, banyaknya
pergantian merek
1 2
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
7/71
1
R1
2
R2
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
8/71
Pengetahuan yang tidaklengkap dari kinerja yang akan
datang Informasi sempurna yangmemerlukan penghancuran
objek Tidak tersedia atau mahalnyainformasi
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
9/71
Peluang kondisional,
21 = 21) = 1
2=
1
12 = 12) = 21
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
10/71
Populasi
sebenrnya
0
0C(1|2)
C(2|1)
Matriks Cost (biaya)
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
11/71
ECM : expexted cost of
misclassification
=
2
1
2
1
1+
1
2
(1|2)
2
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
12/71
Daerah dan yang meminimasi ECM didefinisikan
oleh nilai x sehingga pertidaksamaan di bawah inidipenuhi .
1
2
1
1()
2(
)
(1|2)
(2|1)
2
1
2 1()2() < (1|2)(2|1) 21 <
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
13/71
2/1 = 1 ( peluang prior yang sama)1 1()2()
(1|2)(2|1) ; 2
1()2() <
(1|2)(2|1)
c(1|2)/c(2|1) = 1 (biaya-biaya misklasifikasi yang sama)
1 1()2() p2p1 ; 2 1()2() < 212/1 = 12/(2|1)= 1 atau 2/1 = 1/(c(1|2)/c(2|1)) (peluang prioryang sama dan biaya-biaya misklasifikasi yang sama)
1 1(
)
2() 1 ; 2 1(
)
2() < 1
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
14/71
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
15/71
Maka objek baru tersebutkita klasifikasikan kedalam 1
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
16/71
total probabil i ty of misclassif ication (TPM)
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
17/71
10 = (1 0)0 10 = 01)(1)01(1) + 022
= 110110+220
20 = 1 10 = 220110+220
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
18/71
Layak
Sederhana
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
19/71
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
20/71
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
21/71
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
22/71
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
23/71
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
24/71
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
25/71
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
26/71
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
27/71
Mengevaluasi Fungsi Klasifikasi
cara menilai hasil dari sebarang prosedur Jika bentuk dari populasi induk diketahui
dapat dihitung dengan relatif (contoh 11.4)
Untuk populasi induknya tidak diketahui,
Dari (11-8) TPM = 1 1 2 221 ...(11-28)Adapun nilai terkecil dari jumlah ini disebut nilai error optimum (OER)
OER = 1 1 2 221 ... (11-26)Dimana 12 ditentukan oleh kasus khusus (b) dalam (11-7)Oleh karena itu, OER adalah nilai error untuk kaidah klasifikasi TPM minimum.
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
28/71
Contoh 11.4
Misalkan diberikan sebuah pernyataan untuk nilai error optimum ketika 1 = 2 = 12dan12() merupakan fungsi densitas normal multivariat dalam (11-10).Sekarang, aturan klasifikasi ECM minimum dan TPM minimum tepat sama ketika
12 = 21. Karena probabilitas priornya juga sama, daerah klasifikasi TPMminimum didefinisikan untuk populasi normal oleh (11-12), dengan 1221 21 = 0. Kitadapatkan
1 1 2 1 121 2 1 + 21 0
1 1 2 1 121 2 1 + 21 < 0
Himpunan ini dapat dinyatakan dalam hubungan = 1 2 1 = sebagai
1
1
2 1
2
(
1
1+
2 )
1 < 121 2 (11 + 2 )
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
29/71
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
30/71
P21 = P < 12 1 2 1 + 21 = P1 untuk semua (11-40)atau, ekivalen dengan
Alokasikan x pada
jika
ln > ln untuk semua (11-41)
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
46/71
Dengan syarat klasifikasi ECM minimum diatas, karena identik
dengan memaksimumkan probabilitas posterior,
, dimana
(11-42) 1,2, ,
Persamaan diatas adalah bentuk umum untuk 2 grup.Secara umum, aturan ECM minimum memiliki 3 komponen;probabilitas prior, nilai misklasifikasi dan fungsi kepadatan.
Ketiga komponen tersebut harus sudah diketahui atau sudah
diestimasi, sebelum menggunakan aturan tersebut.
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
47/71
Klasifikasi dengan Populasi Normal
Kasus khusus terjadi jika
exp , 1 , 2 , , (11-43)
Persamaan tersebut adalah fungsi kepadatan berdistribusi normal
multivariate dengan vector mean
dan matriks kovarian
. Untuk
selanjutnya c(i|i)=0, c(k|i)=1, maka:
Alokasikan x ke jikaln ln
2
ln 2 1
2
ln 1
2
max ln (11-44)
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
48/71
Selanjutnya, kita definisikan nilai diskriminan kuadratik untuk
populasi ke-i menjadi
12 ln
12
+ l n , 1 , 2 , , . (11-45) adalah nilai kuadratik yang terdiri dari kontribusi darivariansi umum , probabilitas prior , dan jarak kuadrat darix ke populasi mean .
b bili l i i d i i kl ifik i k
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
49/71
Probabilitas Total Minimum dari Aturan Misklasifikasi untuk
Populasi Normal-.
Alokasikan x ke jikaNilai kuadratik , , , ,dimana untuk persamaan yang telah disebutkan diatas,untuk i=1, 2,, g.
Aturan Estimasi TPM Minimum untuk Beberapa Populasi
normal-BerbedaAlokasikan x ke jikaNilai
,
, ,
dimana diberikan pada estimasi diatas, i=1,2,..,g.
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
50/71
Penyederhanaan bisa dilakukan jika matriks kovarian populasi sama. Ketika , untuk i=1,2,,g, nilai diskriminan persamaan kuadratik akan menjadi
12 ln i
12 x
x + ix 12 i
i + l n piDua bentuk pertama sama dengan , , , sehingga
dapat diabaikan untuk tujuan pengalokasian. Bentuk lainnya terdiri dari
konstanta l n ii dan kombinasi linear dari komponen x.Definisi nilai diskriminan linier:
ix 12 ii + l n Estimasi , dari nilai diskriminan linier sesuai dengan estimasigabungan ,
1 + 1 + + 1
+ + +
Dan diberikan oleh
12
+ l n
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
51/71
Aturan Estimasi TPM Minimum untuk Populasi Normal
dengan Kovarian Sama
Alokasi nilai x ke jikaNilaidiskriminan linier , , , dimana adalah diskriminan linier dengan , i= 1,2,...,g.
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
52/71
Nilai diskriminan linier adalah fungsi linier dari x yang sesuai. Sama seperti
untuk kasus kovarian sama yang didapat dari nilai diskriminan kuadrat untuk
populasi ke-I dengan mengabaikan konstanta ln. Hasilnya, estimasisampel yang dimasukkan untuk kuantitas populasi yang tidak diketahui,selanjutnya dapat diinterpretasikan dalam bentuk kuadrat jarak
Dari x ke vector mean sampel . Aturan penempatannya sebagai berikut:1. Masukkan x ke populasi dimana
+ ln memiliki nilai
terbesar.2. Lihat aturan tersebut atau yang persamaan yang ekivalennya, lalu
masukkan x ke populasi terdekat. (ukuran jarak dinyatakan oleh ln )3. Jika probabilitas priornya tidak diketahui, prosedur yang berguna adalah
dengan menentukan
.
Observasi selanjutnya dimasukkan ke populasi yang terdekat.
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
53/71
ContohHitung nilai diskriminan linier yang berasal dari data degan g = 3,
populasi diasumsikan sebagai nomor bivariat dengan matrik kovarian
biasa.Sampel acak dari populasi , , disebutkan , beserta meansampel dan matrik kovariannya.
Metode Fisher untuk Pendiskriminasian diantara
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
54/71
Metode Fisher untuk Pendiskriminasian diantara
Beberapa Populasi
matriks kovarian populasi adalah sama, yaitu g .Misal = vector rata-rata dari kombinasi populasi=jumlah dari cross-products diantara grup.Maka
=
dengan
=
Lalu perhatikan kombinasi linear yang mempunyai nilaiekspektasi untuk populasi , dan variansi untuk semuapopulasi. Akibatnya, nilai ekspektasi
berubah
sebagaimana populasi yang berasal dari X yang dipilih berubah.
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
55/71
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
56/71
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
57/71
kiuntuk
xxxxyyr
j
r
j
r
j
ijkjkjj
)(')(')(
jikapadaxAlokasikan
1 1 1
222
k
Prosedur Klasifikasi Fisher
Berdasarkan Diskriminan Sampel
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
58/71
P P ilih V i b l
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
59/71
Proses Pemilihan Variabel
Tests of Equality of Group MeansWilks'
Lambda F df1 df2 Sig.Usia ,945 4,247 1 73 ,043
Berat ,934 5,173 1 73 ,026Tinggi ,946 4,186 1 73 ,044Olahraga ,894 8,656 1 73 ,004
Bekerja ,968 2,432 1 73 ,123
Income ,951 3,779 1 73 ,056
Tabel 3.2 Tabel Tests of Equality of Group Means
1. Wilks Lambda
Angka Wilks Lambda berkisar 0 sampai 1. Jika angka mendekati 0, maka data
tiap grup cenderung berbeda, sedangkan jika angka mendekati 1, data tiap grup
cenderung sama.
P P ilih V i b l
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
60/71
Proses Pemilihan Variabel
2. Uji Signifikansi (F test)
Uji F dilakukan untuk menguji hipotesis berikut:
Ho : group means dari masing-masing kelompok adalah relatif sama
H1 : group means dari masing-masing kelompok memilik perbedaan secara
nyata.
Jika Sig < 0,05, maka Ho ditolak, yang berarti ada perbedaan antar grup. Jika
Sig > 0,05, maka Ho diterima yang berarti group means masing-masingkelompok relatif sama. Hal ini menunjukkan bahwa tidak ada perbedaan
antar grup.
Proses Pemilihan Variabel
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
61/71
Proses Pemilihan Variabel
Analisis Diskriminan mempunyai asumsi bahwa :
Variansi variabel bebas untuk setiap grup seharusnya sama.
Variansi diantara variabel-variabel bebas seharusnya juga sama.
Kedua pengertian diatas dapat disimpulkan bahwa group covariance
matrices adalah relatif sama.
Untuk itu, perlu dilakukan pengujian hipotesis sebagai berikut :
Ho : group covariance matrices adalah relatif samaH1 : group covariance matrices adalah berbeda secara nyata
Adapun penilaian signifikansi dari pengujian hipotesis diatas sebagai
berikut:
Jika Sig < 0,05, maka Ho ditolak.Jika Sig > 0,05, maka Ho diterima.
Proses Pemilihan Variabel
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
62/71
Proses Pemilihan Variabel
Dari tampilan tabel test resultoutput,
Test Results
Box's M 33,189
F Approx. 1,441
df1 21
df2 19569,371
Sig. ,087
Tests null hypothesis of equal population covariance matrices.
Dalam kasus ini memiliki nilai sig. 0,087 > 0,05 maka Ho diterima ini artinya bahwa
data telah memenuhi asumsi analisis diskriminan. Sehingga proses dapat
dilanjutkan.
Proses Diskriminan
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
63/71
Proses Diskriminan
Variables Entered/Removeda,b,c,dStep
Entered
Min. D Squared
Statistic BetweenGroups
Exact F
Statistic df1 df2 Sig.1 Olahraga ,462 sedikit and
banyak8,656 1 73,000 ,004
2 Berat ,776 sedikit andbanyak
7,170 2 72,000 ,001
3 Tinggi 1,208 sedikit andbanyak
7,343 3 71,000 ,000
At each step, the variable that maximizes the Mahalanobis distance between the twoclosest groups is entered.a. Maximum number of steps is 12.b. Maximum significance of F to enter is .05.c. Minimum significance of F to remove is .10.d. F level, tolerance, or VIN insufficient for further computation.
Tabel diatas menunjukan variabel mana saja, dari keseluruhan variabel
yang dimiliki, yang dapat dimasukan dalam model diskriminan.
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
64/71
Proses Diskriminan
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
65/71
Proses Diskriminan
Perhatikan kolom Canonical Correlation. Hal tersebut untuk mengukur
keeratan hubungan antara discriminant scores dengan grup. Pada kasus ini
dapat dikatakan bahwa keeratan hubungan antara diskriminan skor dengan
grup sebesar 48,7 %.
a. First 1 canonical discriminant functions
were used in the analysis.
Function
Eigenvalue% of
VarianceCumulative
%Canonical
Correlation
1,310a 100,0 100,0 ,487
Eigenvalues
Proses Diskriminan
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
66/71
Proses Diskriminan
Structure Matrix
Function
1Olahraga ,618
usiaa ,521
Berat ,478
Tinggi -,430
incomea ,266
bekerjaa ,139
Tabel diatas menunjukan korelasi antara
variabel independen dengan fungsi
diskriminan yang terbentuk. Variabel yangtidak dimasukan dalam analisis
diskriminan adalah variabel dengan nilai
korelasi rendah dan diberikan simbol a
disebelah masing-masing variabel
tersebut.
Proses Diskriminan
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
67/71
Proses Diskriminan
Dari tabel diatas diperoleh gambaran model diskriminan yang
terbentuk. Model diskriminannya sebagai berikut :
Minum (D) = 7,884 + 0,064 berat ( - 0,093 tinggi ( + 0,006olahraga (
Canonical DiscriminantFunction Coefficients
Function
1Berat ,064
Tinggi -,093
Olahraga ,006
(Constant) 7,884
Unstandardized coefficients
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
68/71
Prior Probabilities for Groups Classification Function Coefficients
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
69/71
Prior Probabilities for Groups
Minum
Prior
Cases Used inAnalysis
Unweight
ed
Weighte
dSedikit ,500 38 38,000
Banyak ,500 37 37,000
Total 1,000 75 75,000
Tabel 3.10 TabelPrior Probabilities for Groups
Classification Function Coefficients
Minum
sedikit banyak
berat ,035 -,035
tinggi 3,587 3,690
olahraga ,036 ,030
(Constant) -297,882 -306,557
Fisher's linear discriminant functions
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
70/71
-
7/28/2019 Analisis Diskriminan Dan Klasifikasi
71/71