analisis an

Kamarul Imam

[email protected]

ANALISIS DISKRIMINAN

1. Introduksi.

Analisis Regresi Logistik dan Analisis Diskriminan adalah teknik statistik yang sesuai untukvariabel dependen yang bersifat katagorial (nominal atau nonmetrik) dengan variabel

independen bersifat metrik. Pada banyak kasus, variabel dependen terdiri dari dua kelompokatau klasifikasi, contoh : lakilaki dan perempuan, tinggi dan rendah; bahkan seringkali juga

lebih dari dua kelompok, seperti : rendah, sedang dan tinggi. Analisis Diskriminan dapatdiaplikasi kepada dua kelompok atau lebih. Jika hanya ada dua kelompok variabel dependen,

maka analisis disebut sebagai Two Group Discriminant Analysis, sedang untuk tiga kelompok

atau lebih, analisis disebut Multiple Discriminant Analysis (MDA). Analisis Regresi Logistikatau disebut sebagai Analisis Logit terbatas hanya pada dua kelompok variabel dependen,

walaupun dengan formulasi alternatif analisis ini bisa diaplikasi kepada lebih dari duakelompok variabel dependen.

Analisis Diskriminan melibatkan penurunan sebuah variat, merupakan kombinasi linier terbaik

dari dua variabel independen atau lebih yang akan mendiskriminasi antara kelompokkelompok yang secara apriori didefinisikan sejak awal. Diskriminasi dapat diperoleh melalui

mengatur bobot variat untuk setiap variabel untuik memaksimumkan varians antar kelompokrelatif terhadap varians di dalam kelompok. Kombinasi linier tersebut disebut sebagai fungsi

diskiriminan, yang diderivasi dari sebuah persamaan dalam bentuk :

X

W

Z

Zjk = a + W1 X1k + W2 X2k + . . . . + Wn Xnk

Di mana,

jk = skor diskriminan dari fungsi diskriminanj untuk obyekk,

a = intersep,

i = bobot diskriminan untuk variabel independeni,

ik = variabel independeni untuk obyekk.

Analisis Diskriminan adalah teknik statistik yang sesuai untuk menguji hipotesis yang

menyatakan bahwa ratarata kelompok dari sekumpulan variabel independen untuk duakelompok atau lebih, setara. Untuk menyatakan hal itu, Analisis Diskriminan mengkalikan

nilai setiap variabel independen dengan bobotnya masingmasing dan menjumlahkannyabersamasama. Hasilnya adalah sebuah skor Z diskriminan tunggal yang bersifat komposit

untuk setiap individual dalam analisis. Melalui peratarataan terhadap skor diskriminan untuk

seluruh individual pada suatu kelompok tertentu, akan dihasilkan ratarata kelompok, ataudisebut sebagai group centroids. Centroids ini mengindikasikan sebagian besar lokasi tipikal

dari setiap individual yang ada pada kelompok tertentu, dan sebuah perbandingan terhadapcentroids kelompok akan menunjukkan seberapa jauh kelompokkelompok itu terpisah.

Uji signifikansi statistikal terhadap fungsi diskriminan adalah ukuran yang digeneralisasi darijarak antara centroids kelompok. Ini ditentukan dari perbandingan distribusi skor diskriminan

untuk kelompokkelompok. Jika overlaps distribusi yang dihasilkan itu kecil, maka fungsi

diskriminan memisahkan kelompokkelompok itu dengan baik. Jika overlaps distribusi itubesar, maka fungsi diskriminan yang dihasilkan adalah fungsi yang tidak dapat berperan

sebagai diskriminator dengan baik.

Secara grafis, konsep hasil uji signifikansi statistik kepada fungsi diskriminan dapat

digambarkan seperti pada gambar berikut :

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS

DISKRIMINAN.doc

1

Kamarul Imam

[email protected]

A B

Z

A B

Z

Gambar yang di atas menunjukkan bahwa fungsi diskriminan dapat mendiskriminasi

kelompok A dan B dengan baik. Daerah berarsir adalah adalah daerah kesalahan klasifikasi,yaitu individual dari kelompok A diklasifikasi sebagai anggota kelompok B. Gambar yang di

bawah menunjukkan bahwa fungsi diskriminan kurang dapat mendiskriminasi kelompok Adan B dengan baik.

Analisis Diskriminan Multiple memiliki karakter yang unik di antara analisisanalisis hubungan,

yaitu : jika ada lebih dari dua kelompok sebagai variabel dependen, analisis diskriminan akanmenghitung lebih dari satu fungsi diskriminan (NG – 1), di mana NG adalah banyaknya

kelompok. Setiap fungsi menghitung skor Z pada setiap kelompok yang diperbandingkan.

Analisis Logit adalah bentuk khusus dari analisis regresi yang difromulasikan untuk

memprediksi dan menjelaskan sebuah variabel dependen dengan sifat katagori (binary).Perbedaan antar Analisis Logit dengan Analisis Diskriminan adalah terutama pada asumsiyang mendasari. Asumsi pada Analisis Diskriminan : multivariat normal dan kesetaraan

matriks varianskovarians antar kelompok, adalah asumsi yang sulit dipenuhi pada banyaksituasi. Untuk variabel dependen yang terdiri atas dua kelompok katagorial, Analisis Logit

lebih direkomendasi daripada Analisis Diskriminan.

2. Contoh Hipotetis Analisis Diskriminan.

Analisis Diskriminan diaplikasi dengan tujuan pemahaman kepada anggota kelompok, apakahkelompokkelompok itu berupa individual (pelanggan dan bukan pelanggan), perusahaan

(profitable dan unprofitable), produk (berhasil dan tidak berhasil); yang bisa dievaluasimelalui serangkaian variabel independen.

Contoh1 : Analisis Diskriminan Dua Kelompok.

HATCO bermaksud mengetahui apakah sebuah produk baru – food mixer, akan berhasildipasarkan secara komersial. Untuk itu HATCO melakukan survey kepada calon

pelanggannya. HATCO mengklasifikasi dua kelompok pelanggan, yaitu pelanggan yang akanmembeli produk baru tersebut dan pelanggan yang tidak akan membeli. HATCO telah

menentukan tiga variabel yang diperkirakan menjadi pertimbangan pelanggan dalammemutuskan membeli atau tidak, yaitu : daya tahan (durability), kualitas hasil (performance)

D:\Documents and Settings\HOME\My Documents\MULTIVARIATE ANALYSIS\ANALISIS 2

DISKRIMINAN.doc

Kamarul Imam

[email protected]

dan tampilan (style). Kuesioner yang disebar kepada pelanggan berisi pertanyaanpertanyaan yang menyangkut kepada ketiga variabel ini, dengan skor jawaban 1 sampai

dengan 10 (1 = sangat buruk, 10 = istimewa). Hasil survey kepada pelanggan dari dua

kelompok adalah :

Tabel 1. Skor Evaluasi Pelanggan Terhadap Produk Baru.

Kelompok Berdasar IntensiPembelian

Kelompok1 : Akan Membeli

Pelanggan 1

Pelanggan 2

Pelanggan 3

Pelanggan 4

Pelanggan 5

Ratarata kelompok

Kelompok2 : Tidak Membeli

Pelanggan 6

Pelanggan 7

Pelanggan 8

Pelanggan 9

Pelanggan 10

Ratarata kelompok

Selisih Ratarata

Evaluasi Terhadap Produk Baru

X1 (durability) X2 (performance) X3 (style)

8 9 6

6 7 5

10 6 3

9 4 4

4 8 2

7.4 6.8 4.0

5 4 7

3 7 2

4 5 5

2 4 3

2 2 2

3.2 4.4 3.8

4.2 2.4 0.2

Dengan sepuluh pelanggan yang diamati pada tiga variabel pertimbangan, dapat dibuat

grafik untuk melihat apa yang dihasilkan Analisis Diskriminan. (Pelanggan yang akan

membeli ditandai lingkaran, yang tidak membeli ditandai dengan kotak).

8

9 7 5 6 2 1 4 3X1

1 2 3 4 5 6 7 8 9

9

6 7

4 8 3 2 5 1

X2

1 2 3 4 5 6 7 8 9

7 9 8

5 3 4 2 1 6

X3

10

10

10

10

10

2 3 4 5 6 7 8 9 10


DISKRIMINAN.doc

3

1

Kamarul Imam

[email protected]

Pada grafik X1 (dengan selisih ratarata kelompok terbesar), tampak bahwa variabel inihampir dapat mendiskriminasi dengan sempurna. Dengan titik diskriminasi (cutting point) =

5.5; tampak hanya satu pelanggan yang akan membeli terklasifikasi sebagai pelanggan yang

tidak membeli, yaitu pelanggan no. 5. Kesalahan klasifikasi = 1/10 = 10%. Makin besarselisih ratarata kelompok, makin memperkecil daerah overlaps.

Pada grafik X2, kesalahan klasifikasi terjadi pada pelanggan no. 4 dan no. 7. Pelanggan no. 5terklasifikasi dengan benar, walaupun pada X1 pelanggan no. 5 ini terklasifikasi dengan tidak

benar, dan sebagian besar pelanggan terklasifikasi dengan benar seperti pada variabel X1.Dapat disimpulkan bahwa X1 dan X2 secara bersamasama dapat digunakan sebagai

kombinasi linier dalam fungsi diskriminan.

Pada grafik X3, kesalahan klasifikasi makin tinggi. Maka dengan mengabaikan X3, fungsidiskriminan (kombinasi X1 dan X2) lebih mampu mendiskriminasi kedua kelompok.

Perbandingan percentage correctly classified (cc) terhadap tiga alternatif fungsi diskriminandapat dilihat pada tabel berikut :

Tabel 2. Perbandingan CC Fungsi Diskriminan.

KelompokHasil Perhitungan Zscore

Fungsi 1:

Z = X1

Fungsi 2 :

Z = X1 + X2

Fungsi 3 :

Z = 4.53 + .476 X1 + .359 X2

Kelompok1 : Akan Membeli

Pelanggan 1 8 17 2.51





Kelompok2 : Tidak Membeli






Cutting Score 5.5 11 0.0

CC pada masingmasing fungsi diskriminan dapat dihitung sebagai berikut :

Prediksi Prediksi Prediksi

Kelompok Kelompok Kelompok

Kelompok1 2

4 1

0 5

Kelompok1 2

5 0

0 5

Kelompok

Aktual Aktual Aktual

1 1 1

2 2 2

1 2

5 0

0 5

CC fungsi 1 = 90% CC fungsi 2 = 100% CC fungsi 3 = 100%

Keterangan :

Fungsi 3 adalah fungsi eksplisit yang dihasilkan dari data input.

Representasi geometrik dapat dijelaskan oleh gambar berikut :


DISKRIMINAN.doc

4

Kamarul Imam

[email protected]

V1

A

Zcutoff B

AB

V2

Z

Gambar di atas menjelaskan dua kelompok yang berbeda, dengan V1 dan V2 sebagai ukuran

setiap individual anggota masingmasing kelompok. Garis cutoff adalah garis yang membagikedua kelompok berbeda. Daerah intersection merupakan daerah overlaps yang menyatakan

kesalahan klasifikasi.

Keofisien diskriminan dihitung dengan prinsip maksimasi varians antar kelompok danminimasi varians di dalam kelompok. Jika varians antar kelompok relatif lebih besar

dibanding varians di dalam kelompok, maka fungsi diskriminan dapat mengklasifikasikelompok dengan lebih baik.


DISKRIMINAN.doc

5

Kamarul Imam

[email protected]

Contoh2: Analisis Diskriminan Tiga Kelompok.

HATCO melakukan survey terhadap kemungkinan perpindahan pelanggan dari para pesaing.

HATCO mendefinisikan ada tiga kelompok pelanggan, yaitu : (1) melakukan perpindahan, (2)

tidak memutuskan apaapa dan (3) tidak melakukan perpindahan. Penelitian kecil dialkukanHATCO dengan melibatkan 15 pelanggan sebagai responden, di mana masingmasing

kelompok terdiri atas lima orang. Indikator penyebab perpindahan pelanggan yangdipertimbangkan adalah : harga kompetitif (X1) dan kualitas pelayanan (X2).

Kuesioner yang disebar kepada pelanggan berisi pertanyaanpertanyaan yang menyangkutkepada kedua variabel ini, dengan skor jawaban 1 sampai dengan 10 (1 = sangat buruk, 10

= istimewa). Hasil survey kepada pelanggan dari tiga kelompok adalah :

Tabel 3. Skor Evaluasi Pelanggan Kemungkinan Perpindahan Kepada Pesaing.

Kelompok Berdasar Intensi Evaluasi Terhadap Suplier Sekarang

Perpindahan X1 (price) X2 (service)Kelompok1 : Akan Pindah

Pelanggan 1 2 2

Pelanggan 2 1 2

Pelanggan 3 3 2

Pelanggan 4 2 1

Pelanggan 5 2 3

Ratarata kelompok 2.0 2.0

Kelompok2 : Tidak Memutuskan

Pelanggan 6 4 2

Pelanggan 7 4 3

Pelanggan 8 5 1

Pelanggan 9 5 2

Pelanggan 10 5 3


Kelompok3 : Tidak Pindah

Pelanggan 11 2 6

Pelanggan 12 3 6

Pelanggan 13 4 6

Pelanggan 14 5 6

Pelanggan 15 5 7


Dengan tiga kelompok yang akan diklasifikasi, Analisis Diskriminan menghasilkan dua fungsi

diskriminan, di mana setiap fungsi merepresentasikan pembedaan antar kelompok. Untukvariabel X1, selisih ratarata kelompok1 cukup besar terhadap ratarata kelompok2 atau

kelompok3 (2.0 terhadap 4.6 atau 3.8). X1 bisa mendiskriminasi antara kelompok1 dengan

kelompok2 atau dengan kelompok3; tetapi kurang efektif untuk diskriminasi antarakelompok2 dan kelompok3. Untuk variabel X2, selisih ratarata pada kelompok1 dan

kelompok2 tidak cukup besar (2.0 dengan 2.2); tetapi pada kelompok3 selisih rataratanyacukup besar dengan kelompok1 dan kelompok2 (6.2 dengan 2.0 atau 2.2). Variabel X1

membedakan kelompok1 terhadap kelompok2 dan kelompok3 dan variabel X2

membedakan kelompok3 terhadap kelompok1 dan kelompok2. X1 dan X2 memiliki dimensi

diskriminasi antar kelompok yang berbeda.

Secara grafis dapat dijelaskan kemampuan diskriminasi masingmasing variabel kepadakelompok1, kelompok2 dan kelompok3.


DISKRIMINAN.doc

6

Kamarul Imam

[email protected]

5

4 7 9

2 1 3 6 8

X1

1 2 3 4 5 6 7 8 9

9

6

3

8 2 7

4 1 5

X2

15

11 14

13 10

12

10

14

10 13

12

11 15

1 2 3 4 5 6 7 8 9 10Dari grafik tersebut di atas, tampak bahwa tidak ada variabel yang benarbenar dapat

mendiskriminasi ketiga kelompok itu. Namun jika bisa dibuat dua buah fungsi diskriminansederhana, hasilnya akan menjadi lebih jelas. Seandainya kedua fungsi itu untuk masing

masing variabel bebasnya diberi bobot 1 dan 0, hasilnya adalah :

Fungsi 1 : Z = 1 X1 + 0 X2

Fungsi 2 : Z = 0 X1 + 1 X2

Dari kedua fungsi hipotetis itu selanjutnya dapat dihitung skor diskriminan untuk setiapanggota kelompok.

Tabel 4. Skor Diskriminan Individual Pada Setiap Kelompok Dengan Fungsi 1.

Pelanggan Z score Pelanggan Z score Pelanggan Z score

1 2 6 4 11 2

2 1 7 4 12 3

3 3 8 5 13 4

4 2 9 5 14 5

5 2 10 5 15 5

Tabel 5. Skor Diskriminan Individual Pada Setiap Kelompok Dengan Fungsi 2.

Pelanggan Z score Pelanggan Z score Pelanggan Z score

1 2 6 2 11 6

2 2 7 3 12 6

3 2 8 1 13 6

4 1 9 2 14 6

5 3 10 3 15 7


DISKRIMINAN.doc

7

Kamarul Imam

[email protected]

Secara grafis, klasifikasi kelompok berdasar skor diskriminan masingmasing individual dapatdigambarkan sebagai berikut :

Fungsi 2

7

6

5

4

3 5 7

2 1 3 6 92

1 4 8

15

11 12 13 14

10

Fungsi 1

1 2 3 4 5 6

Tampak dari grafik ini, bahwa skor diskriminan setiap individual untuk kelompok1 dan

kelompok2 pada fungsi2 tidak pernah melampaui 4.5. Skor diskriminan kelompok1 tidakpernah melampaui 3.5 pada fungsi1. Skor diskriminan individual pada fungsi3 di atas 4.5

pada fungsi2. Pembobotan sederhana kepada variabelvariabel bebas pada fungsi1 danfungsi2 seperti di atas telah cukup dapat mengklasifikasi ketiga kelompok dengan baik.

3. Kerangka Kerja Untuk Analisis Diskriminan.

Langkahlangkah operasional dalam Analisis Diskriminan terdiri atas enam tahapan berurutan

yaitu :

Tahap1 : Problem Penelitian.

Tahap2 : Isu Desain Penelitian.

Tahap3 : Asumsi.Tahap4 : Estimasi Fungsi Diskriminan dan Menghitung Akurasi Prediksi Fungsi.

Tahap5 : Interpretasi Fungsi Diskriminan.Tahap6 : Validasi Hasil Diskriminan.

Flowchart keenam langkah dapat digambarkan sebagai berikut :


DISKRIMINAN.doc

8

Kamarul Imam

[email protected]

cuttin corehi atio.

Tahap 1Problema Penelitian

Pilih tujuan :

1. Evaluasi selisih kelompok dengan basis multivariat.2. Klasifikasi pengamatan ke dalam kelompok.

3. Identifikasi dimensi diskriminan antar kelompok.

Tahap 2

Isu Desain Penelitian

1. Seleksi variabel independen.2. Pertimbangkan banyaknya sampel.

3. Lakukan analisis dan tentukan sampel.

Tahap 3

Asumsi

1. Normalitas variabel independen.

2. Linieritas hubungan.3. Multikolinieritas di antara variabel independen.

4. Matriks dispersi yang setara.

Tahap 4

Estimasi Fungsi Diskriminan1. Estimasi simultan atau stepwise.

2. Signifikansi fungsi diskriminan.

Pengukuran akurasi kemampuan prediksi fungsi dengan

matriks klasifikasi

1. Hitung g s optimal.2. Tentukan kriteria untuk menghasilkan t r3. Signifikansi statistik dari akurasi prediksi.

Tahap 5Interpretasi Fungsi Diskriminan

Berapa banyak fungsi akan diinterpretasi ? atau lebih

Evaluasi Fungsi Tunggal Evaluasi Fungsi Terpisah1. Bobot diskriminan 1. Bobot diskriminan.

2. Discriminant loadings 2. Discriminant loadings.

3. Nilai F parsial. 3. Nilai F parsial.

Evaluasi Fungsi Dikombinasi

1. Fungsi yang dirotasi.2. Potency Index.

3. Grafik centroid kelompok.

4. Grafik loadings.

Tahap 6

Validasi Hasil Diskriminan

1. Split sampel atau validasi silang.

2. Memberi profil selisih kelompok.

Satu Dua


DISKRIMINAN.doc

9

Kamarul Imam

[email protected]

a. Tahap1. Tujuan Analisis Diskriminan.

Tujuan Analisis Diskriminan antara lain adalah :

menentukan apakah ratarata skor yang dihitung dari sekumpulan variabel dari

dua kelompok yang terdefinisi atau lebih, signifikan berbeda secara statistik.

menentukan variabel manakah yang dominan dalam membedakan kedua

kelompok atau lebih.

membangun prosedur untuk mengklasifikasi obyek (individual, perusahaan,

produk dan lainnya) ke dalam suatu kelompok berdasar skor dari sekumpulanvariabel independen.

mengatur jumlah dan komposisi dimensi diskriminasi antara kelompok yang

terbentuk dari sekumpulan variabel independen.

b. Tahap 2. Desain Penelitian Untuk Analisis Diskriminan.

b.1 Seleksi variabel dependen dan variabel independen.

Untuk mengaplikasi Analisis Diskriminan, terlebih dahulu harus menentukan

manakah variabel independen dan variabel dependen. Perlu diingat, bahwa

variabel dependen bersifat katagorial, sedang variabel independen bersifatmetriks. Peneliti terlebih dahulu harus memfokuskan diri kepada variabel

dependen. Variabel dependen bisa terdiri atas dua kelompok atau lebih, di manamasingmasing kelompok bersifat mutually exclusive dan exhaustive., artinya

setiap anggota kelompok hanya bisa dimasukkan ke dalam suatu kelompoktertentu. Analisis Diskriminan masih sesuai diaplikasikan pada variabel dependen

yang bersifat ordinal bahkan interval1.

Beberapa katagori kelompok bisa dikembangkan, biasanya dua, tiga atau empatkelompok. Tetapi lebih dari itu bisa dikembangkan jika diperlukan. Tetapi, dari

kelompokkelompok yang dibangun bisa juga disederhanakan menjadi duakelompok ekstrim, sehingga hanya dibutuhkan Analisis Diskriminan Dua

Kelompok. Prosedur semacam ini disebut sebagai polar extreme approach, di

mana hanya melibatkan dua kelompok ekstrim saja dan mengabaikan kelompokkelompok moderat lainnya.

Variabel independen biasanya ditentukan melalui dua cara, yaitu : (1) daripenelitian sebelumnya atau dari teoriteori dasarnya, dan (2) dari intuisi dan

pengetahuan si peneliti yang logik.

b.2 Ukuran sampel.

Analisis Diskriminan agak sensitif terhadap ratio banyaknya sampel dengan

banyaknya variabel bebas. Banyak penelitian menyarankan 20 pengamatanuntuk setiap variabel bebas. Tetapi sangat direkomendasikan bahwa jumlah

sampel sebaiknya 5 kali dari banyaknya variabel bebas2. Perlu puladipertimbangkan banyaknya sampel pada setiap kelompok yang diteliti. Pada

kondisi minimum, jumlah pengamatan pada kelompok terkecil harus lebih

banyak daripada banyaknya variabel bebas. Sebagai petunjuk praktis, setiapkelompok hendaknya terdiri atas 20 buah sampel. Namun, walaupun telah

demikian masih perlu juga dipertimbangkan ukuran relatif dari kelompok,upayakan banyaknya sampel pada setiap kelompok tidak terlalu jauh.

1 Joseph F. Hair et al, Multivariate Data Analysis, 1988:257.2 Opcit, 258.


DISKRIMINAN.doc

Kamarul Imam

[email protected]

b.3 Pemecahan sampel.

Seringkali sampel dibagi menjadi dua subsampel, yaitu : (1) subsampel yang

digunakan untuk mengestimasi fungsi diskriminan, atau disebut sebagai analysissample yang dianalisis dan (2) subsampel yang digunakan untuk keperluanvalidasi atau disebut sebagai holdout sample. Metode untuk memvalidasi fungsi

adalah pendekatan spiltsample atau crossvalidation. Ukuran kedua subsampelharus cukup untuk menghasilkan kesimpulan yang jelas. Tidak ada metode yang

pasti untuk memisahkan sampel menjadi dua subsampel, namun adapendekatan yang populer yaitu memisahkan menjadi dua bagian yang sama.

Pemisahan sampel menjadi dua subsampel tetap didasari oleh prosedur

proportionately stratified sampling. Jika kelompokkelompok katagori untukAnalisis Diskriminan setara direpresentasi oleh total sampel, maka dipilih

sejumlah sampel individual yang setara. Jika kelompokkelompok katagori tidaksetara direpresentasi oleh total sampel, maka banyaknya subsampel untuk

holdout sample harus ditentukan secara proporsional kepada total sampel.

Contoh, jika total sampel terdiri dari 50 orang lakilaki dan 50 orang wanita,maka subsampel sebagai holdout sample (sampel cadangan) adalah 25 orang

lakilaki dan 25 orang wanita. Jika total sampel terdiri dari 70 orang lakilaki dan30 orang wanita, maka holdout sample = 35 orang lakilaki dan 15 orang

wanita.

Jika jumlah total sampel terlalu sedikit, maka pemisahan menjadi subsampel

tidak perlu dilakukan. Validasi fungsi bisa dilakukan dengan sampel yang ada.

c. Tahap 3. Asumsi pada Analisis Diskriminan.

Beberapa asumsi yang diberlakukan pada Analisis Diskriminan adalah :

c.1 Variabel independen harus multivariat normal, dengan penyebaran yang setara(homogenitas) walaupun tidak diketahui dan matriks atau struktur kovarian

untuk kelompokkelompok didefinisikan oleh variabel dependen. Jika asumsi ini

tidak terpenuhi, maka timbul persoalan dalam estimasi koefisien fungsi. Makasebaiknya, kalau memungkinkan dialihkan saja persaoalannya sebagai Analisis

Logit.

c.2 Tidak teridentifikasi multikolinieritas dan singularitas di antara variabel bebas.

c.3 Outliers. Jika ada data yang ekstrim, upayakan dieliminasi. Lakukan terlebih

dahulu uji kepada setiap kelompok secara terpisah baik secara univariat maupunmultivariat.

c.4 Hubungan antara variabel bebas dengan variabel tak bebas bersifat linier.

d. Tahap 4. Estimasi Fungsi Diskriminan dan Uji Kualitas Model.

Untuk memperoleh fungsi diskriminan, peneliti harus menentukan metode estimasifungsi, kemudian menentukan banyaknya fungsi yang dipertahankan. Untuk

mengukur tingkat kualitas fungsi dapat dilakukan melalui beberapa prosedur, yaitu :

(1) menghitung Zskor fungsi diskriminan yang dihitung untuk setiap sampel, (2)hitung ratarata Zskor pada setiap kelompok, (3) bandingkan ratarata Zskor

kelompok untuk memperoleh sebuah nilai yang dapat mendiskriminasi kelompok.Selanjutnya, lakukan casewise diagnostics untuk mengidentifikasi akurasi klasifikasi

setiap pengamatan dan dampak relatifnya terhadap estimasi model secara

keseluruhan.

d.1 Metode perhitungan.

Ada dua metode perhitungan untuk estimasi koefisien fungsi diskriminan, yaitu :(1) estimasi simultan dan (2) estimasi stepwise. Metode estimasi simultan


DISKRIMINAN.doc

Kamarul Imam

[email protected]

dilakukan dengan melibatkan seluruh variabel bebas bersamasama. Metode initepat jika peneliti lebih menginginkan pengaruh seluruh variabel bebas secara

bersamasama karena alasan teoritis.

Metode estimasi stepwise dilakukan dengan melibatkan variabel bebas satu persatu ke dalam model, di mulai dari variabel bebas yang paling dapat

mendiskriminasi kelompok dengan baik, kemudian variabel bebas berikutnyayang bila dikombinasikan dengan variabel bebas awal dapat meningkatkan

kemampuan diskriminasi model. Prosedur ini berlanjut sampai seluruh variabelbebas telah dipertimbangkan kombinasinya dengan kriteria perbaikan

kemampuan diskriminasi model. Ada kemungkinan pada tahapan berikutnya,

sebuah variabel bebas yang telah dimasukkan ke dalam model pada tahapansebelumnya menjadi variabel yang harus didrop pada tahapan ini. Metode

stepwise tepat digunakan apabila peneliti lebih menginginkan variabelvariabelbebas yang dapat mendiskriminasi kelompok secara signifikan maupun yang

tidak signifikan. Namun perlu dicatat, bahwa metode stepwise menjadi kurang

stabil dan kurang bisa generalisatif dengan penurunan ratio ukuran sampelterhadap banyaknya variabel bebas, khususnya jika ukuran sampel di bawah 20

pengamatan pada setiap variabel bebas.

Contoh3 : Estimasi Koefisien Diskriminan.

Tiga kelompok belajar murid yang menghadapi kesulitan, yaitu : (a) kelompokMEMORY, kelompok yang menghadapi kesulitan dalam penggunaan memory, (b)

kelompok PERCEPTION, kelompok yang menghadapi kesulitan dalam persepsi

visual dan (c) kelompok COMMUNICATION, kelompok yang menghadapikesulitan dalam penggunaan bahasa. Empat variabel bebas yang dianggap dapat

mempengaruhi kelompokkelompok ini adalah : (a) PERFORMANCE, skala IQ, (b)INFO, informasi, (c) VERBEXP, ekspresi verbal dan (d) AGE, umur.

Data dengan ukuran sampel kecil adalah :

Tabel 6. Data Hipotetis.

GroupPredictors

PERF INFO VERBEXP AGE

87 5 31 6.4

MEMORY 97 7 36 8.3

112 9 42 7.2

102 16 45 7.0

PERCEPTION 85 10 38 7.6

76 9 32 6.2

120 12 30 8.4

COMMUNICATION 85 8 28 6.3

99 9 27 8.2

W

W

Z

Z

Estimasi koefisien fungsi diskriminan untuk masingmasing kelompok :

j = a + W1 Xj1 + W2 Xj2 + . . . . + Wk Xjk

j = skor klasifikasi untuk kelompokj (j = 1, 2, ..., n),

i adalah koefisien fungsi diskriminan untuk variabel bebasi (i = 1, 2, …, k),

i diestimasi dengan formula matriks :

Wi = Swg1 Mj

Di mana Mj adalah matriks kolom ratarata variabel bebas pada kelompokj.

Sedang konstanta, a, diestimasi dengan formula matriks :


DISKRIMINAN.doc

Kamarul Imam

[email protected]

a = (1/2) WiMj

(df

Untuk data tersebut di atas, matriks Swg untuk kelompok1 yang dihasilkan

error = 6) :adalah setiap elemen matriks Swg dibagi dengan dferror

214.33 36.67 58.06S

8.33

wg1 = 36.67 7.56 12.28 1.06

58.06 12.28 25.00 1.628.33 1.06 1.62 0.92

S

:Matriks inversi dari Swg1

0.17990

0.04362

wg11 = 0.20195

0.00956

0.20195 0.00956 0.17990

1.62970 0.37073 0.606230.37073 0.20071 0.01299

0.60623 0.01299 2.05006

Kalikan matriks Swg11 dengan matriks kolom ratarata variabel bebas pada

W

ikelompok1 untuk menghitung W fungsi diskriminan untuk kelompok1 :

0.04362 0.20195 0.00956 0.17990 98.67

i = 0.20195 1.62970 0.37073 0.60623 x 7.000.00956 0.37073 0.20071 0.01299 36.33

0.17990 0.60623 0.01299 2.05006 7.30

= [ 1,92 17.56 5.55 0.99 ]

Konstanta dapat dihitung :

a = (1/2) WiMj

98.67

7.30

= (1/2) [1.92 17.56 5.55 0.99] 7.00 = 137.83

36.33

Dengan cara yang sama akan dihasilkan koefisien fungsi diskriminan untuk

masingmasing kelompok sebagai berikut :

Tabel 7. Fungsi Diskriminan masingmasing Kelompok.

Kelompok1 Kelompok2 Kelompok3

PERF 1.92420 0.58704 1.36552

INFO 17.56221 8.69921 10.58700

VERBEXP 5.54585 4.11679 2.97278

AGE 0.98723 5.01749 2.91135

Konstanta 137.83 71.28563 71.24188

Persamaan fundamental untuk menguji sekumpulan fungsi diskriminan, miripdengan MANOVA. Varians pada kelompok prediktor dapat dipisahkan menjadi

dua sumber, yaitu : varians dalam kelompok (within group atau Swg) dan antarakelompok (between group atau Sbg). Melalui prosedur MANOVA, akan dibentuk

matriks crossproduct :

Σ Σ (Xij – GM)2 = n Σ (Xj – GM)2 + Σ Σ (Xij – Xj)2

i j j i j

Jumlah kuadrat selisih data terhadap ratarata total (GM) dipisahkan menjadi

dua kelompok varians :

Stotal = Sbg + Swg


DISKRIMINAN.doc

Kamarul Imam

[email protected]

S

:Matriks varians antar kelompok, Sbg

314.89 71.56 180.00 14.49

bg = 71.56 32.89 8.00 2.22

180.00 8.00 168.00 10.4014.49 2.22 10.40 0.74

:

S

Matriks varians dalam kelompok, Swg

1286.00 220.00 348.33 50.00

wg = 220.00 45.33 73.67 6.37348.33 73.67 150.00 9.73

50.00 6.37 9.73 5.49

S

Determinan matriks ini adalah :

wg = 4.70034789 x 1013

= 448.63489 x 1013Sbg + Swg

Wilk’s Lambda (Λ) untuk matriks ini :

Swg

Λ = = 0.10477

Sbg + Swg

F

Hitung nilaiF untuk menguji kemampuan prediksi fungsi diskriminan dengan formula

sebagai berikut :

1 – y df2

df1,df2 =

y df1di mana,

y = Λ1/s

2p (dfeffect)2 4

s = √ 2

df

p + (deffect)2 – 5

p = banyaknya variabel independen.

effect = adalah derajat bebas perlakuan yang diuji = (k – 1)

df1 =

df

df

df

p – dfeffect + 1 p(dfeffect) 2

df2 = s )

p(dfeffect) dan

(dferror – 2 2

di mana,

error = adalah derajat bebas yang berkaitan dengan error = (N k)

Untuk contoh kasus di atas, nilainilai :

p = banyaknya variabel independen = 4

effect = banyaknya kelompok dikurangi 1 = 3 1 = 2

error = banyaknya seluruh pengamatan dikurangi banyaknya kelompok = 9 3 = 6.

Dari nilainilai parameter ini dapat dihitung s :

(4)2 (2)2 4

s = √ = 2

(4)2 + (2)2 – 5


DISKRIMINAN.doc

Kamarul Imam

[email protected]

y = Λ1/s = (0.010477)1/2 = 0.102357

df1 = p(df

effect) = (4)(2) = 8

4 – 2 + 1

df2 = 2 6

2

(4)(2) 2

= 6

2

1 – 0.102357 6F8,6 = = 6.58

0.102357 8

Kriteria nilai F pada Tabel F dengan df 8, 6 dan α = 0.05 adalah sama dengan 4.15.

Nilai Fhitung > Fkriteria, maka dapat disimpulkan bahwa ketiga kelompok belajardapat dibedakan dari kombinasi keempat variabel bebasnya. Ini merupakan uji

hipotesis secara keseluruhan mengenai hubungan kelompok dengan variabelvariabelbebas.

Untuk menentukan tingkat korelasi antara fungsi dengan variabelvariabel bebas

dapat dihitung dari loading factor. Jika X1, X2 dan X3 memiliki korelasi yang tinggidengan fungsi, kecuali X4 dan X5 tidak; maka peneliti mencoba untuk memahami

seberapa jauh masingmasing X1, X2 dan X3 memiliki arti penting dalam fungsi danbagaimana saling berinteraksi. Secara matematik, loading factor dapat dihitung

dengan formulasi :

λλλλ = RwD

R

di mana,

λλλλ = matriks loading factor,

w = matriks korelasi antara variabel bebas,

D = matriks koefisien fungsi diskriminan yang distandardisasi.

Loading factor ini lebih menjelaskan dominasi variabel bebas terhadap kemampuan

fungsi untuk mengklasifikasi kelompok yang diamati.

d.2 Signifikansi statistik.

Beberapa ukuran signifikansi statistik yang tersedia untuk Analisis Diskriminan

adalah : (1) Wilk’s lambda, (2) Hotelling’s trace, (3) Mahalanobi’s D2, (4) Rao’sV, dan (5) Pillai’s criterion.

Jika metode stepwise yang digunakan untuk mengestimasi fungsi, maka ukuran

Mahalanobi’s D2 dan Rao’s V lebih tepat digunakan sebagai uji signifikansi fungsi.Keduanya mengukur jarak yang digeneralisasi. Prosedur pengukuran jarak

Mahalanobi didasari pada kuadrat jarak Euclidean yang digeneralisasi danmenyesuaikan varians yang tidak setara. Keunggulan utama prosedur uji ini

adalah : D2 diukur dalam ruang original variabel bebas. Kelemahan ukuran D2

untuk uji signifikansi fungsi adalah : ukuran ini menjadi kritis dengan variabel

bebas yang bertambah banyak, karena ukuran itu tidak dihasilkan pada setiap

pengurangan dimensi. Kehilangan dimensionalitas akan mengurangi informasikarena hal itu mengurangi variabilitas variabel independen. Secara umum, D2

lebih disarankan dipakai jika peneliti menginginkan pemanfaatan maksimal dariinformasi yang ada.

Untuk banyaknya kelompok lebih dari dua, maka peneliti harus menguji juga

signifikansi setiap fungsi antar kelompok, tidak hanya uji signifikansi fungsisecara total. Program komputer menghasilkan seluruh informasi yang


DISKRIMINAN.doc

Kamarul Imam

[email protected]

dibutuhkan untuk menentukan banyaknya fungsi yang dibutuhkan untukmenghasilkan signifikansi total, tanpa melibatkan fungsi yang tidak

meningkatkan kemampuan mendiskriminasi secara total. Jika sebuah fungsi atau

lebih diperkirakan tidak signifikan, model diskriminan akan diestimasi ulangdengan banyaknya fungsi yang akan diturunkan terbatas hanya kepada fungsi

yang signifikan saja.

d.3 Menguji kecocokan model secara keseluruhan.

Sekali fungsi diskriminan telah teruji signifikansinya, maka perlu dilakukan ujikecocokan model secara keseluruhan. Uji ini terdiri atas tiga hal, yaitu : (1)

menghitung Zskor untuk setiap pengamatan, (2) mengevaluasi selisih Zskor

kelompok dan (3) mengevaluasi tingkat akurasi prediksi fungsi kepada setiappengamatan individual.

(1) Menghitung Zskor.Nilai Z dihitung dari fungsi diskriminan eksplisit yang dihasilkan dari fungsi

implisit :

Zjk = a + W1 X1k + W2 X2k + . . . + Wn Xnk

Di mana,

Zjk = Zskor diskriminan fungsij untuk pengamatank,a = intercept,

XWi = koefisien diskriminan untuk variabel bebasi,

ik = variabel bebasi untuk pengamatank.

Skor ini bersifat metrik, memberikan arti langsung untuk membandingkan

pengamatanpengamatan pada setiap fungsi. Pengamatan dengan Zskoryang sama diasumsi lebih dianggap sebagai variabel yang membentuk fungsi

daripada perbedaan skor semata.

Fungsi eksplisit yang dihasilkan dalam dua bentuk, yaitu (a) standardizeddan (b) unstandardized. Fungsi standardized lebih bermanfaat untuk

menginterpretasikan hasil, sedang unstandarized digunakan untukmenghitung Zskor.

Perlu dicatat, bahwa fungsi diskriminan berbeda dengan fungsi klasifikasiatau yang disebut sebagai Fisher’s linear discriminant function. Fungsi

klasifikasi, satu untuk setiap kelompok, dapat digunakan untuk

mengklasifikasi pengamatan. Pada metode klasifikasi ini, sebuah nilaipengamatan untuk variabel bebas disisipkan ke dalam fungsi klasifikasi dan

sebuah skor klasifikasi untuk setiap kelompok dihitung untuk pengamatanyang bersangkutan. Pengamatan itu kemudian diklasifikasi ke dalam

kelompok yang memiliki skor klasifikasi tertinggi. Fungsi diskriminandigunakan sebagai ratarata klasifikasi karena fungsi itu memberikan

representasi yang sederhana dan konsisten pada setiap fungsi diskriminan,

menyederhanakan proses interpretasi dan memberi penilaian terhadapkontribusi variabelvariabel bebas.

(2) Evaluasi Perbedaan/Selisih Kelompok.

Peneliti dapat mengartikan bahwa menguji kecocokan model secara

keseluruhan adalah menentukan ukuran perbedaan antara anggota setiap

kelompok melalui Zskor. Intisari ukuran perbedaan kelompok adalahperbandingan cetroids kelompok, yaitu ratarata Zskor untuk seluruh

pengamatan anggota kelompok. Jarak antar centoids disebut sebagai jarak


DISKRIMINAN.doc

Kamarul Imam

[email protected]

Mahalanobi, D2. Peneliti harus yakin bahwa fungsi diskriminan yangsignifikan akan memberikan jarak centroids signifikan.

Centroids kelompok pada setiap fungsi diskriminan dapat diploting untuk bisa

lebih memperlihatkan hasil ditinjau dari prespektif global. Plot biasanyadisiapkan untuk fungsi diskriminan kesatu, kedua atau ketiga (dengan

asumsi fungsifungsi tersebut signifikan dapat memprediksi kelompok secaravalid).

(3) Evaluasi Tingkat Akurasi Klasifikasi Fungsi.

Dengan variabel dependen yang bersifat non metrik, maka penggunaan R2

tidak dapat dilakukan sebagai ukuran akurasi model. Untuk mengukur

akurasi fungsi melalui ketepatan prediksi anggota kelompok ke dalamkelompok awalnya (correctly classification, atau CC). Untuk itu, beberapa hal

perlu dilakukan, yaitu : kembangkan matriks klasifikasi, tentukan Zcutoff, danstandard atau kriteria klasifikasi.

Z

CC mirip dengan R2 pada Analisis Regresi, dan D2 (dengan uji χ2) sama

dengan Fratio.

cutoff sebagai skor Z yang dipakai sebagai batas pemisahan antar kelompokdihitung dengan formula :

ZZA + ZB

CE =

2

Z

Z

ZCE = Zcutoff untuk kelompok dengan ukuran pengamatan yang sama,

A = cetroids kelompok A,

B = cetroids kelompok B.

Untuk ukuran pengamatan yang tidak sama, Zcutoff dihitung dengan formula :

N

ZNA ZB + NB ZA

CU =

A + NB

N

N

ZCU = Zcutoff untuk kelompok dengan ukuran pengamatan tidak sama,

A = ukuran pengamatan untuk kelompok A,

B = ukuran pengamatan untuk kelompok B.

Ukuranukuran ini menjadi optimal dengan asumsi bahwa kelompok

berdistribusi normal dan struktur dispersi kelompok diketahui.

ZCE

ZA ZB

Kelompok A Kelompok B


DISKRIMINAN.doc

Kamarul Imam

[email protected]

Z

ZA ZB

CU

Kelompok B

Kelompok A

Kriteria klasifikasi adalah dengan membandingkan Zskor setiap pengamatan

individual pada kelompok dengan Zcutoff. klasifikasikan pengamatan ke dalam kelompok A, jika Zskor < Zcutoff,

klasifikasikan pengamatan ke dalam kelompok B, jika Zskor > Zcutoff.

Contoh hasil prosedur klasifikasi dapat ditunjukkan dalam matriks berikut :

Tabel 7. Matriks Klasifikasi Untuk Analisis Diskriminan Dua Kelompok.

Kelompok Aktual

1

2

Prediksi Anggota

Kelompok

Prediksi Kelompok

1 2

22 3

5 20

27 23

Anggota KelompokAktual

25

25

50

% CC

88

80

84*

Keterangan :

% CC = (jumlah klasifikasi benar/total pengamatan) x 100%.

= (22 + 20)/50 x 100% = 84%.

Selanjutnya lakukan uji signifikansi terhadap persentase CC dengan ujit :

untuk ukuran pengamatan dalam kelompok yang sama maupun tidak

sama :

p – 0.5

t =√{(0.5)(1.0 – 0.5)/N}

di mana,

N =ukuran sampel keseluruhan,

p = proporsi klasifikasi benar.

Pertanyaan yang timbul kemudian adalah : berapa kriteria CC atau hit ratio(C) yang dianggap cukup memadai tingkat akurasi prediksi fungsidiskriminan ? 60%, 75% atau 90% ? Untuk menjawab pertanyaan ini,

peneliti secara awal harus menentukan kemungkinan persentase yang akandiklasifikasi dengan benar, tanpa bantuan fungsi diskriminan. Jika ukuran

sampel pada tiap kelompok sama banyak, penentuan kemungkinan

kebenaran klasifikasi : C = 1/banyaknya kelompok. Untuk dua kelompok, C= 50%, untuk tiga kelompok, C = 33,33% dan seterusnya.

Untuk ukuran sampel pada tiap kelompok tidak sama, penentuan C dapatdilakukan dengan pendekatan maximum chance criterion, yaitu mengacu

kepada kelompok dengan ukuran sampel terbesar. Contoh, jika kelompok1

= 75 sampel dan kelompok2 = 25 sampel, maka C = 75%.


DISKRIMINAN.doc

Kamarul Imam

[email protected]

Pendekatan lain untuk menentukan C adalah proportional chance criterion :

CPRO = p2 + (1 – p)2

Di mana,

p = proprosi sampel pada kelompok1,

1 – p = proporsi sampel pada kelompok2.

Contoh, untuk sampel kelompok1 = 75 dan kelompok2 = 25, maka C =(75%)2 + (25%)2 = 62.50%.

Pendekatan penentuan C dengan berbagai pendekatan menjadi berarti, jikapeneliti menggunakan holdout sample (splitsample approach). Jika CC lebih

kecil daripada C, walaupun signifikan, maka fungsi diskriminan eksplisit yang

dihasilkan menjadi kurang dapat diinterpretasikan. Ada suatu konvensi paraahli yang menyatakan bahwa CC > 1.25 kali lebih besar daripada C.

Ukuran statistik untuk mengukur kemampuan mendiskriminasi dari matriksklasifikasi adalah Press’s Q Statistic. Ukuran ini membandingkan jumlah

sampel yang diklasifikasi secara benar dengan total sampel dan banyaknya

kelompok. Formula untuk Press’s Q Statistic adalah :

[ N – nK]2

Press’s Q =N( k 1)

Di mana,

N = ukuran total sampel,

n = banyaknya sampel yang diklasifikasi dengan benar,

K = banyaknya kelompok.

Press’s Q Statistic diuji signifikansinya dengan ujiχ2 pada α tertentu dengan

degree of freedom = 1. Jika Press’s Q Statistic > χ2α,df, maka CC hasil

perhitungan memang berbeda dengan C.

Casewise Diagnostic.

Untuk memperoleh kecocokan model dalam memprediksi, bisa dilakukan denganmenghitung hasil prediksi selangkah demi selangkah. Langkah ini dimaksudkan

untuk : (1) mengetahui pengamatan yang salah diklasifikasi, dan (2) untukpengamatan yang tidak representatif pada sisa pengamatan dalam kelompok.

Walaupun fungsi diskriminan menghasilkan matriks klasifikasi yang menjelaskan

akurasi klasifikasi secara keseluruhan, tetapi tidak menghasilkan detil klasifikasikepada pengamatan individual.

Mencari kesalahan klasifikasi pada pengamatan individual perlu dilakukan untukmengidentifikasi karakteristik apakah yang ada pada pengamatan individual

tersebut yang tidak memberi kontribusi positif terhadap akurasi kemampuanklasifikasi fungsi yang dihasilkan. Analisis dapat dilakukan kepada pengamatan

individual yang salah diklasifikasi maupun kepada variabelvariabel bebas yang

tidak dimasukkan ke dalam model.

e. Tahap 5 : Interpretasi Hasil.

Setelah fungsi diskriminan eksplisit diperoleh dan akurasi klasifikasi terbukti tinggisecara statistik, maka selanjutnya peneliti dapat melakukan interpretasi hasil. Proses

ini merupakan tahap bagaimana menjelaskan peringkat urgensi relatif masing

masing variabel bebas dalam mendiskriminasi kelompok. Ada tiga pendekatanmetode yang dapat digunakan, yaitu : (1) melalui perbandingan standardized


DISKRIMINAN.doc

Kamarul Imam

[email protected]

coefficients diskriminan, (2) discriminant loadings (korelasi struktur) dan (3) partialFvalue.

(1) Standardized discriminant coefficients.

Ini merupakan pendekatan tradisional untuk menginterpretasi hasil analisis. Jikatanda matematik koefisien diskriminan diabaikan, maka nilai koefisien

merupakan kontribusi relatif masingmasing variabel bebas terhadap fungsi.Variabel independen dengan koefisien yang lebih besar dapat dijelaskan bahwa

variabel tersebut lebih besar kontribusinya dalam mendiskriminasi kelompok.Tanda matematik hanya menjelaskan kontribusi positif atau negatif.

(2) Discriminant loadings.

Bertahuntahun yang lalu, discriminant loadings digunakan sebagai basis untukmenginterpretasi hasil, karena memperbandingkan standardized discriminantcoefficients kadangkadang masih mengandung kelemahan yang disebabkanadanya multikolinieritas. Discriminant loadings merupakan korelasi linier

struktural antara masingmasing variabel bebas dengan fungsi diskriminan.

Discriminant loadings merefleksikan variansi tingkat sumbangan relatif variabelindependen terhadap fungsi diskriminan dan bisa diinterpretasi seperti factorloadings dalam menilai sumbangan relatif masingmasing variabel independenterhadap fungsi diskriminan. Discriminant loadings dianggap lebih valid daripada

standardized discriminant coefficients dalam mengartikan kemampuanmendiskriminasi masingmasing variabel independen karena sifat korelatifnya.

Walupun demikian, peneliti tetap harus berhatihati dalam menggunakan

pendekatan ini untuk menginterpretasi hasil.

(3) Partial Fvalue.

Seperti telah dinyatakan di atas, ada dua pendekatan teknik komputasi, yaitu :simultan dan stepwise. Jika peneliti menggunakan metode stepwise, maka

tersedia informasi tambahan yang bisa diinterpretasikan tentang kemampuan

mendiskriminasi setiap variabel independen, melalui nilai F parsial. Makin besarnilai F parsial, makin besar pula kemampuan mendsikriminasi variabel

independen yang bersangkutan. Secara umum, perbandingan nilai F parsial inisama dengan memperbandingkan standardized discriminant coefficients, namun

perbandingan ini telah lebih terbatas kepada koefisienkoefisien diskriminan

yang signifikan.

Dalam menginterpretasi dua fungsi diskriminan atau lebih, seringkali ditemui

persoalan, yaitu : (1) apakah peneliti dapat menyederhanakan koefisien diskriminanuntuk memberikan profil kepada setiap fungsi ? (2) bagaimana peneliti dapat

menjelaskan pengaruh silang variabel bebas pada fungsifungsi diskriminan yangdihasilkan ? Untuk menjawab persoalan itu, ada tiga teknik yang bisa digunakan,

yaitu : (1) teknik rotasi fungsi, (2) teknik potency index dan (3) teknik grafis untuk

koefisien diskriminan.

(1) Teknik rotasi fungsi diskriminan.

Rotasi fungsi ditujukan untuk melakukan distribusi ulang varians. Teknik rotasiyang lebih sering digunakan adalah VARIMAX atau disebut sebagai rotasi

orthogonal (dengan sumbusumbu yang tetap 90o, saling tegak lurus) daripada

rotasi oblique (sumbusumbu tidak harus saling tegak lurus), seperti VARTIMAX,EQUIMAX3. Dengan rotasi ini, maka nilai koefisien diskriminan yang tidak terlalu

3 SPSS memberikan rotasi OBLIMIN, SAS memberikan PROMAX dan ORTHOBLIQUE.


DISKRIMINAN.doc

Kamarul Imam

[email protected]

berbeda dengan lainnya akan menjadi signifikan perbedaannya, sehinggainterpretasinya bisa lebih tajam.

(2) Teknik potency index.

Potency index merupakan ukuran relatif kemampuan mendiskriminasi untukseluruh variabel independen pada seluruh fungsi diskriminan yang dihasilkan.

Ukuran ini mengindikasikan dua hal, yaitu : (a) kontribusi setiap variabelindependen (discriminant loadings) dan (b) eigenvalue relatif di antara fungsi

fungsi. Walaupun potency index terhitung, namun ini sekedar rank kontribusimasingmasing variabel independen saja.

Prosedur menghitung potency index adalah :

Langkah1 : hitung nilai potensi fungsi diskriminan yang signifikan. Nilai potensi

PI

PI

dapat dihitung dengan formula :

ij = (Discriminant Loadingij)2 x relative eigenvalue fungsij.

Di mana,

ij = potency index variabel independeni pada fungsij.

Relative eigenvalue fungsij (REVj) dihitung dengan formula :

Eigenvalue of discriminant functionjREVj =

Sum of eigenvalues across all significant functions

Langkah2 : hitung potency index komposit seluruh fungsi signifikan.

Sekali potency value (langkah1) telah terhitung untuk setiap fungsi, potencyindex komposit dapat dihitung sebagai jumlah potency value dari setiap fungsi

diskriminan signifikan. Potency index merepresentasikan total efek pendiskriminasian dari variabel pada seluruh fungsi diskriminan signifikan. Walaupun

ini merupakan ukuran relatif, namun nilai absolutnya tidak memberikan artiyang substantif.

(3) Teknik grafis discriminant loadings.

Untuk menggambarkan perbedaanperbedaan dalam kelompok variabelprediktor, peneliti dapat membuat plot discriminant loading. Pendekatan yang

paling sederhana adalah memplotting loadings yang telah dirotasi aktual atauloadings yang tidak dirotasi dalam sebuah grafik. Tetapi disarankan, plotting

loadings yang telah dirotasi. Teknik yang lebih akurat adalah teknik yang

melibatkan stretching the vectors. Yang dimaksud vectors dalam hal ini adalahsebuah garis lurus yang ditarik dari titik origin dari sebuah grafik menuju ke titik

koordinat loading variabel tertentu. Panjang setiap vektor mengindikasikantingkat kepentingan relatif setiap variabel dalam mendiskriminasi dalam

kelompok. Untuk memperbesar (stretching) vektor, dapat mengkalikandiscriminant loading (disarankan setelah dirotasi) dengan nilaiF univariat yang

berkaitan.

Proses plotting selalu melibatkan seluruh variabel signifikan yang masuk dalammodel. Bisa juga dilakukan plotting variabel lain yang memiliki nilaiF univairat

signifikan walaupun tidak signifikan dalam model. Prosedur ini menunjukkanpentingnya variabel kolinier yang tidak masuk ke dalam model, seperti pada

teknik stepwise. Melalui penggunaan prosedur ini dapat dicatat bahwa titik

vektor menuju ke kelompok memiliki ratarata skor tertinggi pada prediktor yangterkait dan jauh dari kelompok yang memiliki ratarata skor terendah. Centroidkelompok bisa diperbesar dengan prosedur ini dengan mengkalikannya kepada


DISKRIMINAN.doc

Kamarul Imam

[email protected]

nilaiF univariat yang berkaitan dengan setiap fungsi diskriminan yangdihasilkan. Jika loadings diperbesar, maka centroid kelompok juga harus

diperbesar agar bisa memplotting dengan akurat pada grafik yang sama.

Aproksimasi nilaiF untuk setiap fungsi diskriminan diperoleh denganmenggunakan formula berikut :

Fvalueestimation sample size – no. of groups

functioni = eigenvaluefunctioni

No. of groups – 1

Sebagai contoh, sampel = 50 yang dibagi dalam tiga kelompok. Multiplier setiap

eigenvalue adalah = (50 – 3)/(3 1) = 23.5.4

Sebuah alternatif untuk memperbesar vektor dan centroids adalah denganmembuat “territorial map” (fasilitas ini pada Program SPSS), yang memplot

centroids dan batas untuk setiap kelompok.

f. Tahap6 : Validasi Hasil.

Tahap terakhir adalah mevalidasi hasil untuk menjamin hasil diskriminan memiliki

validasai internal maupun eksternal. Dengan adanya kecenderungan dari analisisdiskriminan yang akan meningkatkan hit ratio jika dievaluasi hanya melalui analisis

sampel saja, maka crossvalidation merupakan langkah yang cukup penting.Seringkali crossvalidation telah dilakukan dengan sampel orisinal, tetapi hal itu

memungkinkan untuk menambah tambahan sampel sebagai sampel cadangan (holdout). Sebagai tambahan kepada crossvalidation, biasanya peneliti akan

menggunakan sampel tambahan/cadangan yang tidak dilibatkan pada saat

mengestimasi koefisien diskriminan untuk menyakinkan bahwa ratarata kelompokmerupakan indikator yang valid dari konseptual model dalam memilih variabel

variabel independennya.

4. Statistik Untuk Analisis Diskriminan.

Statistik yang penting dan berkaitan dengan analisis diskriminan adalah :

a. Canonical Correlation.

Canonical correlation merupakan ukuran tingkat hubungan antara skor diskriminan

dengan kelompok. Ini mengukur hubungan antara fungsi diskriminan tunggal dengansekelompok variabel dummy yang mendefinisikan keanggotaan kelompok.

b. Centroid.

Centroid adalah ratarata skor diskriminan dari suatu kelompok tertentu. Ada sejumlahnilai centroid sesuai dengan jumlah kelompok.

c. Classification Matrix.

Matriks ini sering disebut juga sebagai confusion atau prediction matrix. Matriks ini

menunjukkan jumlah observasi yang diklasifikasi secara benar dan tidak benar.Klasifikasi observasi yang benar muncul pada diagonal matriks, karena kelompok yang

diprediksi sama dengan kelompok aktual. Elemen matriks di luar diagonal menjelaskan

klasifikasi observasi yang tidak benar. Jumlah elemen diagonal dibagi dengan banyaknyaobservasi disebut sebagai hit ratio.

Lihat Dillon dan Goldstein.


DISKRIMINAN.doc

4

Kamarul Imam

[email protected]

d. Discriminant Function Coefficients.

Koefisien fungsi diskriminan (unstandardized) adalah multiplier dari masingmasing

variabel di mana nilai variabel tersebut dalam ukuran satuan yang orisinal.

e. Discriminant Score.

Koefisien diskriminan yang unstandardized dikalikan dengan nilai masingmasing

variabel. Hasilnya dijumlahkankan dengan konstanta untuk menghasilkan skordiskriminan.

f. Eigenvalue.

Untuk setiap fungsi diskriminan, eigenvalue merupakan ratio jumlah kuadrat antar

kelompok dengan jumlah kudrat dalam kelompok. Eigenvalue yang besar menunjukkan

fungsi superior.

g. Fvalues and their significance.

Ini dihitung dengan oneway ANOVA, dengan pengelompokan variabel yang berperansebagai variabel independen katagorial. Selanjutnya, setiap prediktor diperankan sebagai

variabel dependen yang bersifat metrik dalam tabel ANOVA.

h. Group Means and Group Standard Deviations.

Ukuranukuran ini dihitung untuk setiap prediktor pada setiap kelompok.

i. Pooled withingroup Correlation Matrix.

The pooled withingroup correlation matrix dihitung dengan meratarata matriks

kovarians yang terpisah untuk seluruh kelompok.

j. Standardized Discriminant Function Coefficients.

Koefisien fungsi diskriminan terstandard digunakan sebagai bilangan pengali variabel

variabel yang telah distandardisasi sebagai variabel dengan nilai ratarata = 0 danvarians = 1.

k. Structure Correlations.

Juga disebut sebagai discriminant loadings, merupakan korelasi struktural

menggambarkan korelasi sederhana antar variabel prediktor dan fungsi diskriminan.

l. Total Correlation Matrix.

Merupakan ukuran korelasi seluruh sampel tanpa memperhatikan dari kelompok mana ia

berasal.

m. Wilk’s λλλλ.

Kadangkadang disebut juga sebagai Ustatistic. Wilk’s λ untuk setiap prediktor

merupakan ratio withingroup sum of squares kepada total sum of squares. Nilainya

berkisar antara 0 dan 1. Makin besar nilai λ (mendekati 1) mengindikasikan bahwa rata

rata kelompokkelompok tampak dianggap tidak berbeda; sebaliknya makin kecil nilai λ

(mendekati 0), mengindikasikan bahwa ratarata kelompok dianggap berbeda.


DISKRIMINAN.doc

Kamarul Imam

[email protected]

5. Contoh Lain : Kunjungan Liburan.

Sebuah penelitian yang bermaksud mengetahui perbedaan karakteristik rumah tangga yang

mengunjungi daerah wisata tertentu dalam dua tahun terakhir dengan keluarga yang tidak

mengunjungi daerah wisata tersebut dalam dua tahun terakhir. Data dikumpulkan dari 42buah rumah tangga, di mana 30 buah rumah tangga sebagai sampel yang dianalisis, sedang

sisanya, 12 buah rumah tangga sebagai sampel cadangan (hold out) untuk validasi modelyang dihasilkan.

Data dari 30 buah sampel keluarga yang dianalisis adalah :

No.Kunjungan

Wisata

Pendapatan

Keluarga/th

Sikap

TerhadapPerjalanan

Pentingnya

BagiKeluarga

Jumlah

AnggotaKeluarga

Usia

KepalaKeluarga

Jumlah

PengeluaranWisata

1 1 50.2 5 8 3 43 2

2 1 70.3 6 7 4 61 3

3 1 62.9 7 5 6 52 3

4 1 48.5 7 5 5 36 1

5 1 52.7 6 6 4 55 3

6 1 75.0 8 7 5 68 3

7 1 46.2 5 3 3 62 2

8 1 57.0 2 4 6 51 2

9 1 64.1 7 5 4 57 3

10 1 68.1 7 6 5 45 3

11 1 73.4 6 7 5 44 3

12 1 71.9 5 8 4 64 3

13 1 56.2 1 8 6 54 2

14 1 49.3 4 2 3 56 3

15 1 62.0 5 6 2 58 3

16 2 32.1 5 4 3 58 1

17 2 36.2 4 3 2 55 1

18 2 43.2 2 5 2 57 2

19 2 50.4 5 2 4 37 2

20 2 44.1 6 6 3 42 2

21 2 38.3 6 6 2 45 1

22 2 55.0 1 2 2 57 2

23 2 46.1 3 5 3 51 1

24 2 35.0 6 4 5 64 1

25 2 37.3 2 7 4 54 1

26 2 41.8 5 1 3 56 2

27 2 57.0 8 3 2 36 2

28 2 33.4 6 8 2 50 1

29 2 37.5 3 2 3 48 1

30 2 41.3 3 3 2 42 1


DISKRIMINAN.doc

Kamarul Imam

[email protected]

Keterangan : Kunjungan wisata = 1, untuk keluarga yang mengunjungi obyek wisata tertentu dalam

dua tahun terakhir, = 2 untuk keluarga yang tidak mengunjungi obyek wisata dalam dua

tahun terakhir. Pendapatan keluarga/tahun dalam ribuan dollar.

Sikap terhadap perjalanan (skor 1 sampai 9, sangat tidak suka – sangat menyukai). Pentingnya bagi keluarga (skor 1 sampai 9, sangat tidak penting – sangat penting).

Jumlah anggota keluarga (dalam satuan orang). Usia kepala keluarga (dalam satuan tahun).

Jumlah pengeluaran untuk wisata (1 = rendah, 2 = moderat, dan 3 = tinggi).

Hasil analisis dengan SPSS Version 12.00 adalah sebagai berikut :

Discriminant Analysis Case Processing Summary

N

0

0

0

0

Unweighted Cases Percent

Valid 30 100,0

Missing or out-of-range group codes ,0

At least one missing discriminating variable

,0

Both missing or out-of-range group codes and at least one missing discriminating variable

,0

Excluded

Total ,0

Total 30 100,0

Group Statistics

Visit Mean Std. Deviation Valid N (listwise)

Unweighted Weighted

1 Income 60,520 9,8307 15 15

Attitude 5,400 1,9198 15 15

Importance

Hsize

5,800

4,333

1,8205

1,2344

15

15

15

15

Age 53,733 8,7706 15 15

2 Income 41,913 7,5511 15 15

Attitude

Importance

4,333

4,067

1,9518

2,0517

15

15

15

15

Hsize 2,800 ,9411 15 15

Age 50,133 8,2710 15 15

Total Income 51,217 12,7952 30 30

Attitude

Importance

4,867

4,933

1,9780

2,0998

30

30

30

30

Hsize 3,567 1,3309 30 30

Age 51,933 8,5740 30 30


DISKRIMINAN.doc

Kamarul Imam

[email protected]

Keterangan :Kode Visit = 1 (keluarga yang melakukan perjalanan ke obyek wisata dalam dua tahun

terakhir).

Mean = ratarata income = 60,520Std. Deviation = standard deviasi income = 9,8307, dst.

Kode visit = 2 (keluarga yang tidak melakukan perjalanan ke obyek wisata dalam dua tahunterakhir).

Mean = ratarata income = 41,913Std. Deviation = standard deviasi income = 7,5511, dst.

Total adalah ratarata dan standard deviasi keseluruhan data.

Pooled Within-Groups Matricesa

Income Attitude Importance Hsize Age

Covariance Income 76,831 3,350 1,555 ,855 -1,070

Attitude 3,350 3,748 ,317 -,036 -3,252

Importance

Hsize

1,555

,855

,317

-,036

3,762

,150

,150

1,205

,288

-,402

Age -1,070 -3,252 ,288 -,402 72,667

Correlation Income

Attitude

Importance

1,000

,197

,091

,197

1,000

,084

,091

,084

1,000

,089

-,017

,070

-,014

-,197

,017

Hsize

Age

,089

-,014

-,017

-,197

,070

,017

1,000

-,043

-,043

1,000 a

The covariance matrix has 28 degrees of freedom.

Keterangan :

Matriks korelasi dalam kelompok gabungan dihitung dengan meratarata matriks kovarians

yang terpisah untuk seluruh kelompok.

Analysis 1

Summary of Canonical Discriminant Functions

Eigenvalues

Function Eigenvalue % of Variance Cumulative % Canonical Correlation

1 1,786a

100,0 100,0 ,801 a

First 1 canonical discriminant functions were used in the analysis.

Keterangan :

Canonical correlation = 0,801 atau 80,10% merupakan ukuran tingkat hubungan antara skordiskriminan dengan kelompok. Analog dengan R2 pada Analisis Regresi.

Wilks' Lambda

Test of Function(s) Wilks'

Lambda Chi-square df Sig.

1 ,359 26,130 5 ,000

Keterangan :

Wilk’s λ = 0,359 dan signifikan pada α = 0,000 dengan uji χ2 = 26,130. Menunjukkan bahwa

perbedaan ratarata kelompok (centroid) keluarga1 dan keluarga2 berbeda secara

signifikan.


DISKRIMINAN.doc

Kamarul Imam

[email protected]

Standardized Canonical Discriminant Function Coefficients

Function

1

Income

Attitude

Importance

Hsize

Age

,743

,096

,233

,469

,209

Z

Keterangan :

Fungsi diskriminan yang dihasilkan dalam bentuk standardized coefficient adalah :

jk = 0,743 X1k + 0,096 X2k + 0,233 X3k + 0,469 X4k + 0,209 X5k

Di mana,

X1 = family income,X2 = attitude,

X3 = vacation importance,X4 = household size,

X5 = age of head of household.

Structure Matrix

Function

1

Income

Hsize

Importance

Attitude

Age

,822

,541

,346

,213

,164

Pooled within-groups correlations between discriminating variables and standardized canonical discriminant functions Variables ordered by absolute size of correlation within function.

Canonical Discriminant Function Coefficients

Function

1

Income

Attitude

Importance

Hsize

Age

(Constant)

,085

,050

,120

,427

,025

-7,975

Unstandardized coefficients

Z

Keterangan :

Fungsi diskriminan yang dihasilkan dalam bentuk unstandardized coefficient adalah :

jk = 7,975 + 0,085 X1k + 0,050 X2k + 0,120 X3k + 0,427 X4k + 0,025 X5k


DISKRIMINAN.doc

Kamarul Imam

[email protected]

Group covariances of canonical discriminant functions

1

1 1

2 1

Visit Function

1,291

-1,291

Unstandardized canonical discriminant functions Evaluated at group means.

Classification Statistics

Classification Processing Summary

0

0

Processed 30

Missing or out-of-range group codes

Excluded


Used in Output 30

Prior Probabilities for Groups

Visit Prior Cases Used in Analysis

Unweighted Weighted

1

2

Total

,500

,500

1,000

15

15

30

15,000

15,000

30,000

Classification Function Coefficients

Visit

1 2

Income

Attitude

Importance

Hsize

Age

(Constant)

,678

1,509

,938

3,322

,832

-57,532

,459

1,381

,628

2,218

,768

-36,936

Fisher's linear discriminant functions

Tests of Equality of Group Means

Wilks' Lambda F df1 df2 Sig.

Income ,453 33,796 1 28 ,000

Attitude ,925 2,277 1 28 ,143

Importance ,824 5,990 1 28 ,021

Hsize ,657 14,636 1 28 ,001

Age ,954 1,338 1 28 ,257

Keterangan :

Tiga variabel bebas merupakan variabel yang signifikan dalam mendiskriminasi, yaitu :income (sig. = 0,000), importance (sig. = 0,021) dan hsize (sig. = 0,001).


DISKRIMINAN.doc

Kamarul Imam

[email protected]

Classification Resultsa

Predicted Group Membership

Visit 1 2 Total

1 12 3 15Count

2 0 15 15

1 80,0 20,0 100,0

Original

%

2 ,0 100,0 100,0 a

90,0% of original grouped cases correctly classified.

Keterangan :

Persentase klasifikasi observasi ke dalam kelompok yang benar = 90,00%. Artinya observasi

dari kelompok1 diprediski sebagai kelompok1, dan observasi dari kelompok2 diprediksi

sebagai kelompok2 = (12 + 15)/30 = 0,9000 atau 90,00%.

Validasi model dengan menggunakan sampel cadangan yang tidak dilibatkan dalam

menghitung koefisien diskriminan (sebanyak 12 buah sampel holdout) dapat dilakukandengan menggunakan fungsi disklriminan dalam bentuk unstandardized coefficients.Territorial map yang dihasilkan dalam validasi ini adalah :

a. hitung Zscore setiap observasi dari sampel cadangan dengan fungsi unstandardized,

hasilnya adalah :

Visit aktual Zscore ZCE* Prediksi visit

1 0.211 0 2

1 2.625 0 1

1 0.913 0 1

1 0.639 0 2

1 2.537 0 1

1 0.9545 0 1

2 1.382 0 2

2 0.039 0 2

2 1.345 0 2

2 0.6 0 2

2 0.4265 0 2

2 1.882 0 2*

Z

Z

ZCE dihitung sebagai :

A + ZB 1,291 + (1,291)

CE = = = 02 2

b. bila Zscore > ZCE, maka observasi terebut diprediksi sebagai kelompok1,

c. bila Zscore < ZCE, maka observasi terebut diprediksi sebagai kelompok2.



Visit 1 2 Total

1 4 2 6Count

2 0 6 6

1 66,67 33,33 100,0

Original

%

2 ,0 100,0 100,0 a



DISKRIMINAN.doc

Kamarul Imam

[email protected]

Dari hasil validasi dengan sampel cadangan, tampak ada penurunan persentase klasifikasiobservasi kepada kelompoknya dengan benar, dari 90,00% menjadi 83,33%. Ini bisa

disebabkan karena ada dua variabel bebas yang tidak signifikan, yaitu : attitude dan age.

Maka beralasan sekali untuk membuat model dengan tiga variabel signifikan saja.

Jika kasus di atas dirubah topiknya, yaitu : apakah yang membedakan pengeluaran

keluarga untuk wisata (family spent) Model implisitnya adalah :

X

X

Z

Zjk = a + W1 X1k + W2 X2k + . . . + W5 X5k

Di mana,

jk = family spent for vacation dengan tiga katagori : 1 = low, 2 = moderat dan 3 = high,

1 = family income, X2 = attitude, X3 = vacation importance, X4 = household size, dan

5 = age of head of household.

Hasil SPSS untuk perubahan topik ini adalah :

Discriminant

N

0

0

0

0

Analysis Case Processing Summary

Unweighted Cases Percent

Valid 30 100,0

Excluded Missing or out-of-range group codes ,0

At least one missing discriminating variable ,0

Both missing or out-of-range group codes and at least one missing discriminating variable ,0

Total ,0

Total 30 100,0

Group Statistics

Spent Mean Std. Deviation Valid N (listwise)

Unweighted Weighted

1 Income 38,570 5,2972 10 10

Attitude 4,500 1,7159 10 10

Importance 4,700 1,8886 10 10

Hsize

Age

3,100

50,300

1,1972

8,0973

10

10

10

10

2 Income 50,110 6,0023 10 10

Attitude 4,000 2,3570 10 10

Importance

Hsize

4,200

3,400

2,4855

1,5055

10

10

10

10

Age 49,500 9,2526 10 10

3 Income 64,970 8,6143 10 10

Attitude 6,100 1,1972 10 10

Importance

Hsize

5,900

4,200

1,6633

1,1353

10

10

10

10

Age 56,000 7,6012 10 10

Total Income 51,217 12,7952 30 30

Attitude 4,867 1,9780 30 30

Importance

Hsize

4,933

3,567

2,0998

1,3309

30

30

30

30

Age 51,933 8,5740 30 30


DISKRIMINAN.doc

Kamarul Imam

[email protected]

Tests of Equality of Group Means

Wilks' Lambda F df1 df2 Sig.

Income ,262 37,997 2 27 ,000

Attitude ,788 3,634 2 27 ,040

Importance ,881 1,830 2 27 ,180

Hsize ,874 1,944 2 27 ,163

Age ,882 1,804 2 27 ,184

Keterangan :

Pada α = 0,05; tampak hanya dua buah variabel saja yang signifikan dalam mendiskriminasi,

yaitu income (sig. = 0,000) dan attitude (sig. = 0,040).

Pooled Within-Groups Matrices

Income Attitude Importance Hsize Age

Correlation Income

Attitude

Importance

Hsize

Age

1,000

,051

,307

,380

-,209

,051

1,000

,036

,005

-,340

,307

,036

1,000

,221

-,013

,380

,005

,221

1,000

-,025

-,209

-,340

-,013

-,025

1,000

Analysis 1

Summary of Canonical Discriminant Functions

Eigenvalues

Function Eigenvalue % of Variance Cumulative % Canonical Correlation

1

2

3,819a

,247a

93,9

6,1

93,9

100,0

,890

,445 a

First 2 canonical discriminant functions were used in the analysis.

Keterangan :

Hanya dua buah fungsi diskriminan signifikan yang diperoleh, yaitu fungsi1 dan fungsi2.Perbandingan eigenvalue, menunjukkan bahwa fungsi1 lebih superior dibanding fungsi2.

Wilks' Lambda

Test of Function(s) Wilks'

Lambda Chi-square Df Sig.

1 through 2

2

,166

,802

44,831

5,517

10

4

,000

,238

Keterangan :

Fungsi1 memiliki Wilk’s λ = 0,166 dengan probabilitas sig. = 0,000 mengindikasikan bahwa

centroid kelompok1 dan kelompok2 memang berbeda. Sedang fungsi2 memiliki Wilk’s λ =

0,802 dengan probabilitas sig. = 0,238, ini mengindikasikan bahwa centroid kelompok2

tidak berbeda dengan kelompok3.

Dapat disimpulkan bahwa hanya ada dua kelompok saja yang benarbenar berbeda, yaitu

kelompok keluarga dengan pengeluaran (spent) = 1 dan spent = 2.


DISKRIMINAN.doc

Kamarul Imam

[email protected]

Standardized Canonical Discriminant Function Coefficients

Function

1 2

Income

Attitude

Importance

Hsize

Age

1,047

,340

-,142

-,163

,495

-,421

,769

,534

,129

,524

Structure Matrix

Function

1 2

Income

Hsize

Attitude

Importance

Age

,856 *

,193 *

,219

,149

,166

-,278

,077

,588 *

,454 *

,341 *

Pooled within-groups correlations between discriminating variables and standardized canonical discriminant functions Variables ordered by absolute size of correlation within function. *

Largest absolute correlation between each variable and any discriminant function

Canonical Discriminant Function Coefficients

Function

1 2

Income

Attitude

Importance

Hsize

Age

(Constant)

,154

,187

-,070

-,127

,059

-11,094

-,062

,422

,261

,100

,063

-3,792

Unstandardized coefficients

Functions at Group Centroids

Spent

Function

1 2

1

2

3

-2,041

-,405

2,446

,418

-,659

,240

Unstandardized canonical discriminant functions evaluated at group means


DISKRIMINAN.doc

Kamarul Imam

[email protected]

Classification Statistics

Classification Processing Summary

0

0

Processed 30

Missing or out-of-range group codes

Excluded


Used in Output 30

Prior Probabilities for Groups

Spent Prior Cases Used in Analysis Unweighted Weighted

1 ,333 10 10

2 ,333 10 10

3 ,333 10 10

Total 1,000 30 30

Classification Function Coefficients

Spent

1 2 3

Income 1,099 1,418 1,802

Attitude 2,904 2,754 3,667

Importance -,002 -,397 -,360

Hsize -,173 -,488 -,759

Age 1,124 1,153 1,379

(Constant) -56,821 -69,018 -106,773

Fisher's linear discriminant functions


DISKRIMINAN.doc

Kamarul Imam

[email protected]

Territorial Map

Canonical Discriminant Function 2

-6,0 -4,0 -2,0 ,0 2,0 4,0 6,0

.ôòòòòòòòòòôòòòòòòòòòôòòòòòòòòòôòòòòòòòòòôòòòòòòòòòôòòòòòòòòòòô 6,0 ô 13 ó

ô ó 13 ó ó 13 ó ó 13 ó ó 13 ó ó 13 ó

4,0 ô ô ô ô 13 ô ô ô ó 13 ó ó 13 ó ó 13 ó ó 13 ó ó 13 ó

2,0 ô ô ô ô13 ô ô ô ó 1223 ó ó 12 23 ó ó 12 23 ó ó 12 23 ó ó * 12 23 * ó

,0 ô ô ô 12 ô 23 ô ô ô ó 12 23 ó ó 12 * 23 ó ó 12 23 ó ó 12 23 ó ó 12 23 ó

-2,0ô ô 12ô ô 23ô ô ô ó 12 23 ó ó 12 23 ó ó 12 23 ó ó 12 23 ó ó 12 23 ó

-4,0ô ô 12 ô ô ô23 ô ô ó 12 23 ó ó 12 23 ó ó 12 23 ó ó 12 23 ó ó 12 23 ó

-6,0ô 12 23 ô ôòòòòòòòòòôòòòòòòòòòôòòòòòòòòòôòòòòòòòòòôòòòòòòòòòôòòòòòòòòòô

-6,0 -4,0 -2,0 ,0 2,0 4,0 6,0

Canonical Discriminant Function 1


DISKRIMINAN.doc

------ ----- --------------------

Kamarul Imam

[email protected]

Symbols used in territorial map

Symbol Group Label

1 1

2 2

3 3

* Indicates a group centroid


1 2 3

1 9 1 0

2 1 9 0

3 0 2 8

1

2

%

3


Spent Total

10

10

Count

10

90,0 10,0 ,0 100,0

10,0 90,0 ,0 100,0

Original

,0 20,0 80,0 100,0 a


Keterangan :

Hasil validasi model kepada holdout sample menunjukkan tingkat ketepatan klasifikasinyamenurun sebagai berikut :


1 2 3

1 3 1 0 4

2 0 3 1 4

3 1 0 3 4

1

2

%

3


Spent Total

Count

75,0 25,0 ,0 100,0

,0 75,0 25,0 100,0

Original

25,0 75,0 ,0 100,0 a



DISKRIMINAN.doc