analisis diskriminan 020 023 029

15
Analisis Multivariat ANALISIS DISKRIMINAN (Studi Kasus : PENGELOMPOKAN NILAI IQ SISWA SMU SWASTA SURABAYA) Program Pascasarjana Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Teknologi Sepuluh Nopember – Surabaya Kampus ITS Sukolilo Surabaya, 60111 DISUSUN OLEH AYU TRI SEPTADIANTI (1314 201 020) IKA FEBRINA WURYANTI (1314 201 023) FARISCA SUSIANI (1314 201 029) DOSEN DR. VITA RATNASARI, S.SI, M.SI

Upload: farisca-susiani

Post on 03-Dec-2015

66 views

Category:

Documents


5 download

DESCRIPTION

Multivariat

TRANSCRIPT

Analisis Multivariat

ANALISIS DISKRIMINAN (Studi Kasus : PENGELOMPOKAN NILAI IQ SISWA SMU SWASTA SURABAYA)

Program Pascasarjana Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Teknologi Sepuluh Nopember – Surabaya Kampus ITS Sukolilo Surabaya, 60111

DISUSUN OLEH

AYU TRI SEPTADIANTI (1314 201 020)

IKA FEBRINA WURYANTI (1314 201 023)

FARISCA SUSIANI (1314 201 029)

DOSEN

DR. VITA RATNASARI, S.SI, M.SI

2

1. Pendahuluan Analisis diskriminan merupakan suatu teknik analisis multivariat yang

digunakan untuk mengelompokkan atau mengklasifikasi suatu objek ke dalam dua kelompok atau lebih berdasarkan variabel independennya. Pengelompokkan pada analisis diskriminan bersifat jika suatu objek telah masuk pada salah satu kelompok maka tidak dapat menjadi anggota dari kelompok yang lain. Sebelum menganalisis dengan diskriminan, data harus memenuhi asumsi normal multivariat dan homogenitas matrik varian kovarian. Sehingga dengan adanya praktikum ini diharapkan dapat memperoleh informasi mengenai hasil pemeriksaan normal multivariat, hasil uji kesamaan matrik varian kovarian, analisis diskriminan pada data IQ (28 data training dan 12 data testing yang selanjutnya akan dilakukan perbandingan data hasil analisis diskriminan pada data data training dan data testing.

2. Landasan Teori 2.1 Pengujian Asumsi Distribusi Normal Multivariat Beberapa metode statistika multivariate seperti discriminant analysis seringkali mensyaratkan terpenuhinya asumsi distribusi multinormal. Asumsi ini diperlukan karena di dalam discriminant analysis dilakukan pengujian dengan menggunakan statistik uji Wilk. Kesimpulan yang diambil berdasarkan statistik ini dikatakan sahih (valid), jika syarat distribusi multinormal dipenuhi.

Variabel pi XXX ,...,, 2 dikatakan berditribusi normal multivariat dengan parameter Β΅ dan Ξ£ jika mempunyai probability density function :

)()'(21

2/2/2

1

)2(1),...,,(

¡¡

Ο€

βˆ’Ξ£βˆ’βˆ’ βˆ’

Ξ£=

XXXXX ef pppi (1)

Jika pi XXX ,...,, 2 berdistribusi normal multivariate maka )()'( 1 ¡¡ βˆ’Ξ£βˆ’ βˆ’ XX

berditribusi 2pχ . Berdasarkan sifat ini maka pemeriksaan distribusi multinormal dapat

dilakukan dengan cara membuat q-q plot dari nilai ( ) niSd iii ,...,1,()' 12 =βˆ’βˆ’= βˆ’ XXXX.

Tahapan dari pembuatan q-q plot ini adalah sebagai berikut (Johnson, 1990) 1. Tentukan nilai vektor rata-rata : X 2. Tentukan nilai matriks varians-kovarians : S 3. Tentukan nilai jarak Mahalanobis setiap titik pengamatan dengan vektor rata-ratanya

( ) niSd iii ,...,1,()' 12 =βˆ’βˆ’= βˆ’ XXXX (2)

4. Urutkan nilai 2

id dari kecil ke besar : 2)(

2)3(

2)2(

2)1( ... ndddd ≀≀≀≀

5. Tentukan nilai nin

ipi ,...,1,2/1=

βˆ’= (3)

6. Tentukan nilai iq sedemikian hingga i

q

pdfi

=βˆ«βˆžβˆ’

22 )( χχ (4)

7. Buat scatter-plot 2)(id dengan iq

8. Jika scatter-plot ini cenderung membentuk garis lurus dan lebih dari 50 % nilai 2

50.0,2

pid χ≀

3

2.2 Pengujian homogenitas varians Beberapa analisis statistika multivariate seperti discriminant analysis membutuhkan syarat matriks varians-kovarians yang homogen. Untuk menguji syarat ini dapat dipergunakan statistik uji Box-M. Hipoteris dan statistik uji Box-M adalah Hipotesis Ho : kΞ£==Ξ£=Ξ£ ...21 H1 : ji Ξ£β‰ Ξ£ untuk ji β‰  Statistik uji

βˆ’βˆ’βˆ’= βˆ‘ βˆ‘

= =

k

i

k

iiipooliihitung vvc

1 11

2 ln21ln

21)1(2 SSχ (5)

dan

βˆ‘

βˆ‘

=

== k

1ii

k

1iii

pool

v

SvS (6)

1;)1)(1(6

13211 2

1

1

1 βˆ’=

βˆ’+βˆ’+

βˆ’= βˆ‘βˆ‘=

=

ii

k

ik

ii

i

nvkppp

vvc (7)

Gagal tolak hipotesis nol yang berarti matriks varians-kovarians bersifat homogen jika

2

1()1(21

2

+βˆ’β‰€

ppkhitung χχ (8)

2.2.1 Analisis Diskriminan Analisis diskriminan adalah teknik statistika untuk mengelompokkan individu-

individu ke dalam kelompok-kelompok yang saling bebas berdasarkan sekelompok variabel bebas. Kelompok-kelompok ini terjadi karena ada pengaruh satu atau lebih variabel lain yang merupakan variabel independen. Kombinasi linier dari variabel-variabel ini akan membentuk suatu fungsi diskriminan.

Dalam analisis diskriminan terdapat 2 metode berdasarkan jumlah kategori dari variabel dependennya. Apabila terdapat 2 kategori yang terlibat dalam pengklasifikasian, maka disebut dengan two-group discriminant analysis. Sedangkan apabila terdapat 3 atau lebih kategori yang terlibat dalam pengklasifikasian, maka disebut dengan multiple discriminant analysis.

Dalam buku Johnson, R. A. dan Wichern, D. W dijelaskan bahwa fungsi diskriminan pertama kali diperkenalkan oleh Ronald A. Fisher (1936) dengan menggunakan beberapa kombinasi linier dari pengamtan yang cukup mewakili populasi. Menurut Fisher, untuk mencari kombinasi linier dari p variabel bebas tersebut dapat dilakukan dengan pemilihan koefisien-koefisiennya yang menghasilkan hasil bagi maksimum antara matrik peragam antar kelompok (between-group) dan matrik peragam dalam kelompok (within-group). Adapun asumsi-asumsi yang harus dipenuhi sebelum melakukan analisis diskriminan, antara lain yaitu.

4

1. Variabel independen berdistribusi normal multivariat (multivariates normal distribution).

2. Varians dalam setiap kelompok adalah sama (equal variances).

Analisis diskriminan dapat dilakukan bila terdapat perbedaan yang nyata antar kelompok, sehingga pada tahap awal yang harus dilakukan adalah uji hipotesis nol bahwa tidak ada perbedaan kelompok di antara individu yang dirumuskan dengan. 𝐻𝐻0: πœ‡πœ‡1𝑖𝑖 = πœ‡πœ‡2𝑖𝑖

𝐻𝐻1: πœ‡πœ‡1𝑖𝑖 β‰  πœ‡πœ‡2𝑖𝑖 Taraf signifikansi Ξ± = 0,05

Statistik uji yang digunakan adalah Wilk’s Lamda (Ξ›*):

Wilk’s Lamda Ι…βˆ— = |π‘Šπ‘Š||𝐡𝐡+π‘Šπ‘Š| (9)

Daerah Kritis : Tolak H0 jika atau P-value < Ξ± Fungsi diskriminan yang mempunyai bentuk umum berupa persamaan linier

(Fisher’s Sample Linear Discriminant Function) yaitu. 𝑦𝑦� = π‘Žπ‘ŽοΏ½β€²π‘₯π‘₯ = (οΏ½Μ…οΏ½π‘₯1 βˆ’ οΏ½Μ…οΏ½π‘₯2)β€²π‘†π‘†π‘π‘π‘π‘π‘π‘π‘π‘π‘π‘π‘π‘βˆ’1 π‘₯π‘₯

Aturan alokasi berdasarkan fungsi diskriminan Alokasi π‘₯π‘₯0 ke πœ‹πœ‹1 jika

𝑦𝑦�0 = (οΏ½Μ…οΏ½π‘₯1 βˆ’ οΏ½Μ…οΏ½π‘₯2)β€²π‘†π‘†π‘π‘π‘π‘π‘π‘π‘π‘π‘π‘π‘π‘βˆ’1 π‘₯π‘₯0 β‰₯ π‘šπ‘šοΏ½ = 12

(οΏ½Μ…οΏ½π‘₯1 βˆ’ οΏ½Μ…οΏ½π‘₯2)β€²π‘†π‘†π‘π‘π‘π‘π‘π‘π‘π‘π‘π‘π‘π‘βˆ’1 (οΏ½Μ…οΏ½π‘₯1 + οΏ½Μ…οΏ½π‘₯2) (10)

Atau 𝑦𝑦�0 βˆ’π‘šπ‘šοΏ½ β‰₯ 0 Alokasi π‘₯π‘₯0 ke πœ‹πœ‹2 jika 𝑦𝑦�0 < π‘šπ‘šοΏ½ atau 𝑦𝑦�0 βˆ’π‘šπ‘šοΏ½ < 0 3. Metode penelitian

Data yang digunakan dalam laporan ini merupakan data Tesis Retno Purwanti Germana (13012001001) dengan judul β€œAplikasi Analisis Model Komponen Varians Multilevel Pada Hasil Tes Psikologi di Beberapa SMU Swasta di Surabaya”, dimana dalam data tersebut terdiri atas variabel dependen dan variabel independen sebagai berikut.

1. Variabel dependen (Y) adalah tingkat kecerdasan intelektual siswa (IQ) yang dibedakan menjadi dua kategori, yaitu IQ β‰₯ 100 diberi koding 1, dan IQ < 100 diberi koding 2.

2. X1 adalah abstrak reasoning atau tes gambar (AR) 3. X2 adalah verbal reasoning atau tes verbal (VR) 4. X3 adalah numerical reasoning atau tes numerik (NR) 5. X4 adalah usia siswa ketika mengikuti tes psikologi.

Untuk melakukan Analisis Diskriminan dalam laporan ini, diharuskan untuk menempuh langkah-langkah yang sudah dibuat. Langkah-langkah tersebut adalah sebagai berikut.

1. Mencari data sekunder, yang beasal dari Tesis Retno Purwanti Germana. 2. Membagi data menjadi dua, yaitu 28 data training dan 12 data testing.

5

3. Menguji distribusi normal multivariat pada data. 4. Menguji kehomogenan matriks varians kovarians pada data. 5. Menguji vektor nilai rataan. 6. Melakukan analisis dengan analisis diskriminan terhadap data. 7. Menghitung ketepatan hasil klasifikasi data training dan data testing. 8. Membuat kesimpulan dari hasil analisis.

4. Pembahasan

Data hasil tes psikologi di sebuah SMU Swasta di Surabaya selanjutnya akan dianalisis untuk mendapatkan suatu hasil yang nantinya diambil suatu kesimpulan. Berikut analisis data tes psikologi dengan beberapa variabel bebas.

4.1 Uji Distribusi Normal Multivariat

Asumsi yang diperlukan di dalam Analisis Diskriminan salah satunya adalah data hasil tes psikologi mengikuti sebaran normal multivariat, karena data yang diambil berdasarkan statistik ini dikatakan valid jika syarat distribusi normal multivariat terpenuhi. Pengujian distribusi normal multivariat adalah sebagai berikut. Hipotesis:

H0 : Data berdistribusi normal multivariat H1 : Data tidak berdistribusi normal multivariat

Tingkat signifikan: 5% Daerah Kritis : tolak H0 , jika t < 50%

Statistik Uji : t = 0,542857, nilai t merupakan banyaknya data yang kurang dari ( ) niSd iii ,...,1,()' 12 =βˆ’βˆ’= βˆ’ XXXX dan hasil analisis yang didapat adalah sebagai

berikut. t = 0,525000

Berdasarkan nilai t (statistik uji) di atas dapat diketahui bahwa data lebih besar dari 50%, sehingga gagal tolak H0. Hal tersebut berarti data mengikuti sebaran distribusi normal multivariat. Sebaran data berdistribusi normal multivariat juga dapat dilihat secara visual melalui scatter plot berikut.

Gambar 4.1 Plot Pengujian Normal Multivariat untuk Data Hasil Tes

Psikologi Sebuah SMU Swasta di Surabaya

1614121086420

14

12

10

8

6

4

2

0

dd

q

6

Berdasarkan scatter plot di atas, secara visual terlihat bahwa sebaran titik-titik dari data berada disekitar garis normal. Sehingga baik secara perhitungan maupun secara visual dapat disimpulkan bahwa data hasil tes psikologi sebuah SMU Swasta di Surabaya berdistribusi normal multivariat.

4.2 Uji Homogenitas Matriks Varians Covarians Uji homogenitas matriks varians covarians dapat menggunakan hasil uji Box’s

M. Apabila nilai Box’s M signifikan maka hipotesis nol yang menyatakan bahwa matriks varians covarians dari variabel. Untuk lebih jelasnya sebagai berikut. Hipotesis:

H0 : kΞ£==Ξ£=Ξ£ ...21 H1 : ji Ξ£β‰ Ξ£ untuk ji β‰ 

Tingkat signifikan (Ξ±): 5% Berikut merupakan hasil dari uji Box’s M yang didapat

Tabel 4.1 Uji Homogenitas Box’s M

Box's M 13,146 F 1,036

df1 10 df2 1174,663 Sig. 0.411

Daerah kritis: Tolak H0 jika P-value (Sig.) < Ξ± Keputusan: Gagal Tolak H0 karena P-value = 0,492> Ξ± = 0,05

Hasil yang didapat adalah Gagal Tolak H0 yang berarti matriks varians kovarians antar data hasil tes psikologi sebuah SMU Swasta di Surabaya adalah homogen, dapat dikatakan matriks varians covarians dari variabel dependen sama.

4.3 Pengujian Vektor Nilai Rataan Pada tahap awal analisis diskriminan yang harus dilakukan adalah melakukan

pengujian vektor nilai rataan. Diharapkan dari pengujian ini menghasilkan keputusan Tolak H0, sehingga didapatkan informasi awal bahwa variabel yang sedang diteliti memang membedakan kedua kelompok. Uji ini dilakukan secara univariate dengan perumusan hipotesis sebagai berikut. Hipotesis 𝐻𝐻0: πœ‡πœ‡1𝑖𝑖 = πœ‡πœ‡2𝑖𝑖 𝐻𝐻1: πœ‡πœ‡1𝑖𝑖 β‰  πœ‡πœ‡2𝑖𝑖 Taraf signifikansi Ξ± : 0,05 Daerah Kritis: Tolak H0 jika P-value < Ξ± Statistik Uji

Tabel 4.2 Uji Vektor Nilai Rataan Xi Wilk’s Lambda P-value Keputusan AR 0,720 0,004 Tolak H0 VR 0,872 0,061 Gagal Tolak H0 NA 0,892 0,088 Gagal Tolak H0 Usia 0,925 0,159 Gagal Tolak H0

7

Berdasarkan hasil pengujian pada Tabel 4.2 di atas, hasil penjelasan yang dapat diberikan adalah sebagai berikut. a. Hasil Pengujian terhadap variabel dependen AR menghasilkan nilai wilk’s lambda

sebesar 0,720 dengan P-value adalah 0,004 < 0,05, yang berarti Tolak H0. Hasil ini menunjukkan terdapat perbedaan antar dua kelompok IQ terkait dengan variabel AR, sehingga dapat disimpulkan AR berpengaruh signifikan dalam membedakan kelompok tingkat IQ pelajar.

b. Hasil Pengujian terhadap variabel dependen VR menghasilkan nilai wilk’s lambda sebesar 0,872 dengan P-value adalah 0,061 > 0,05, yang berarti Gagal Tolak H0. Hasil ini menunjukkan tidak terdapat perbedaan antar dua kelompok IQ terkait dengan variabel VR, sehingga dapat disimpulkan AR tidak berpengaruh signifikan dalam membedakan kelompok tingkat IQ pelajar.

c. Hasil Pengujian terhadap variabel dependen NA menghasilkan nilai wilk’s lambda sebesar 0,892 dengan P-value adalah 0,088 > 0,05, yang berarti Gagal Tolak H0. Hasil ini menunjukkan tidak tterdapat perbedaan antar dua kelompok IQ terkait dengan variabel NA, sehingga dapat disimpulkan NA tidak berpengaruh signifikan dalam membedakan kelompok tingkat IQ pelajar.

d. Hasil Pengujian terhadap variabel dependen Usia menghasilkan nilai wilk’s lambda sebesar 0,925 dengan P-value adalah 0,159 > 0,05, yang berarti Gagal Tolak H0. Hasil ini menunjukkan tidak terdapat perbedaan antar dua kelompok IQ terkait dengan variabel Usia, sehingga dapat disimpulkan Usia tidak berpengaruh signifikan dalam membedakan kelompok tingkat IQ pelajar.

Berdasarkan hasil tersebut maka dapat langkah selanjutnya adalah mengelompokkan individu-individu ke dalam kelompok-kelompok yang saling bebas berdasarkan variabel independennya menggunakan analisis diskriminan.

4.4 Analisis Diskriminan 4.4.1 Analisis Diskriminan dengan SPSS Setelah melakukan uji asumsi, kemudian akan dilakukan pengolahan data dengan menggunakan SPSS. Berikut adalah langkah melakukan analisisnya:

a. klik menu β€œanalyze” dan pilih sub menu β€œClassify” dan kemudian β€œDiscriminant”

8

b. Masukkan variabel dependent ke dalam kotak β€œGrouping Variable”. Kemudian klik icon β€œDefine Range” beri masukan nilai minimum dan maksimum nilai respon yakni 1 dan 2,

c. Klik icon β€œStatistics”, Pada bagian β€œDescriptives” aktifkan Means, Univariate

ANOVA’s, Box’s M; pada bagian β€œFunction Coefficients” aktifkan Fisher’s, kemudian pada bagian Matrices aktifkan Within-groups correlation dan total covariance. Abaikan bagian yang lainnya lalu klik β€œContinue” untuk kembali ke menu utama

d. pilih Classify. Pilih All groups are equal untuk menentukan probabilitas prior.

Beri centang pada Summary table dan Leave-one-out classification (cross validation) untuk menampilkan hasil evaluasi klasifikasi, klik continue

e. pilih Save. Beri centang pada Predicted group membership, probabilities of

group membership, dan discriminant score, klik continue, kemudian klik OK untuk menampilkan hasil outputnya

9

4.4.2 Hasil Analisis Diskriminan dengan SPSS Analisis diskriminan merupakan cara terbaik untuk menyatakan perbedaan kelompok. Dengan menggunakan SPSS, dilakukan analisis dari data hasil tes psikologi sebuah SMU Swasta di Surabaya.

Tabel 4.3 Koefisien Fungsi Diskriminan Kanonik Data Hasil Tes Psikologi Sebuah SMU Swasta di Surabaya

Variabel Independen Koefisien AR 0,034 VR 0,018 NA 0,000 Usia -0,541

Constant 5,311

Berdasarkan Tabel 4.3, fungsi diskriminan yang terbentuk adalah sebagai berikut.

Y=5,311+0,034AR+0,018VR+0,000NA-0,541Usia Atau dapat disederhanakan menjadi.

Y=5,311+0,034AR+0,018VR-0,541Usia Dari persamaan di atas dapat diketahui bahwa variabel AR merupakan variabel yang paling dominan dalam memprediksi perbedaan kelompok nilai IQ, karena memiliki nilai yang paling besar yaitu 0,034. Sedangkan variabel yang paling minimum dalam memprediksi perbedaan kelompok nilai IQ adalah variabel NA, yaitu sebesar 0,000.

Setelah diklasifikasikan, akan didapatkan koefisien dan persamaan-persamaan sebagai berikut.

Tabel 4.4 Koefisien Fungsi Klasifikasi Data Tes Psikologi Sebuah SMU Swasta di Surabaya

Variabel Independen IQ

β‰₯ 100 < 100 AR 0,060 0,011 VR 0,037 0,011 NA 0,441 0,441 Usia 38,277 39,045

Constant -300,922 -308,829

Dari tabel 4.4 didapatkan model persamaan sebagai berikut. YA=-300,922+0,060AR+0,037VR+0,441NA+38,277USIA YB=-308,829+0,011AR+0,011VR+0,441NA+39,045USIA

10

Tabel 4.5 Nilai Centroid (Rata-rata) Data IQ IQ Nilai

1 0,457 2 -0,964

Tabel 4.5 merupakan nilai centroid atau rata-rata dari masing-masing kelompok data IQ. Nilai ini nantinya akan digunakan untuk menghitung nilai cutting score. Berikut merupakan perhitungan dari nilai cutting score.

π‘šπ‘šοΏ½ =𝑛𝑛1𝑦𝑦�1 + 𝑛𝑛2𝑦𝑦�2

𝑛𝑛1 + 𝑛𝑛2=

19(0,457) + 9(βˆ’0,964)19 + 9

= 0,00025

Perhitungan cutting score dimaksudkan untuk mengetahui ketepatan hasil klasifikasi yang didapat untuk data training maupun data testing. Berikut ini adalah hasil perhitungan manual analisis ketepatan hasil klasifikasi untuk data training.

Tabel 4.6 Hasil Perhitungan Data Training

Y ya yb y0 hat grup y ya yb y0 hat grup 1 307.5 308.49 -0.984 2 1 302.42 303.91 -1.334 2 1 271.83 270.05 0.947 1 1 264.94 263.21 0.907 1 1 290.27 290.9 -0.734 2 2 376.25 377.92 -1.476 2 2 295.76 297.35 -1.404 2 2 304.21 306.06 -1.584 2 1 323.35 320.52 1.664 1 1 324.1 322.1 1.086 1 2 291.88 293 -1.074 2 1 320.1 318.02 1.146 1 1 311.72 309.34 1.348 1 2 306.38 306.5 -0.384 2 1 309.59 310.69 -1.064 2 1 281.53 278.92 1.517 1 1 318.59 316.09 1.436 1 2 312.05 313.01 -0.964 2 2 263.32 262.94 -0.023 2 2 298.56 299.67 -1.064 2 1 308.85 307 0.986 1 2 309.52 310.64 -1.074 2 1 273.68 270.34 2.025 1 1 335.05 336.56 -1.355 2 1 268.73 267.68 0.437 1 1 300.95 301.93 -0.974 2 1 306.48 304.85 0.836 1 1 271.66 271.65 -0.283 2

Tabel 4.6 menunjukkan perhitungan secara manual terhadap data training. Nilai 𝑦𝑦�0dihitung melalui persamaan 𝑦𝑦�0 = 5,311+0,034AR+0,018VR-0,541Usia. Jika nilai 𝑦𝑦�0 β‰₯ π‘šπ‘šοΏ½ maka data dialokasikan ke kelompok 1 (IQ β‰₯ 100). Sedangkan jika nilai 𝑦𝑦�0 < π‘šπ‘šοΏ½ maka data akan dialokasikan ke kelompok 2 (IQ < 100). Warna merah pada tabel menunjukkan pengelompokkan data yang tidak sesuai dengan klasifikasi. Nilai prosentase ketepatan hasil klasifikasi secara keseluruhan dirangkum dalam Tabel 4.7 di bawah ini.

Tabel 4.7 Tabel Klasifikasi Data Training

Y Nilai prediksi data training Total 1 2

Jumlah 1 13 6 19 2 1 8 9

% 1 68,4 31,6 100 2 11,1 88,9 100

75% data tepat sesuai dengan klasifikasi

11

Berdasarkan Tabel 4.7 untuk data training junlah data yang diprediksi dan memang seharusnya berada pada klasifikasi pertama (kelompok 1) adalah sebanyak 13 data, sedangkan yang tidak berada pada klasifikasi pertama adalah sebanyak 6 data. Jumlah data yang diprediksi dan memang seharusnya berada pada klasifikasi kedua (kelompok 2) adalah sebanyak 8 data, sedangkan yang tidak berada pada klasifikasi kedua adalah sebanyak 1 data. Sehingga total data yang tidak sesuai dengan klasifikasi adalah sebanyak 7 data, maka ketepatan klasifikasi untuk kelompok data training adalah sebesar 75%. Prosentase ketepatan data training ini nantinya akan dibandingkan dengan prosentase ketepatan data testing. Berikut hasil analisis dari data testing.

Tabel 4.8 Hasil Perhitungan Data Testing

y ya yb ycs y0 hat grup 1 318.223 315.981 0.00025 1.256 1 2 304.623 306.116 0.00025 -1.334 2 1 307.093 306.611 0.00025 0.036 1 1 311.803 311.076 0.00025 0.206 1 1 279.391 276.771 0.00025 1.527 1 1 301.368 301.981 0.00025 -0.724 2 1 314.378 313.391 0.00025 0.386 1 2 265.006 263.266 0.00025 0.917 1 1 303.758 304.241 0.00025 -0.634 2 2 316.813 315.596 0.00025 0.546 1 2 305.363 306.336 0.00025 -0.974 2 1 314.493 313.391 0.00025 0.466 1

Tabel 4.8 menunjukkan perhitungan secara manual dari hasil SPSS terhadap data testing. Sama halnya dengan data training, nilai 𝑦𝑦�0dihitung melalui persamaan 𝑦𝑦�0 = 5,311+0,034AR+0,018VR-0,541Usia. Jika nilai 𝑦𝑦�0 β‰₯ π‘šπ‘šοΏ½ maka data dialokasikan ke kelompok 1 (IQ β‰₯ 100). Sedangkan jika nilai 𝑦𝑦�0 < π‘šπ‘šοΏ½ maka data akan dialokasikan ke kelompok 2 (IQ < 100). Warna merah pada tabel menunjukkan pengelompokkan data yang tidak sesuai dengan klasifikasi. Nilai prosentase ketepatan hasil klasifikasi dirangkum dalam Tabel 4.9 di bawah ini.

Tabel 4.9 Tabel Klasifikasi Data Testing

Y Nilai prediksi data testing

Total 1 2

Jumlah 1 6 2 8 2 2 2 4

% 1 75 25 100 2 50 50 100

66,67% data tepat sesuai dengan klasifikasi

Berdasarkan Tabel 4.9 untuk data testing junlah data yang diprediksi dan memang seharusnya berada pada klasifikasi pertama (kelompok 1) adalah sebanyak 6 data, sedangkan yang tidak berada pada klasifikasi pertama adalah sebanyak 2 data. Jumlah data yang diprediksi dan memang seharusnya berada pada klasifikasi kedua

12

(kelompok 2) adalah sebanyak 2 data, sedangkan yang tidak berada pada klasifikasi kedua adalah sebanyak 2 data. Sehingga total data yang tidak sesuai dengan klasifikasi adalah sebanyak 4 data, maka ketepatan klasifikasi untuk kelompok data training adalah sebesar 66,7%.

4.4.3 Analisis Diskriminan Perhitungan Manual Dengan Ms.Excel Selain pengolahan data menggunakan SPSS, akan dilakukan perhitungan secara manual dengan menggunakan Ms.Excel. Langkah-langkahnya adalah sebagai berikut : 1. Menghitung nilai rata-rata dari masing-masing variabel (AR, VR, NR dan Usia)

pada setiap grup

𝑋𝑋�1 = οΏ½

65,25946,66770,70414,778

οΏ½ dan 𝑋𝑋�2 = οΏ½

41,15435,77060,770

15

οΏ½

2. Mencari matriks varians kovarians dari variabel X

Matrik varians kovarians untuk respon Y=1 (IQ β‰₯ 100)

𝑆𝑆1 = οΏ½

548,2764 151,0897 222,3105 βˆ’2,7094151,0897 217,3077 98,01282 βˆ’0,38462222,3105βˆ’2,7094

98,01282βˆ’0,38462

249,1396βˆ’1,56838

βˆ’1,568380,25641

οΏ½

Matrik varians kovarians untuk respon Y=2 (IQ < 100)

𝑆𝑆2 = οΏ½

383,9744 59,44 51,12179 βˆ’1,25βˆ’32,21154 βˆ’32,21154 32,69231 βˆ’0,416751,12179βˆ’1,25

32,69231βˆ’0,41667

203,5256βˆ’0,83333

βˆ’0,8330,5

οΏ½

3. Menghitung matrik Spooled

𝑆𝑆𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 = οΏ½

466,13 59,44 136,72 βˆ’1,9859,44 141,67 65,35 βˆ’0,40

136,72βˆ’1,98

65,35βˆ’0,40

226,33βˆ’1,20

βˆ’1,200,378

οΏ½

4. Menghitung invers dari matrik Spooled

𝑆𝑆𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 βˆ’1 = οΏ½

0,002659 βˆ’0,00043 βˆ’0,001435 0,008907βˆ’0,00043 0,008213 βˆ’0,002114 βˆ’0,000254βˆ’0,001440,00891

βˆ’0,00211βˆ’0,00025

0,0059440,009122

0,0091222,719383

οΏ½

5. Mengestimasi fungsi Diskriminan Linear Faktor

π‘Œπ‘ŒοΏ½ = (𝑋𝑋�1 βˆ’ 𝑋𝑋�2)𝑇𝑇 𝑆𝑆𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 βˆ’1𝑋𝑋 = 𝑦𝑦�1 = π‘Žπ‘Ž1𝑇𝑇𝑋𝑋1

π‘Œπ‘ŒοΏ½ = [24,105 10,897 9,934473 βˆ’0,222] οΏ½

466,13 59,44 136,72 βˆ’1,9859,44 141,67 65,35 βˆ’0,40

136,72βˆ’1,98

65,35βˆ’0,40

226,33βˆ’1,20

βˆ’1,200,37

οΏ½ οΏ½

𝑋𝑋1𝑋𝑋2𝑋𝑋3𝑋𝑋4

οΏ½

13

= [0,043186 0,058231 0,000608 0,30176] οΏ½

𝑋𝑋1𝑋𝑋2𝑋𝑋3𝑋𝑋4

οΏ½

Jadi fungsi diskriminan yang terbentuk adalah : π‘Œπ‘ŒοΏ½ = 0,043 X1 + 0,058 X2 + 0,0006 X3 + 0,302 X4

6. Mengklasifikasikan Data Training dan Data Testing

Kriteria pengklasifikasian (Johnson dan Wichern, 2002) : π½π½π‘–π‘–π½π½π‘Žπ‘Ž 𝑦𝑦� β‰₯ π‘šπ‘š , π‘šπ‘šπ‘Žπ‘Žπ½π½π‘Žπ‘Ž π‘₯π‘₯0 π‘šπ‘šπ‘Žπ‘Žπ‘šπ‘šπ‘šπ‘šπ½π½ π½π½π‘π‘π‘π‘π‘π‘π‘šπ‘šπ‘π‘π‘π‘π½π½ πœ‹πœ‹1 π½π½π‘–π‘–π½π½π‘Žπ‘Ž 𝑦𝑦� < π‘šπ‘š , π‘šπ‘šπ‘Žπ‘Žπ½π½π‘Žπ‘Ž π‘₯π‘₯0 π‘šπ‘šπ‘Žπ‘Žπ‘šπ‘šπ‘šπ‘šπ½π½ π½π½π‘π‘π‘π‘π‘π‘π‘šπ‘šπ‘π‘π‘π‘π½π½ πœ‹πœ‹2

Perhitungan nilai m :

π‘šπ‘šοΏ½ =12

[(𝑋𝑋�1 βˆ’ 𝑋𝑋�2)𝑇𝑇 π‘†π‘†π‘π‘π‘π‘π‘π‘π‘π‘π‘π‘π‘π‘βˆ’1(𝑋𝑋�1 + 𝑋𝑋�2)]

= [0,043186 0,058231 0,000608 0,30176] οΏ½

106,413182,4359

131,472929,77778

οΏ½ = 0,1650

Setelah didapatkan nilai m, selanjutnya menghitung nilai 𝑦𝑦� yaitu dengan memasukkan nilai – nilai variabel X (AR,VR, NR dan Usia) ke dalam fungsi diskriminan sebelumnya. Data Training Dengan menggunakan data Training sebanyak 28 maka didapatkan nilai 𝑦𝑦�. Kemudian nilai 𝑦𝑦� tersebut dibandingkan dengan m sehingga didapatkan nilai prediksi. Nilai prediksi ini nantinya dijadikan dasar pengelompokkan untuk menentukan ketepatan klasifikasi.

Tabel 4.10 Hasil Perhitungan Data Training secara manual (Excel)

y AR VR NA Usia π’šπ’šοΏ½ m prediksi 1 35 35 70 15 -1,01941 0,165051 2 1 60 65 70 14 2,108917 0,165051 1 1 45 30 30 15 -0,85438 0,165051 2 2 20 40 45 15 -1,36084 0,165051 2 1 97 65 95 15 3,389827 0,165051 1 2 35 30 35 15 -1,28928 0,165051 2 1 93 55 70 15 2,649977 0,165051 1 1 30 40 75 15 -0,94722 0,165051 2 1 85 75 85 15 3,459986 0,165051 1 2 50 30 55 14 -0,35189 0,165051 2 1 85 50 65 15 2,016378 0,165051 1 1 97 55 70 14 3,124482 0,165051 1 1 45 65 65 14 1,464171 0,165051 1 1 70 70 60 15 2,536246 0,165051 1 1 30 25 60 15 -1,81156 0,165051 2 1 80 25 55 14 0,652523 0,165051 1

14

2 55 30 50 17 -1,03821 0,165051 2 2 20 30 65 15 -1,95531 0,165051 2 1 80 65 99 15 2,653238 0,165051 1 1 95 40 90 15 1,850728 0,165051 1 2 50 40 65 15 -0,07743 0,165051 2 1 90 40 90 14 1,936561 0,165051 1 2 25 55 80 15 -0,29273 0,165051 2 2 30 40 50 15 -0,93202 0,165051 2 2 35 30 75 15 -1,3136 0,165051 2 1 40 35 45 16 -1,09004 0,165051 2 1 30 45 55 15 -0,64391 0,165051 2 1 45 25 75 14 -0,87114 0,165051 2

Setelah didapatkan nilai prediksi kelompok, selanjutnya membandingkan antara

nilai kelompok y aktual dengan nilai kelompok y prediksi yang dijelaskan dengan tabel berikut.

Tabel 4.11 Hasil Klasifikasi Data Training (Excel)

Data Training Prediksi grup Total 1 2

Aktual Grup

1 12 7 19 2 0 9 9

Total 12 16 28 Nilai ketepatan klasifikasi yang diperoleh adalah :

π‘π‘π‘–π‘–π‘π‘π‘Žπ‘Žπ‘–π‘– 𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 =7 + 0

28= 0,25

Jadi, nilai ketepatan klasifikasi yang diperoleh adalah 1 – 0,25 = 0,75 atau sekitar 75 %. Data Testing Dengan menggunakan data Testing sebanyak 12 maka didapatkan nilai 𝑦𝑦�.

Tabel 4.12 Hasil Perhitungan Data Testing secara manual (Excel)

y AR VR NA Usia π’šπ’šοΏ½ m prediksi 1 85 65 85 15 8800 0 1 2 30 25 65 15 3775 0 1 1 65 35 65 15 5700 0 1 1 70 35 75 15 6025 0 1 1 85 50 85 14 7750 0 1 1 40 40 55 15 5025 0 1 1 70 45 80 15 6800 0 1 2 75 35 55 14 5900 0 1 1 40 45 60 15 5450 0 1 2 80 35 85 15 6525 0 1 2 30 45 65 15 5175 0 1 1 75 40 80 15 6625 0 1

15

Kemudian setelah dibandingkan dengan nilai m, didapatkan nilai prediksi yang ditampilkan pada Tabel 4.12. Selanjutnya dihitung nilai ketepatan klasifikasi berdasarkan tabel berikut.

Tabel 4.13 Hasil Klasifikasi Data Testing secara manual (Excel)

Data Training Prediksi grup Total 1 2

Aktual Grup

1 6 2 8 2 2 2 4

Total 8 4 12 Kesalahan klasifikasi ditentukan dengan nilai APER sebagai berikut :

π‘π‘π‘–π‘–π‘π‘π‘Žπ‘Žπ‘–π‘– 𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 =2 π‘₯π‘₯ 2

12= 0,333

Jadi, nilai ketepatan klasifikasi yang diperoleh adalah 1 – 0,333 = 0,667 atau sekitar 67%. 5. Kesimpulan

Berdasarkan hasil pembahasan mengenai data tingkat kecerdasan intelektual (IQ) siswa di salah satu SMU swasta Surabaya yang dikategorikan menjadi 2, yaitu β‰₯ 100 dan < 100 dapat ditarik kesimpulan sebagai berikut : a. Data telah memenuhi asumsi normal multivariat serta matrik varians kovarians

yang homogen, sehingga dapat dilanjutkan menggunakan analisis diskriminan. b. Pada pengujian vektor nilai rataan, hanya variabel AR yang berpengaruh signifikan

dalam membedakan kelompok tingkat IQ. c. Perhitungan prosentase ketepatan hasil klasifikasi dengan menggunakan SPSS

menghasilkan nilai 75% untuk data training dan 66,67% untuk data testing. Nilai presentase yang sama juga dihasilkan oleh analisis diskriminan secara manual.

d. Hasil klasifikasi yang dihasilkan oleh SPSS dan hasil perhitungan secara manual memiliki sedikit perbedaan meskipun nilai ketepatan klasifikasinya sama. (note : seharusnya hasil klasifikasi dari SPSS dengan proses manual sama)

6. Daftar Pustaka

Johnson, R.A., and Wichern, D.W. (1992). Applied Multivariate Statistical Analysis. Prentice Hall, Englewood Cliffs, New Jersey.

Germana, Retno P. (2001). Tesis β€œAplikasi Analisis Model Komponen Varians Multilevel Pada Hasil Tes Psikologi di Beberapa SMU Swasta di Surabaya”. Surabaya: Institut Teknologi Sepuluh Nopember.