analisis diskriminan

17
PERBANDINGAN KETEPATAN KLASIFIKASI TRAINING DAN TESTING PADA METODE ANALISIS DISKRIMINAN Agnisa Bhakti Persada (1) (1307100009) Intan Puspita Rani (2) (1307100032) (1) [email protected] , (2) in_niez _muach @yahoo.com Abstrak Persaingan dalam bidang industri dan bisnis meningkat seiring dengan perkembangan teknologi, untuk itu perusahaan senantiasa mempertahankan pelanggan yang telah menggunakan produk ataupun jasa yang dihasilakan dalam produktivitas pabrik ataupun perusahaannya. Maka dari itu perusahaan HBAT mencoba melakukan analisis statistika yaitu terkait dengan analisis diskriminan guna mengetahui apakah pengelompokkan variabel-variabel yang ada dan kemudian dikelompokkan kedalam tiga kelompok, yaitu identitas pelanggan, persepsi pelanggan, dan hubungan dengan pelanggan telah sesuai berdasarkan kelompok variabel yang saling independent. Pengklasifikasian dilakukan untuk mengetahui apakah kelompok-kelompok tersebut memang berbeda secara statistika. Kelompok-kelompok ini terjadi karena ada pengaruh satu atau lebih variabel lain yang merupakan variabel independen. Berdasarkan uji asumsi ternyata data pada perusahaan HBAT telah memenuhi distribusi normal multivariate, baik untuk data training 1 maupun data training 2, selain itu juga matrika varian-kovarian antar variabel dependent homogen. Namun, dari sekain banyak variabel dependent yang ada, baik untuk data testing1 ataupun data training 1 maupun data testing2 ataupun data training 2 hanya terdapat tiga variabel dependent yang signifikan, yaitu X 6 (kualitas produk), X 9 (resolusi keluhan) dan X 12 (kesan tenaga pegawai). Tiga variabel tersebut digunakan untuk memodelkan data yang ada. Permasalahan yang dihadapi tiap perusahaan perkebunan hampir sama adanya persaingan berdasarkan analisis diskriminan, ternyata diperoleh kesimpulan bahwa terdapat perbedaan antar kelompok data, sehingga dilakukan analisis lebih lanjut untuk mengetahui ketepatan pengelompokan data. Dari perbandingan data yang digunakan sebanyak 70:30, diperoleh informasi bahwa tingkat ketepatan untuk data testing yang berjumlah 30 data lebih kecil yaitu sebesar 73,3% jika dibandingkan tingkat ketepatan pengklasifikasian data training dengan persentase sebesar 81,4%. Sedangkan dari perbandingan data yang digunakan sebanyak 55:45, diperoleh informasi bahwa tingkat ketepatan untuk data testing yang berjumlah 45 data lebih kecil yaitu sebesar 66,7% jika dibandingkan tingkat ketepatan pengklasifikasian data training dengan persentase sebesar 83,6%. Maka dari itu, model yang diperoleh dari perbandingan data 70:30 dan perbandingan data 55:45 kurang tepat dan kurang sesuai, tetapi jika dibandingkan perbandingan data 70:30 lebih baik dari pada perbandingan data 55:45 . Kata kunci: analisis diskriminan, normal multivariat,homogenitas, data HBAT. 1. Pendahuluan 1

Upload: intan-puspita-rani

Post on 18-Jun-2015

2.304 views

Category:

Documents


8 download

TRANSCRIPT

Page 1: analisis Diskriminan

PERBANDINGAN KETEPATAN KLASIFIKASI TRAINING DAN TESTING PADA METODE ANALISIS DISKRIMINAN

Agnisa Bhakti Persada (1) (1307100009)Intan Puspita Rani (2) (1307100032)

(1)[email protected] ,(2)in_niez _muach @yahoo.com

Abstrak

Persaingan dalam bidang industri dan bisnis meningkat seiring dengan perkembangan teknologi, untuk itu perusahaan senantiasa mempertahankan pelanggan yang telah menggunakan produk ataupun jasa yang dihasilakan dalam produktivitas pabrik ataupun perusahaannya. Maka dari itu perusahaan HBAT mencoba melakukan analisis statistika yaitu terkait dengan analisis diskriminan guna mengetahui apakah pengelompokkan variabel-variabel yang ada dan kemudian dikelompokkan kedalam tiga kelompok, yaitu identitas pelanggan, persepsi pelanggan, dan hubungan dengan pelanggan telah sesuai berdasarkan kelompok variabel yang saling independent. Pengklasifikasian dilakukan untuk mengetahui apakah kelompok-kelompok tersebut memang berbeda secara statistika. Kelompok-kelompok ini terjadi karena ada pengaruh satu atau lebih variabel lain yang merupakan variabel independen. Berdasarkan uji asumsi ternyata data pada perusahaan HBAT telah memenuhi distribusi normal multivariate, baik untuk data training 1 maupun data training 2, selain itu juga matrika varian-kovarian antar variabel dependent homogen. Namun, dari sekain banyak variabel dependent yang ada, baik untuk data testing1 ataupun data training 1 maupun data testing2 ataupun data training 2 hanya terdapat tiga variabel dependent yang signifikan, yaitu X6 (kualitas produk), X9

(resolusi keluhan) dan X12 (kesan tenaga pegawai). Tiga variabel tersebut digunakan untuk memodelkan data yang ada. Permasalahan yang dihadapi tiap perusahaan perkebunan hampir sama adanya persaingan berdasarkan analisis diskriminan, ternyata diperoleh kesimpulan bahwa terdapat perbedaan antar kelompok data, sehingga dilakukan analisis lebih lanjut untuk mengetahui ketepatan pengelompokan data. Dari perbandingan data yang digunakan sebanyak 70:30, diperoleh informasi bahwa tingkat ketepatan untuk data testing yang berjumlah 30 data lebih kecil yaitu sebesar 73,3% jika dibandingkan tingkat ketepatan pengklasifikasian data training dengan persentase sebesar 81,4%. Sedangkan dari perbandingan data yang digunakan sebanyak 55:45, diperoleh informasi bahwa tingkat ketepatan untuk data testing yang berjumlah 45 data lebih kecil yaitu sebesar 66,7% jika dibandingkan tingkat ketepatan pengklasifikasian data training dengan persentase sebesar 83,6%. Maka dari itu, model yang diperoleh dari perbandingan data 70:30 dan perbandingan data 55:45 kurang tepat dan kurang sesuai, tetapi jika dibandingkan perbandingan data 70:30 lebih baik dari pada perbandingan data 55:45 .

Kata kunci: analisis diskriminan, normal multivariat,homogenitas, data HBAT.

1. Pendahuluan

Meningkatnya pertumbuhan penduduk di Indonesia seiring dengan berkembangnya berbagai usaha guna memenuhi kebutuhan masyarakat tersebut. Seperti halnya aspek dalam bidang industri dan bisnis yang meningkat guna memenuhi kebutuhan konsumen yang meningkat pula. Namun, dengan semakin menjamurnya perusahaan dan pabrik di Indonesia harus diwaspadai oleh para pengusaha dan pemilik pabrik, karena persaingan yang semakin ketat untuk mendapatkan konsumen. Secara umum, para pengusaha dan pemilik pabrik selalu berusaha mempertahankan pelanggan, karena biaya untuk mencari pelanggan baru jauh lebh mahal daripada mempertahankan pelanggan yang ada. Untuk

itu, perusahaan HBAT berusaha mengenal perilaku konsumen dengan melakukan pengelompokan variabel-variabel yang ada kedalam tiga kategori, yaitu identitas pelanggan, persepsi pelanggan, dan hubungan dengan pelanggan. Perusahaan HBAT menyadari betul bahwa mengenal perilaku pelanggan menjadi hal yang tak kalah penting, mengingat banyak pesaing dalam jenis usaha yang sama. Maka dari itu dalam praktikum kali ini, digunakan data HBAT yang kemudian dianalisis dengan analisis

1

Page 2: analisis Diskriminan

diskriminan. Praktikum dengan menggunakan data HBAT dilakukan untuk mengetahui hasil pemeriksaan multivariate normal, ta HBAT.

Dengan adanya praktikum ini diharapkan dapat diperoleh informasi mengenai hasil pemeriksaan multivariate normal, hasil uji kesamaan matrik varian kovarian, analsis diskriminan pada data HBAT 1(70 data training dan 30 data testing) dan analsis diskriminan pada data HBAT 2(55 data training dan 45 data testing) yang selanjutnya akan dilakukan perbandingan data hasil analisis diskriminan pada data HBAT perbandingan 1 dan data HBAT perbandingan 2, guna mengetahui model yang lebih bauk dalam analsis diskriminan.

2. Landasan Teori

Dalam penyelesaian makalah ini tidak hanya dibutuhkan data mengenai variabel dependent dan independent dari perusahaan HBAT, tetapi diperlukan pula metode yang tepat. Maka berikut ini akan dijelaskan metode yang akan dipakai dalam penyelesaian makalah ini.

Analisis Diskriminan

Analisis diskriminan adalah teknik statistika untuk mengelompokkan individu-individu ke dalam kelompok-kelompok yang saling bebas dengan tegas berdasarkan sekelompok variabel bebas. Pengklasifikasian adalah salah satu analisis statistika yang diperlukan jika ada beberapa kelompok kemudian ingin diketahui apakah kelompok-kelompok tersebut memang berbeda secara statsitika. Kelompok-kelompok ini terjadi karena ada pengaruh satu atau lebih variabel lain yang merupakan variabel independen. Kombinasi linier dari variabel-variabel ini akan membentuk suatu fungsi diskriminan.

Dalam analisis diskriminan terdapat 2 metode berdasarkan jumlah kategori dari variabel dependennya. Apabila terdapat 2 kategori yang terlibat da- lam pengklasifikasian, maka disebut dengan two-group discriminant analysis. Sedangkan apabila terdapat 3 atau lebih kategori yang terlibat dalam pengklasifikasian, maka disebut dengan multiple discriminant analysis.

Analisis diskriminan merupakan suatu analisis dengan tujuan membentuk sejumlah fungsi diskriminan, yang dapat digunakan sebagai cara terbaik untuk memisahkan kelompok-kelompok. Manfaat utama analisis diskriminan adalah

1. Cara terbaik untuk menyatakan perbedaan antar segmen tersebut (masalah diskriminan).2. Cara untuk mengalokasikan suatu objek baru ke dalam salah satu kelompok tersebut.

Dalam buku Johnson, R. A. dan Wichern, D. W dijelaskan bahwa fungsi diskriminan pertama kali diperkenalkan oleh Ronald A. Fisher (1936) dengan menggunakan beberapa kombinasi linier dari pengamtan yang cukup mewakili populasi. Menurut Fisher, untuk mencari kombinasi linier dari p variabel bebas tersebut dapat dilakukan dengan pemilihan koefisien-koefisiennya yang menghasilkan hasil bagi maksimum antara matrik peragam antar kelompok (between-group) dan matrik peragam dalam kelompok (within-group).

Adapun asumsi-asumsi yang harus dipenuhi sebelum melakukan analisis diskriminan, antara lain yaitu:

• Variabel independen berdistribusi normal multivariat (multi variates normal distribution).• Varians dalam setiap kelompok adalah sama (equal variances).

Analisis diskriminan dapat dilakukan bila terdapat perbedaan yang nyata antar kelompok, sehingga pada tahap awal yang harus dilakukan adalah uji hipotesis nol bahwa tidak ada perbedaan kelompok di antara individu yang dirumuskan dengan:H0 : µ1 = µ2 = … = µk

H1 : µi ≠ µj ( minimal terdapat 2 kelompok yang berbeda)Taraf signifikansi α = 0,05Statistik uji yang digunakan adalah Wilks’Lamda (Λ”):

2

Page 3: analisis Diskriminan

Wilks’Lamda (Λ”) =

dengan : = pengamatan ke-j pada kelompok ke-l

= vektor rata-rata kelompok ke-l

= jumlah individu kelompok pada kelompok ke-l

= semua vektor rata-rata pada kelompok ke-l

Daerah Kritis : tolak H0 jika Wilk’s lambda > α.

Distribusi Normal Multivariat

Distribusi normal multivariat merupakan distribusi yang dibentuk dari perluasan distribusi normal univariat untuk data multivariat. Pengujian ini dilakukan untuk memperkuat dugaan bahwa distribusi data yang terkumpul telah berdistribusi normal multivariat.

Variabel dikatakan berditribusi normal multivariat dengan parameter dan jika

mempunyai probability density function :

Jika berdistribusi normal multivariat maka berditribusi .

Berdasarkan sifat ini maka pemeriksaan distribusi normal multivariat dapat dilakukan dengan cara

membuat q-q plot dari nilai .

Tahapan dari pembuatan q-q plot ini adalah sebagai berikut.1. Mulai2. Tentukan nilai vektor rata-rata : 3. Tentukan nilai matriks varians-kovarians : S4. Tentukan nilai jarak Mahalanobis setiap titik pengamatan dengan vektor rata-ratanya

5. Urutkan nilai dari kecil ke besar :

6. Tentukan nilai

7. Tentukan nilai sedemikian hingga

8. Buat scatter-plot dengan

9. Jika scatter-plot ini cenderung membentuk garis lurus dan lebih dari 50 % nilai

10. Selesai.

3

Page 4: analisis Diskriminan

Kehomogenan Matriks Varians-Kovarians

Beberapa analisis statistika multivariate seperti discriminant analysis dan MANOVA membutuhkan syarat matriks varians-kovarians yang homogen. Untuk menguji syarat ini dapat dipergunakan statistik uji Box-M, dengan hipotesis sebagai berikut.Ho :

H1 : untuk Statistik uji:

dan

Terima hipotesis nol yang berarti matriks varians-kovarians bersifat homogen jika

3. Metodologi Penelitian

Data yang digunakan adalah data HBAT, dimana terdiri atas variabel dependen dan variabel independen. Variabel dependen adalah customer intention yang memiliki 2 kategori yaitu tidak melanjutkan kerjasama (0) dan melanjutkan kerjasama (1) di waktu yang akan datang. Sedangkan variabel independennya adalah kelompok persepsi pelanggan terhadap produk yang memiliki 13 variabel. Variabel-variabel yang termasuk kelompok persepsi pelanggan terhadap produk antara lain Kualitas produk (X6), Aktivitas perdagangan online/website (X7), Pendukung teknis (X8), Resolusi keluhan (X9), Periklanan (X10), Macam produk (X11), Kesan tenaga pegawai (X12), Persaingan harga (X13), Jaminan dan tuntutan (X14), Produk baru (X15), Pemesanan dan penagihan (X16), Fleksibilitas harga (X17), Kecepatan pengiriman (X18). Dalam makalah ini dilakukan dua perbandingan data, yang pertama adalah perbandingan data training sebanyak 70 data, dan testing sebanyak 30 data. Sedangkan perbandingan kedua data training sebanyak 55 data, dan testing sebanyak 45 data.

Untuk melakukan analisis diskriminan dalam makalah ini, diharuskan untuk menempuh langkah-langkah yang sudah dibuat. Langkah-langkah tersebut adalah seperti berikut.a. Mengacak (random) data yang telah disiapkan.b. Membagi data menjadi 2 perbandingan yaitu 70 data (training 1) dan 30 data (testing 1), serta 55

data (training 2) dan 45 data (testing 2).c. Melakukan uji normal multivariat terhadap variabel independen dari kedua data training dengan

bantuan macro MINITAB. d. Menguji kehomogenan matriks varians-kovarians terhadap variabel dependen kedua data training

dengan bantuan SPSS.e. Melakukan analisis dengan analisis diskriminan terhadap kedua data perbandingan dengan bantuan

SPSS.f. Membandingkan hasil analisis diskriminan perbandingan data 1 dengan perbandingan data 2.

4

Page 5: analisis Diskriminan

g. Membuat kesimpulan dari hasil analisis.

Adapun alur dari pengerjaan makalah ini adalah sebagai berikut :

5

Mulai

Data

Ya

Apakah data mengikuti sebaran distribusi normal?

Selesai

Apakah matriks varian-kovarian dari variabel dependen homogen?

Analisis Diskriminan

Kesimpulan

Ya

Membandingkan hasil analisis dari data HBAT 1 dengan data HBAT 2

Data Training Data Testing

Random Data

Tidak

Tidak

Page 6: analisis Diskriminan

Gambar.1 Diagram Alur Analisis Diskriminan

4. Analisis Data dan Pembahasan

Uji Normal Multivariat

Asumsi yang diperlukan di dalam discriminant analysis salah satunya adalah data mengikuti sebaran normal multivariat. Hal ini dilakukan karena pengujian dengan menggunakan statistik uji Wilk Lambda. Kesimpulan yang diambil berdasarkan statistik ini dikatakan sahih (valid), jika syarat distribusi multinormal dipenuhi.

Hipotesis:

H0 : data berdistribusi normal multivariatH1 : data tidak berdistribusi normal multivariatTaraf Signifikansi: α = 0,5Daerah Kritis : tolak , jika t < αStatistik Uji : t = 0,542857, nilai t diperoleh dari tabel 1dengan menggunakan macro minitab seperti berikut.

Tabel 1. Uji Normal Multivariat Data Training

Data t

Training 1 0.542857

Training 2 0.527273

Berdasarkan tabel. 1 dapat diketahui nilai t untuk data training 1 dan training 2 berturut-turut adalah 0,542857 dan 0.527273. nilai statistik uji dari kedua data (training 1 dan training 2) lebih besar dari nilai signifikansi yang ditetapkan, sehingga dapat diambil keputusan untuk gagal menolak

. Hal Berarti baik pada data training 1 maupun data training 2, mengikuti sebaran distribusi norma multivariat.

Secara visual untuk mengetahui data berdistribusi normal multivariat, dapat dilihat dari scatter plot antara pasangan (d2

j = qj) berikut.

a. Data Training 1

30252015105

30

25

20

15

10

5

dd

q

Scatterplot of q vs dd

b. Data Training 2

Gambar 2. Scatterplot Data HBAT Training

6

Page 7: analisis Diskriminan

Berdasarkan scatter plot secara visual terlihat bahwa sebaran titik-titik dari data baik pada data training 1 maupun data training 2, berada disekitar garis normal. Sehingga baik secara perhitungan maupun secara visual dapat disimpulkan bahwa data HBAT training 1 dan training 2 untuk semua variabel independen (kelompok persepsi pelanggan terhadap produk) berdistribusi normal multivariat.

Uji Homogenitas

Asumsi yang harus dipenuhi dalam analisis varians multivariat dan analisis kovariansi multivariat adalah bahwa matriks varians kovariansnya adalah homogen. Maka berikut ini adalah pengujian matriks varians-kovarians terhadap variabel dependen customer intention.

Hipotesis:

H0 : matriks varians kovarians dari variabel dependen pada data training homogenH1 : matriks varians kovarians dari variabel dependen pada data training tidak homogen

Statistik Uji :

Taraf Signifikansi :α = 0,05Daerah Kritis :tolak , jika Sig. < α

Berdasarkan analisis dengan SPSS untuk uji homogenitas variabel dependen, diperoleh output sebagai berikut :

Tabel 2. Box's Test of Equality of Covariance Matricesa

Data Sig.

Training 1 0.162Training 2 0,058678

Dari tabel Tabel 2. Box's Test of Equality of Covariance Matricesa diperoleh Pvalue untuk masing-masing data training lebih besar dari nilai α yang ditetapkan, sehingga dapat diambil keputusan untuk gagal menolak H0. Maka dapat disimpulkan bahwa matriks varians kovarians untuk variabel dependen pada data training 1 dan training 2 adalah homogen.

Uji Signifikansi Variabel

Uji signifikansi variabel digunakan untuk mengetahui variabel mana yang paling signifikan bermakna dari berbagai variabel independent yang ada. Variabel yang signifikan nantinya akan digunakan untuk memodelkan data dalam bentuk persamaan regresi.

Dengan bantuan software SPSS, uji signifikansi dapat dilakukan. Berdasarkan hasil output dari uji tersebut diperoleh informasi mengenai beberapa variabel independent yang signifikan bermakna yang nantinya dapat digunakan dalam memodelkan data tersebut. Penentuan variabel mana saja yang dianggap signifikan ini adalah dengan melihat nilai sig. pada tabel Tests of Equality of Group Means. Jika nilai sig. lebih kecil dari nilai α , maka variabel tersebut termasuk variabel yang signifikan. Sedangkan jika nilai sig. lebih besar dari nilai α, maka variabel tersebut tidak termasuk dalam kategori yang signifikan, sehingga variabel tersebut jelas tidak boleh dipakai untuk membuat model persamaan analisis diskriminan. Variabel independent yang signifikan untuk data training 1 antara lain X6 (kualitas produk) , X7 (aktivitas perdagangan online/website) , X9 (resolusi keluhan) , X11

(macam produk) , X12 (kesan tenaga pegawai) , X16 (pemesanan dan penagihan) dan X18 (kecepatan

7

Page 8: analisis Diskriminan

pengiriman). Sedangkan pada data training 2 variabel yang termasuk dalam kategori signifikan tidak lain halnya dengan data training 1, hanya saja pada data training 2, variabel X17 (fleksibilitas harga) juga termasuk dalam kategori variabel signifikan. Untuk lebih jelas mengetahui hal ini, dapat dilihat tabel 3 yang ada di bawah ini.

Tabel 3. Tests of Equality of Group Means

VariabelWilks' Lambda Sig.

Training 1 Training 2 Training 1 Training 2

X6 .888 .902 .005 .020

X7 .854 .919 .001 .035

X8 1.000 .999 .951 .812

X9 .739 .649 .000 .000

X10 .963 .932 .110 .055

X11 .862 .840 .002 .002

X12 .820 .816 .000 .001X13 1.000 .990 .973 .468X14 .992 .997 .467 .681X15 .993 .999 .477 .806X16 .844 .783 .001 .000X17 .974 .914 .181 .030X18 .773 .671 .000 .000

Dari variabel-variabel yang signifikan yang telah disebutkan di paragraf sebelunya, ada beberapa diantaranya terdapat variabel yang paling signifikan bermakna yang selanjutnya digunakan untuk memodelkan data. Sedangkan variabel yang lain yang bukan termasuk variabel paling signifikan dibuang. Hal ini akan dipertegas oleh output berdasarkan metode Wilk’s Lambda yang memperlihatkan variabel mana saja yang paling signifikan untuk dimodelkan.

Tabel 4. Variables Entered/Removed

StepEntered Sig.

Training 1 Training 2 Training 1 Training 2

1 X9 X9 .000 .000

2 X6 X6 .000 .000

3 X12 X12 .000 .000

Berdasarkan tabel Variables Entered/Removed diatas, terdapat 3 variabel independent yang paling signifikan dari tujuh variabel dari training 1 dan 3 variabel independent yang paling signifikan dari dan delapan variabel dari data training 2. Ketiga variabel tersebut dianggap signifikan berdasarkan tabel Tests of Equality of Group Means pada tabel 5. Tiga variabel yang ternyata paling signifikan dari data training 1 dan data training 2 adalah sama, yaitu variabel X6 (kualitas produk), X9

(resolusi keluhan) dan X12 (kesan tenaga pegawai). Sehingga variabel yang akan digunakan untuk memodelkan data adalah variabel kualitas produk, resolusi keluhan dan kesan tenaga pegawai. Adapun koefisien uantuk variabel tersebut dapat dilihat pada tabel dibawah ini.

8

Page 9: analisis Diskriminan

Tabel 5. Standardized Canonical Discriminant Function Coefficients

VariabelFunction 1

Training 1 Training 2X6 .653 .606X9 .694 .741X12 .629 .663

Tabel 5 diatas menunjukkan koefisien untuk masig-masing variabel signifikan yang digunakan untuk permodelan data. Berdasarkan tabel 5, diperoleh model persamaan untuk data training 1 yaitu : Y= 0,653 X6 + 0,694 X9 + 0,629 X12 . sedangkan model persamaan untuk data training 2 yaitu Y = 0,606X6 + 0,471X9 + 0,663X12.

Model persamaan yang diperoleh dapat mewakili model data dengan variabel independent yang digunakan adalah variabel yang dianggap paling signifikan berdasarkan metode Wilk’s Lambda.

Analisis Diskriminan

Pada dasarnya Analisis diskriminan adalah teknik statistika untuk mengelompokkan individu-individu ke dalam kelompok-kelompok yang saling bebas dengan tegas berdasarkan sekelompok variabel bebas. Analisis diskriminan dapat dilakukan bila terdapat perbedaan yang nyata antar kelompok, sehingga pada tahap awal yang harus dilakukan adalah uji hipotesis nol bahwa tidak ada perbedaan kelompok di antara individu yang dirumuskan dengan:Hipotesis:H0 :

H1 : α = 0,05

Statistik uji yang digunakan adalah Wilks’Lambda. Output hasil SPSS ditampilkan pada tabel 6.

Tabel 6. Wilks' Lambda

Test of Function(s)

Wilks' Lambda Sig.

Training 1 Training 2 Training 1 Training 21 .531 .471 .000 .000

Berdasarkan tabel Wilks' Lambda, nilai Pvalue untuk analisis diskriminan pada data training 1 dan training 2 sama-sama bernilai 0,000, dimana nilai Pvalue tersebut < nilai α= 0,05, maka tolak H0. Jadi dapat disimpulkan bahwa minimal terdapat dua kelompok data yang berbeda secara signifikan atau dengan kata lain terdapar perbedaan yang nyata antar kelompok. Karena terdapat perbedaan yang nyata antar kelompok, maka dapat dilanjutkan dengan menggunakan analisis diskriminan untuk mengelompokkan individu-individu ke dalam kelompok-kelompok yang saling bebas dengan tegas berdasarkan sekelompok variabel bebas. Untuk mengetahui apakah kelompok-kelompok data memang

9

Page 10: analisis Diskriminan

berbeda secara statistik karena kelompok-kelompok ini terjadi karena ada pengaruh satu atau lebih variabel lain yang merupakan variabel independen, dapat dilihat output hasil klasifikasi kelompok data sebagai berikut :

Tabel 7. Classification Results Data Training

X23 Y

Predicted Group Membership Total

Training 1 Training 2 Training 1

Training 20 1 0 1

Original

Count0 38 4 23 5 42 28

1 9 19 4 23 28 27

%0 90.5 9.5 82,1 17,9 100.0 100

1 32.1 67.9 14,8 85,2 100.0 100

a. 81.4% of original grouped cases correctly classified (training 1)

b. 83,6% of original grouped cases correctly classified (training 2)

Berdasarkan tabel hasil klasifikasi, untuk data training 1, dapat dikatakan bahwa jumlah data yang diprediksi berada pada klasifikasi pertama (kelompok 0) dan seharusnya berada pada klasifikasi pertama adalah sebanyak 38 data, sedangkan yang tidak berada pada klasifikasi pertama adalah sebanyak 4 data. Jumlah data yang seharusnya masuk pada klasifikasi kedua (kelompok 1) dan ternyata tidak masuk pada klasifikasi kedua adalah sebanyak 9 data, sedangkan jumlah data yang diprediksi berada pada klasifikasi kedua dan ternyata masuk pada klasifikasi kedua adalah sebanyak 19 data.

Sedangkan untuk data training 2, dapat dikatakan bahwa jumlah data yang diprediksi berada pada klasifikasi pertama (kelompok 0) dan seharusnya berada pada klasifikasi pertama adalah sebanyak 23 data, sedangkan yang tidak berada pada klasifikasi pertama adalah sebanyak 5 data. Jumlah data yang seharusnya masuk pada klasifikasi kedua (kelompok 1) dan ternyata tidak masuk pada klasifikasi kedua adalah sebanyak 4 data, sedangkan jumlah data yang diprediksi berada pada klasifikasi kedua dan ternyata masuk pada klasifikasi kedua adalah sebanyak 23 data.

Ketepatan klasifikasi untuk kelompok data training 1 dan data training 2 berturut-turut adalah sebesar 81,4 % dan 83,6%. Tingkat persentase ketepatan pada data masing-masing data training ini akan dibandingkan dengan persentase ketepatan untuk data testing seperti yang terdapat di tabel berikut.

Tabel 8. Output SPSS Classification Result Data Testing

X23

Y

Predicted Group Membership Total

Testing 1 Testing 2 Testing 1

Testing 20 1 0 1

Original

Count0 12 5 20 7 17 271 3 10 8 10 13 18

%0 70.6 29.4 74,1 25,9 100.0 100.01 23.1 76.9 44,4 55,6 100.0 100.0

10

Page 11: analisis Diskriminan

a. 73,3% of original grouped cases correctly classified (testing 1).

b. 66,7% of original grouped cases correctly classified (testing 2).

Berdasarkan tabel klasifikasi untuk data training dan data testing diperoleh tingkat ketepatan klasifikasi untuk data training lebih besar daripada tingkat ketepatan klasifikasi pada data testing, dimana untuk data training 1 diperoleh tingkat ketepatan klasifikasi sebesar 81,4 %, sedangkan tingkat ketepatan klasifikasi untuk data testing 2 sebesar 73,3 % dengan perbandingan jumlah data adalah 70 : 30. Jumlah data yang digunakan sebagai data training sebanyak 70 data dan untuk data testing sebanyak 30 data. Untuk data training 2 diperoleh tingkat ketepatan klasifikasi sebesar 83,6 %, sedangkan tingkat ketepatan klasifikasi untuk data testing 2 sebesar 66,7 % dengan perbandingan jumlah data adalah 55 : 45. Jumlah data yang digunakan sebagai data training sebanyak 55 data dan untuk data testing sebanyak 45 data. Karena persentase ketepatan klasifikasi pada data testing < persentase ketepatan kalsifikasi pada data training, maka dapat disimpulkan bahwa model yang dihasilkan belum tepat dan kurang bagus. Untuk itu perlu dilakukan perbaikan jumlah perbandingan data training dan testing.

Perbandingan Antara Perbandingan Data 1 Dan Perbandingan Data 2

Berikut ini akan dilakukan perbandingan antara perbandingan data 1 dan perbandingan data 2, yang dapat dilihat dari nilai ketepatan klasifikasi. Berikut ini akan ditampilkan perbandingan unuk kedua data tersebut.

Tabel 9. Perbandingan Data 1 Dan Perbandingan Data 2

Perbandingan Data Nilai Ketepatan Klasifikasi

1Training 81,40%

Testing 73,70%

2Training 83,60%

Testing 66,70%

Dari tabel di atas dapat diketahui bahwa nilai ketepatan data testing dari masing-masing perbandingan lebih rendah dari nilai ketepatan data training. Akan tetapi jika dibandingkan antara nilai ketepatan klasifikasi data testing 1 lebih baik dari nilai ketepatan klasifikasi data testing 2. Selain itu selisih antara nilai ketepatan klasifikasi data training 1 dengan data testing 1 lebih kecil dari nilai ketepatan klasifikasi data training 2 dengan nilai ketepatan klasifikasi data testing 2. Maka dapat disimpulkan bahwa baik dengan perbandingan jumlah data training sebanyak 70 data dan testing sebanyak 30 data menghasilkan model persamaan analisis diskrimanan yang lebih baik dari pada dengan perbandingan jumlah data training sebanyak 55 data dan testing sebanyak 45 data.

5. Kesimpulan dan Saran

Berdasarkan pembahasan yang ada mengenai data di perusahaan HBAT yang dikategorikan menjadi tiga ketgori, yaitu identitas pelanggan, persepsi pelanggan, dan hubungan dengan pelanggan, dapat ditarik kesimpulan bahwa semua asumsi dalam analisis diskriminan terpenuhi, dimana asumsi tersebut adalah data telah berdistribusi normal multivariat yang ditunjukkan dengan nilai t > 0,5, serta matrik varian kovarians variabel dependen telah homogen sehingga analisis diskriminan dapat dilanjutkan. Adapun hasil analisis diskriminan menunjukkan bahwa terdapat perbedaan yang nyata antar kelompok data. Dalam uji signifikansi variabel, baik pada data perbandingan 1 dan perbandingan 2, terdapat tiga variabel yang dianggap paling signifikan bermakna berdasarkan metode regresi stepwise, variabel tersebut adalah kualitas produk, resolusi keluhan dan kesan tenaga pegawai. Dari tiga variabel yang signifkan tersebut, diperoleh bentuk persamaan untuk memodelkan data. Untuk

11

Page 12: analisis Diskriminan

perbandingan data 1 ( training = 70) yaitu : Y= 0,653 X6 + 0,694 X9 + 0,629 X12. Sedangkan untuk perbandingan data 2( training = 55) yaitu : 0,606X6 + 0,471X9 + 0,663X12.

Berdasarkan analisis diskriminan yang dilakukan terdapat perbedaan tingkat ketepatan klasifikasi data training 1 dan training 2, yaitu 81,4% dan 83,6 %. Sedangkan ketepatan klasifikasi untuk data testing 1 dan testing 2 yang bernilai 73,3% dan 66,7 %. Jelas sekali bahwa nilai ketepatan data testing dari masing-masing perbandingan lebih rendah dari nilai ketepatan klasifikasi data training. Akan tetapi, nilai ketepatan klasifikasi data testing 1 lebih baik dari nilai ketepatan klasifikasi testing 2, serta selisih antara nilai ketepatan klasifikasi data training 1 dengan data testing 1 lebih baik kecil dari selisih antara nilai ketepatan klasifikasi data training 2 dengan data testing 2. Maka dapat disimpulkan bahwa model yang diperoleh untuk analisis diskriminan dengan perbandingan jumlah data training 1 dan testing 1 sebesar 70:30 dari pada dengan perbandingan jumlah data training sebanyak 55 data dan testing sebanyak 45 data.

Dengan kesimpulan yang telah diperoleh, maka dapat disarankan untuk menyelesaikan makalah ini, dibutuhkan pemahaman konsep tentang analisis diskriminan agar dapat menginterpretasikan data yang diperoleh dengan detail, sehingga permasalahan yang dihadapi dapat terbantu penyeleasaiannya dengan analisis diskriminan. Selain itu untuk menghasilkan model persamaan diskriminan yang baik, perlu banyak melakukan percobaan dalam perbandingan data.

6. Daftar Pustaka

Iriawan, Nur dan Septin Puji Astutik. (2006). Mengolah Data Statistik Dengan Mudah Menggunakan Minitab 14. Andi, Yogyakarta.

Johnson, R. A. dan Wichern, D. W. 1992. Applied Multivariate Statistical Analysis. New Jersey: Prentice Hall

Santoso, Singgih. Buku Latihan SPSS Statistik Multivariate. Jakarta: Penerbit PT Elex Media Komputindo Kelompok Gramedia

12