analisis diskriminan 2
DESCRIPTION
UNIVERSITAS NEGERI MALANGFAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAMPROGRAM STUDI MATEMATIKATRANSCRIPT
ANALISIS DISKRIMINAN DAN APLIKASINYA DALAM KEHIDUPAN
MAKALAH
Disusun untuk memenuhi tugas mata kuliah Analisis Statistik Multivariat yang
dibimbing oleh Ibu Trianingsih
oleh
Bunga Suci Bintari 908312410091
A.Ali Syihabuddin 308312417490
Etika Wahyu Kartika 308312417501
Niken Susanti 308312417502
UNIVERSITAS NEGERI MALANG
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
JURUSAN MATEMATIKA
OKTOBER 2011
BAB I
PENDAHULUAN
LATAR BELAKANG
Analisis diskriminan merupakan teknik menganalisis data, dimana variabel
dependen merupakan data kategorik ( nominal dan ordinal ) sedangkan variabel
independen berupa data interval atau rasio .Misalnya berdasarkan data dari nasabah
peminjam kredit suatu bank, seperti penghasilan, umur, pekerjaan, tingkat pendidikan,
ingin meramalkan apakah seseorang nasabah yang baru termasuk jujur atau tidak jujur.
Analisis diskriminan ini termasuk dalam analisis multivariat dengan metode
dependensi. Ada dua metode dalam analisis multivariat yaitu metode dependensi dan
metode interdenpendensi . Metode dependensi yaitu variabel-variabelnya tidak saling
bergantung satu dengan yang lain, sedangkan metode interdenpendensi adalah
antarvariabelnya ada saling ketergantungan. Variabel dependen adalah data kategorikal.
Jika data kategorikal terdiri dari dua kelompok atau kategori disebut Two-Group
Discriminant Analysis , sedangkan jika lebih dari dua kategori disebut dengan Multiple
Discriminant Analysis.
Peranan dan aplikasi analisis diskriminan yang merupakan salah satu dari teknik
statistik multivariat yang banyak digunakan dalam berbagai bidang ilmu yang terjadi
dalam sebuah fenomena sosial, keuangan dan ekonomi
Analisis diskriminan sangat menarik, karena ada banyak hal yang bisa dijawab
dalam kehidupan ini jika memahami analisis diskriminan seperti :
1. Mengapa ada perusahaan yang bangkrut dan yang lain tetap berdiri?
2. Mengapa ada nasabah bank yang membayar hutang dengan lancar dan yang lain
macet ?
3. Mengapa sebagian orang lebih suka bank swasta dibanding bank pemerintah?
4. Dengan analisis diskriminan,direktur personalia dapat meramalkan apakah
seseorang calon karyawan perusahaan akan menjadi karyawan yang produktif atau
tidak produktif.
5. Seorang direktur perusahaan dapat meramalkan apakah seorang pelanggan
merupakan pelanggan loyal atau tidak.
6. Seorang direktur kredit suatu bank dapat meramalkan seseorang nasabah termasuk
jujur atau tidak jujur.
Analisis diskriminan digunakan asalkan pertanyaan penelitian mengarah pada
variabel tak bebas (dependent variable) yang berupa data kategori seperti :
macetlancar,untung-rugi, puas-tidak puas dan lainnya.
Analisis diskriminan adalah metode untuk mencari dasar pengelompokan
individu berdasarkan lebih dari satu variabel bebas. Analisis Diskriminan dipakai
untuk menjawab pertanyaan bagaimana individu dapat dimasukkan ke dalam
kelompok berdasarkan beberapa variabel. Persamaan Fungsi Diskriminan yang
dihasilkan untuk memberikan peramalan yang paling tepat untuk mengklasifikasi
individu kedalam kelompok berdasarkan skor variabel bebas .
B. Rumusan Masalah
1. Apa saja factor yang sangat mempengaruhi konsumen membeli produk body
lotion (A/B)?
2. Bagaimana Analisis fungsi diskriminan yang terbentuk?
C. Tujuan
1. untuk mengetahui factor yang snagat mempengaruhi konsumen membeli
konsumen membeli produk lotion.
2. Untuk mengetahui analisis fungsi diskriminan yang terbentuk.
BAB II
PEMBAHASAN
A. Kajian Teori
1. Analisis Diskriminan
Analisis diskriminan adalah salah satu teknik statistik yang bisa digunakan pada
hubungan dependensi (hubungan antarvariabel dimana sudah bisa dibedakan mana
variabel terikat dan mana variabel bebas). Lebih spesifik lagi, analisis diskriminan
digunakan pada kasus dimana variabel terikat berupa data kualitatif dan variabel
bebas berupa data kuantitatif. Analisis diskriminan bertujuan untuk
mengklasifikasikan suatu individu atau observasi ke dalam kelompok yang saling
bebas (mutually exclusive/disjoint) dan menyeluruh (exhaustive ) berdasarkan
sejumlah variabel bebas.
Ada dua asumsi utama yang harus dipenuhi pada analisis diskriminan ini, yaitu:
a. Sejumlah p variabel bebas harus berdistribusi normal.
b. Matriks varians-covarians variabel bebas berukuran pada kedua kelompok
harus sama.
Jika dianalogikan dengan regresi linier, maka analisis diskriminan merupakan
kebalikannya. Pada regresi linier, variabel terikat yang harus mengikuti distribusi
normal dan homoskedastis, sedangkan variabel bebas diasumsikan fixed, artinya
variabel bebas tidak disyaratkan mengikuti sebaran tertentu. Untuk analisis
diskriminan, variabel bebasnya seperti sudah disebutkan di atas harus mengikuti
distribusi normal dan homoskedastis, sedangkan variabel terikatnya fixed.
Analisis ini didasarkan atas fungsi diskriminan yang mempunyai bentuk umum:
Dimana Y adalah kelompok merupakan variabel boneka (dummy variables) dan
adalah variabel pembeda. Pada dasarnya fungsi diskriminan merupakan fungsi
regresi ganda dengan variabel dependen merupakan variabel boneka yang
mengambil nilai1,2,...,k yang sesuai dengan pengelompokan awal setiap individu dan
banyaknya kelompok (k).
2. Uji Kenormalan Multivariat
Menurut Karson(1982), untuk menguji kenormalan multivariate digunakan prosedur
yang dikembangkan oleh Mardia (1970) dengan cara menghitung dua macam ukuran
Statistic yaitu ukuran skewness (b1,p ) dan kurtosis (b2,p ) yaitu:
(
) ( ) ( )
(
) ( ) ( )
Hipotesis yang digunakan adalah:
Ho : multivariate mengikuti sebaran normal
H1 : multivariate tidak mengikuti sebaran normal
Bila (
( )( ) , dan [b2,p – p (p+2)]/ √( ( ) )
(tabel normal), maka Ho diterima , berarti multivariate mengikuti sebaran normal.
3. Uji Kesamaan Matrik Kovarians
Untuk menguji kesamaan matrik kovarians ( ) antar kelompok, digunakan
hipotesa:
Ho: = = =
H1: sedikitnya ada 2 kelompok yang berbeda
Statistik uji yang digunakan adalah statistik Box’s, yaitu :
-2 ln *= (n-k) ln |W / (n- k)|- ( -1) ln | |
dimana:
* =
( )
( ) ( )
k = banyaknya kelompok
W/(n-k)= matrik kovarians dalam kelompok gabungan
Sj = matrik kovarians kelompok ke-j
4. Uji Vektor Nilai Rata-rata
Pengujian terhadap vektor nilai rata-rata antarkelompok dilakukan denga
hipotesa:
setidaknya ada 2 kelompok yang berbeda
Statistik uji yang digunakan adalah statistik V-Bartlett, yang mengikut
sebaran Chi-Kuadrat dengan derajat bebas ( ), bila benar.
Statistik V-Bartlett diperoleh melalui :
[( )
] ( )
Dimana, = banyaknya pengamatan
= banyaknya peubah dalam fungsi pembeda (discriminant)
= banyaknya kelompok
dengan, = matrik jumlah kuadrat dan hasil kali data dalam kelompok
= matrik jumlah kuadrat dan hasil kali data antar kelompok
Jika ( ) ( ) maka menerima berarti bahwa terdapat
perbedaan vektor nilai rata-rata antarkelompok. Jika ( ) ( )
maka menolak .
Apabila ada perbedaan vektor nilai rataan, maka fungsi pembeda (discriminant)
layak disusun untuk mengkaji hubungan antar kelompok dan berguna untuk
mengelompokan suatu objek baru ke dalam salah satu kelompok tersebut.
5.
Flowchart Algoritma Analisis Deskriminan
MULAI
UJI
NORMALITAS
UJI
MULTIKOLINIERITA
UJI KESAMAAN
VARIAN-
UJI VOKTOR RATA-
RATA
ANALISIS DISKRIMINAN
DATA
CUTTING SKOR
DISKRIMINAN SKOR
HIT RASIO
KESIMPULAN
SELESAI
B. Aplikasi pada permasalahan sehari-hari
Persaingan body lotion cukup menarik untuk diperhatikan, body lotion
bagi sebagian wanita sudah menjadi bagian yang tidak terpisahkan dalam
kehidupan sehari-hari. Oleh karena itu perlu dilakukan penelitian mengenai
faktor apa saja yang diperhitungkan seorang konsumen untuk membeli produk
body lotion sehingga produsen mampu menciptakan produk body lotion yang
sesuai dengan ekspektasi konsumen.
Data responden dilengkapi dengan pertanyaan produk yang digunakan
A. Citra & B. Ponds, maka akan coba dilihatfaktor apa saja yang mempengaruhi
seorang responden memilih produk A atau produk B.
Untuk itu, akan dilakukan analisis diskriminan untuk mengetahui apa
saja yang menjadi pertimbangan seorang pembeli cenderung membeli produk A
atau produk B. Hasil analisis diskriminan ini memberikan manfaat bagi penjual
(toko/swalayan) yaitu menentukan level stok persediaan produk dengan
mempertimbangkan karakteristik pelanggan yang sering datang ke tokonya.
Delapan faktor tersebut diinterpretasikan sebagai berikut:
Faktor 1 : Kesegaran di Kulit
Faktor 2 : Aroma Tahan Lama
Faktor 3 : Kemasan
Faktor 4 : Jangka Waktu Kadaluarsa
Faktor 5 : Kekentalan
Faktor 6 : Tidak menyebabkan alergi
Faktor 7 : Ada Sample Gratis
Faktor 8 : Kesesuaian Harga & Kualitas
.Tabel 3.1 Data Responden (8 faktor dari hasil analisis faktor) dan Jenis Produk yang Dipilih
No Y X1 X2 X3 X4 X5 X6 X7 X8
1. 1.0 1.21 0.97 0.53 -0.28 -0.26 -0.44 -2.45 0.51
2. 2.0 0.13 -0.99 -0.02 0.26 1.91 -1.57 -0.44 0.36
3. 1.0 0.96 -0.45 0.05 -1.24 -1.5 -0.8 0.7 1.11
4. 1.0 1.14 0.96 0.6 -0.37 -0.15 -0.58 -1.61 0.45
5. 2.0 -1.22 -1.19 0.69 -0.02 0.56 -0.93 -0.37 -2.19
6. 2.0 -0.81 1.33 0.79 1.03 0.37 -0.28 -0.21 0.6
7. 2.0 0.58 1.43 -0.2 0.82 -0.91 -0.58 -0.46 -1.21
8. 2.0 -0.56 0.77 0.05 0.9 -0.49 -1.32 0.17 -0.72
9. 2.0 -0.53 -0.13 1.71 -0.23 -1.04 0.75 1.34 -0.11
10. 1.0 1.12 0.56 1.74 -0.84 0.26 1.89 0.75 -2.65
11. 1.0 1.13 0.45 0.89 1.07 -0.32 0.46 -0.72 0.7
12. 2.0 -0.87 -0.45 -0.18 -0.65 0.42 0.07 0.97 0.58
13. 1.0 1.17 -0.93 1.37 0.57 0.46 -1.07 1.23 0.47
14. 1.0 1.18 -0.3 -0.23 0.49 -1.98 -1.47 1.61 -0.05
15. 1.0 0.93 0.65 -1.44 -0.6 2.1 -0.21 0.49 0.09
16. 2.0 0.11 -0.98 2.03 -0.48 0.49 -0.05 -0.63 1.6
17. 2.0 -0.98 -1.27 -0.51 -1.21 -1.17 0.65 -0.63 1.28
18. 1.0 1.42 -1.59 -1.55 -0.91 -0.62 1.02 0.55 -0.06
19. 2.0 -0.44 -0.87 -1.14 1.0 -0.42 -0.36 1.1 -0.77
20. 2.0 -0.71 0.26 -1.58 0.9 -1.52 -0.35 -0.48 0.45
21. 1.0 -0.91 1.17 -0.2 1.01 0.63 1.07 1.22 1.11
22. 1.0 -1.02 1.3 -0.43 -3.58 -0.04 -0.39 0.08 -0.19
23. 2.0 0.18 -1.18 -1.4 0.75 -0.27 1.74 -1.99 -0.98
24. 1.0 -1.61 1.52 -0.52 -0.31 -0.85 -0.41 -0.56 -0.8
25. 1.0 1.22 -0.27 -0.6 0.78 0.47 0.21 0.1 -1.01
26. 2.0 -0.86 -1.23 -0.14 0.73 0.56 0.41 -0.89 0.89
27. 2.0 -0.18 0.03 0.55 0.09 -0.12 2.5 -0.1 0.3
28. 1.0 0.93 0.65 -1.44 -0.6 2.1 -0.21 0.49 0.09
29. 1.0 -1.78 -1.4 0.8 -0.09 0.7 -0.86 -0.49 -0.97
30. 2.0 -0.91 1.17 -0.2 1.01 0.63 1.07 1.22 1.11
A. Uji Asumsi
a. Uji Normalitas
One-Sample Kolmogorov-Smirnov Test
Kesega
ran
Kulit
Aroma
Tahan
lama
Kemas
an
Jangka
Waktu
Kadalu
arsa
Kekent
alan
Tidak
Menyeba
bkan
Alergi
Ada
Sampel
Gratis
Kesesu
aian
Harga
dan
Kwalita
s
N 30 30 30 30 30 30 30 30
Normal
Parametersa
Mean .0007 -.0003 .0007 .0000 .0000 -.0013 -.0003 -.0003
Std. Deviation .99989 1.00011
1.0006
3 .99966 .99994 .99929 .99910
1.0000
8
Most Extreme
Differences
Absolute .190 .141 .114 .142 .142 .149 .102 .125
Positive .137 .141 .114 .142 .142 .149 .078 .067
Negative -.190 -.112 -.076 -.134 -.078 -.059 -.102 -.125
Kolmogorov-Smirnov Z 1.043 .773 .623 .779 .778 .818 .561 .684
Asymp. Sig. (2-tailed) .227 .589 .833 .579 .581 .515 .912 .738
a. Test distribution is Normal.
Dari uji normalitas diatas terlihat bahwa pada test Kolmogorov-Smirnov Z
signifikansi pada semua variabel bernilai lebih dari α = 0.05, berarti semua variabel
bebas berdistribusi normal. b. Uji Multikolinieritas
Pooled Within-Groups Matrices
Kesegaran
Kulit
Aroma
Tahan lama Kemasan
Jangka
Waktu
Kadaluarsa
Kekentala
n
Tidak
Menyebabk
an Alergi
Ada
Sampel
Gratis
Kesesuai
an Harga
dan
Kwalitas
Correlation Kesegaran
Kulit 1.000 -.125 .016 .193 -.038 .067 -.052 .044
Aroma
Tahan lama -.125 1.000 .007 .081 -.016 .027 -.022 .018
Kemasan .016 .007 1.000 -.011 .002 -.003 .003 -.002
Jangka
Waktu
Kadaluarsa
.193 .081 -.011 1.000 .023 -.043 .033 -.030
Kekentalan -.038 -.016 .002 .023 1.000 .009 -.005 .007
Tidak
Senyebabka
n Alergi
.067 .027 -.003 -.043 .009 1.000 .011 -.010
Ada Sampel
Gratis -.052 -.022 .003 .033 -.005 .011 1.000 .008
Pooled Within-Groups Matrices
Kesegaran
Kulit
Aroma
Tahan lama Kemasan
Jangka
Waktu
Kadaluarsa
Kekentala
n
Tidak
Menyebabk
an Alergi
Ada
Sampel
Gratis
Kesesuai
an Harga
dan
Kwalitas
Correlation Kesegaran
Kulit 1.000 -.125 .016 .193 -.038 .067 -.052 .044
Aroma
Tahan lama -.125 1.000 .007 .081 -.016 .027 -.022 .018
Kemasan .016 .007 1.000 -.011 .002 -.003 .003 -.002
Jangka
Waktu
Kadaluarsa
.193 .081 -.011 1.000 .023 -.043 .033 -.030
Kekentalan -.038 -.016 .002 .023 1.000 .009 -.005 .007
Tidak
Senyebabka
n Alergi
.067 .027 -.003 -.043 .009 1.000 .011 -.010
Ada Sampel
Gratis -.052 -.022 .003 .033 -.005 .011 1.000 .008
Kesesuaian
Harga dan
Kwalitas
.044 .018 -.002 -.030 .007 -.010 .008 1.000
Dari table di atas terlihat bahawa tidak ada angka yang mencapai 0,5 atau di
atasnya sehingga dapat disimpulkan tidak terjadi multikolinieritas pada data
tersebut
c. Uji kesamaan matrik varian-kovarian
Test Results
Box's M 10.954
F Approx. 3.369
df1 3
df2 1.411E5
Sig. .018
Tests null hypothesis of equal
population covariance matrices.
Terlihat bahwa signifikansinya adalah 0,018 (< á = 0,05), sehingga dapat
disimpulkan bahwa tidak terdapat kesamaan antar variansi-kovariansi,
namun karena 0,018 tidak terlalu jauh dari nilai 0,05 maka bisa dianggap
masih ada peluang cukup untuk terjadi kesamaan variansikovanriansi.
d. Uji vector rata-rata
Tests of Equality of Group Means
Wilks' Lambda F df1 df2 Sig.
Kesegaran Kulit .769 8.388 1 28 .007
Aroma Tahan lama .950 1.471 1 28 .235
Kemasan .999 .025 1 28 .876
Jangka Waktu Kadaluarsa .890 3.477 1 28 .073
Kekentalan .995 .129 1 28 .722
Tidak Senyebabkan Alergi .986 .410 1 28 .527
Ada Sampel Gratis .991 .253 1 28 .619
Kesesuaian Harga dan
Kwalitas .993 .185 1 28 .670
Dari table diatas terlihat bahwa nilai signifikansi dari variable kesegaran kulit
(0.007) dan jangka waktu kadaluarsa (0.073) bernilai kurang dari .
hal ini berarti bahwa kedua variable tersebut membedakan kedua kelompok
produk. Body lotion
B. Pembentukan Model diskriminan
Canonical Discriminant Function
Coefficients
Function
1
Kesegaran Kulit .995
Jangka Waktu Kadaluarsa -.689
(Constant) .000
Unstandardized coefficients
Tabel diatas diperoleh fungsi diskriminan adalah ,
C. Uji Validasi
a. Penghitungan diskriminan skor
NO X1 X4 Y
(diskriminan skor)
1. 1.21 -0.28 1.39687 2. 0.13 0.26 -0.04979 3. 0.96 -1.24 1.80956 4. 1.14 -0.37
1.38923 5. -1.22 -0.02 -1.20012 6. -0.81 1.03 -1.51562 7. 0.58 0.82 0.01212 8. -0.56 0.9
-1.1773 9. -0.53 -0.23 -0.36888 10. 1.12 -0.84 1.69316 11. 1.13 1.07
0.38712 12. -0.87 -0.65
-0.4178 13. 1.17 0.57 0.77142 14. 1.18 0.49 0.83649 15. 0.93 -0.6 1.33875 16. 0.11 -0.48
0.44017 17. -0.98 -1.21 -0.14141 18. 1.42 -0.91 2.03989 19. -0.44 1.0 -1.1268 20. -0.71 0.9
-1.32655 21. -0.91 1.01 -1.60134 22. -1.02 -3.58
1.45172 23. 0.18 0.75 -0.33765 24. -1.61 -0.31
-1.38836 25. 1.22 0.78 0.67648 26. -0.86 0.73 -1.35867 27. -0.18 0.09 -0.24111 28. 0.93 -0.6 1.33875 29. -1.78 -0.09 -1.70909 30. -0.91 1.01 -1.60134
b. Penghitungan cutting skor
Functions at Group
Centroids
Y
Function
1
1 .695
2 -.695
Unstandardized
canonical discriminant
functions evaluated at
group means
Nilai yang dihasilkan dari fungsi diskriminan kemudian dibandingkan
dengan nilai centroid produk A dan B, jika nilainya lebih dekat pada nilai
centroid produk A, maka responden (konsumen) tersebut akan memiliki
kecenderungan membeli produk A.Sebagai contoh pada data responden 1
karena data diskriminan scornya 1.39687 maka akan lebih dekan ke dalam
kelompok 1 yaitu 0.695,dan seterusnya
NO Y
(diskriminan
skor)
Kelompok
awal
Kelompok
setelah
deskriminan
1. 1.39687
1.0 1
2. -0.04979 2.0 2
3. 1.80956
1.0 1
4. 1.38923 1.0 1
5. -1.20012 2.0 2
6. -1.51562 2.0 2
7. 0.01212
2.0 1
8. -1.1773 2.0 2
9. -0.36888 2.0 2
10. 1.69316 1.0 1
11. 0.38712
1.0 1
12. -0.4178
2.0 2
13. 0.77142 1.0 1
14. 0.83649 1.0 1
15. 1.33875
1.0 1
16. 0.44017 2.0 1
17. -0.14141 2.0 2
18. 2.03989 1.0 1
19. -1.1268
2.0 2
20. -1.32655 2.0 2
21. -1.60134 1.0 2
22. 1.45172 1.0 1
23. -0.33765
2.0 2
24. -1.38836 1.0 2
25. 0.67648 1.0 1
26. -1.35867 2.0 2
27. -0.24111 2.0 2
28. 1.33875 1.0 1
29. -1.70909 1.0 2
30. -1.60134 2.0 2
c. Hit Ratio
Setelah semua observasi diprediksi keanggotaannya, dapat dihitung hit ratio,
yaitu rasio antara observasi yang tepat pengklasifikasiannya dengan total
seluruh observasi.
Classification Resultsb,c
Y
Predicted Group Membership
Total 1 2
Original Count 1 12 3 15
2 2 13 15
% 1 80.0 20.0 100.0
2 13.3 86.7 100.0
Cross-validateda Count 1 12 3 15
2 3 12 15
% 1 80.0 20.0 100.0
2 20.0 80.0 100.0
a. Cross validation is done only for those cases in the analysis. In cross validation,
each case is classified by the functions derived from all cases other than that case.
b. 83.3% of original grouped cases correctly classified.
c. 80.0% of cross-validated grouped cases correctly classified.
BAB III
PENUTUP
A. Kesimpulan
Dari pembahasan diatas kita dapat mengetahui bahwa factor yang dominan yang
mempengaruri konsumen untuk memilih produk A atau produk B adalah factor
X1=kelembapan kulit,dan X4=jangka waktu kadaluarsa.
Dari persamaan deskriminan , sudah cukup signifikan
terlihat pada hit rasio pada prosentase sudah mencapai 80%.oleh karenanya
B. Saran
Dengan melihat kenyataan diatas maka manager perusahan body lotion tentunya
akan lebih mempertimbangkan tingkat kelembaapan body lotion dan juga lama
kadaluarsa suatu produk. Sehingga nantinya didapat suatu produk yang unggul.