ringkasan praktikum
TRANSCRIPT
Uji Outlier
a. Analyze > Regression > Linier
Variabel dependen = Promosi_jabatan_baru
(pemilihan variabel dependen bebas, karena hanya ingin melihat jarak mahalanobisnya. Sedangkan
sisanya menjadi variabel independen)
Variabel independen = Penghargaan_atas_prestasi_kerja,
Tunjangan_diterima_di_luar_gaji,
Rotasi_jabatan_lain,
Kondisi_kerja_yang_kondusif,
Dukungan_dari_rekan_kerja,
Kenaikan_pangkat_jabatan.
Save: Distance mahalanobis
b. Mencari t _hitung
Transform > Compute
t_hitung = MAH_1/ jumlah variabel yang dianalisis(6)
c. Mencari t_tabel
Transform > Compute
t_tabel = IDF.T (1-α;jumlah variabel yang dianalisis)
= IDF.T(0.95;6)
d. Kriteria Outlier
Data > Select Cases > If
Digunakan kriteria t_hit < t_tabel, mk pd data SPSS kolom $_filter yang bernomor 0 adalah outlier.
Uji Normalitas Univariat Analyze > Descriptive Statistics > Explore
Dependen list = Penghargaan_atas_prestasi_kerja,
Tunjangan_diterima_di_luar_gaji,
Rotasi_jabatan_lain,
Promosi_jabatan_baru
Kondisi_kerja_yang_kondusif,
Dukungan_dari_rekan_kerja,
Kenaikan_pangkat_jabatan.
Di bagian Display kiri bawah Plots
Plots: Boxplots None
Descriptive Stem-and-leaf Histogram
Normality plot with tests
Uji Hipotesis: H0 : data berdistribusi normal vs H1 : data tidak berdistribusi normal
Uji Normalitas Multivariat a. Mengurutkan data MAH_1 dari terkecil ke terbesar
Data > Sort Cases..
Sort by: MAH_2
Sort Order: Ascending
b. Membuat variabel baru “obs” berisi no. 1 - n untuk kasus ini 1 - 59
c. Membuat nilai persentil (varibel baru “prob_value)
Transform > Compute > prob_value = (obs - 0.5) / n
untuk kasus ini prob_value = (obs - 0.5) / 59
d. Menghitung Chi-Square
Transform > Compute > chi_square = IDF.CHISQ (prob_value, banyak variabel independen di
Mahalanobis-1)
untuk kasus ini chi_square = IDF.CHISQ (prob_value, 5)
e. Membuat Scatter Plot
Graphs >Legacy Dialogs > Scatter/Dot > Simple Scatter > Define
Y Axis = chi_square
X Axis = MAH_1
f. Inferensi
Analyze > Correlate > Bivariate
Variabels : chi_square
MAH_1
Uji Hipotesis: H0 : data berdistribusi normal secara multivariat
H1 : data tidak berdistribusi normal secara multivariat
Tingkat signifikansi: = 0.05 n = 59
59 − 55
60 − 55=
(����� ������ ����� � = 59) − (����� ������ ����� � = 55)
(����� ������ ����� � = 60) − (����� ������ ����� � = 55)
4
5=
(����� ������ ����� � = 59) − 0.9787
0.9801 − 0.9787=
(����� ������ ����� � = 59) − 0.9787
0.0014
(����� ������ ����� � = 59) =0.0014 × 4
5+ 0,9787 = 0.97982
Uji Validitas Validitas berasal dari kata validity yang mempunyai arti sejauhmana ketepatan dan kecermatan suatu
alat ukur dalam melakukan fungsi ukurnya. Valid tidaknya suatu alat ukur tergantung pada mampu
tidaknya alat ukur tersebut mencapai tujuan pengukuran yang dikehendaki dengan tepat. Caranya:
Analyze > Scale > Reliability Analysis
Items: Penghargaan_atas_prestasi_kerja
Tunjangan_diterima_di_luar_gaji
Rotasi_jabatan_lain
Promosi_jabatan_baru
Kondisi_kerja_yang_kondusif
Dukungan_dari_rekan_kerja
Kenaikan_pangkat_jabatan
Statistics: Item Scale Scale if Item Deleted
OK
Uji Hipotesis:
H0: ρterkoreksi ≤ 0 (skor variabel berkorelasi positif dengan skor faktor)
H1: ρterkoreksi > 0 (skor variabel tidak berkorelasi positif dengan skor faktor)
Statistik Uji: nilai r untuk tiap item dapat dilihat pada kolom Corrected Item-Total
Correlation
Daerah kritik: H0 tidak ditolak jika r hasil positif, serta r hasil > r tabel, sehingga variabel
tersebut dikatakan valid.
Uji Reliabilitas Uji reliabilitas adalah pengujian kehandalan alat ukur untuk mengetahui sejauh mana suatu pengukuran
dapat memberikan hasil yang sama bila dilakukan pengukuran kembali pada subyek yang sama, selama
aspek yang diukur dalam diri responden tidak mengalami perubahan.
Uji Hipotesis:
H0: skor variabel berkorelasi positif dengan komposit faktornya
H1: skor variabel tidak berkorelasi positif dengan komposit faktornya
Statistik Uji: Cronbach’s alpha = 0.677
Daerah kritik: H0 tidak ditolak jika Cronbach’s alpha > 0.60, sehingga variabel tersebut
dikatakan reliabel.
Analisis Faktor Analyze > Data Reduction > Faktor
Variabels: Penghargaan_atas_prestasi_kerja
Tunjangan_diterima_di_luar_gaji
Rotasi_jabatan_lain
Kondisi_kerja_yang_kondusif
Dukungan_dari_rekan_kerja
Kenaikan_pangkat_jabatan
Descriptive: Initial Solution Anti Image
KMO and Barlett’s test of sphericity
Extraction: Unrotated faktor solution Scree Plot
Rotation: Varimax Rotated Solution Loading Plot(s)
Scores: Save as variabels Display faktor score coefficient matrix
a. KMO and Barlett’s test
Dalam pemilihan variabel analisis perlu memperhatikan apakah matriks korelasi adalah matriks
identitas atau bukan, karena matriks identitas tidak dapat digunakan untuk analisis berikut. Untuk
menguji kesesuaian pemakaian analisis faktor digunakan Metode Kaiser-Meyer-Olkin (KMO)
Uji Hipotesis:
H0: Sampel belum memadai untuk analisis lebih lanjut
H1: Sampel sudah memadai untuk analisis lebih lanjut
Tingkat signifikansi: = 0.05
Statistik Uji: Hasil KMO = 0.640 Sig = 0.000
Daerah kritik: H0 ditolak jika Sign <
Kesimpulan: Karena Sign (0.000) < (0.05) maka H0 ditolak yang berarti bahwa sampel
sudah memadai untuk analisis lebih lanjut atau 64.0 % variansi dapat dijelaskan oleh faktor
tersebut.
b. Measure of Sampling Adequency (MSA)
Untuk mengetahui apakah proses pengambilan sampel telah memadai atau tidak, digunakan
pengukuran Measure of Sampling Adequacy (MSA). Harga MSA yang rendah merupakan
pertimbangan untuk membuang variabel tersebut pada tahap analisis selanjutnya. Harga Measure of
Sampling Adequacy (MSA) berkisar antara 0 sampai 1, dengan kriteria :
MSA = 1 , artinya variabel tersebut dapat diprediksi tanpa kesalahan oleh variabel lain
MSA > 0.5 artinya variabel masih bisa diprediksi dan dianalisis lebih lanjut
MSA < 0.5 artinya variabel tidak bisa diprediksi dan tidak dapat dianalisis lebih lanjut, atau
dikeluarkan dari variabel lainnya.
Semua MSA > 0.5 yang berarti variabel-variabel tersebut masih bisa diprediksi dan dianalisis
lebih lanjut.
c. Communalitas
Variansi Penghargaan_atas_prestasi_kerja = 0.620, artinya 62.0 % variansi dari variansi
Penghargaan_atas_prestasi_kerja dapat dijelaskan oleh faktor yang akan dibentuk.....
d. Total Variance Explained
Rotated Component Matrixa
.731 .291
.162 .848
-.009 .842
.838 .141
.659 -.118
.409 .369
Penghargaan_atas_prestasi_kerja
Tunjangan_diterima_di_luar_gaji
Rotasi_jabatan_lain
Kondisi_kerja_yang_kondusif
Dukungan_dari_rekan_
kerja
Kenaikan_pangkat_jabatan
1 2
Component
Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.
Rotation converged in 3 iterations.a.
Ada 6 variabel yang dimasukkan dalam analisis faktor. Dengan masing-masing variabel yang
mempunyai variansi 1 maka total variansi = 6 x 1 = 6. Kemudian dari 6 variabel tersebut diringkas
menjadi 2 faktor dengan masing-masing variansi yang dapat dijelaskan sebagai berikut:
�������� ������ 1 =����� ���������� �� ������� ��������
7× 100%
=�.���
�× 100% = 38.608%
�������� ������ 2 =����� ���������� �� ������� ��������
7× 100%
=�.���
�× 100% = 20.537%
Total kedua faktor tersebut akan dapat menjelaskan 59.145% dari variabilitas 6 variabel. Dari tabel di
atas dapat dilihat hanya ada dua faktor yang terbentuk karena nilai eigen kedua variabel tersebut masih
di atas satu. Hal tersebut dapat dilihat juga pada Scree Plot.
e. Scree Plot
Ada 2 nilai eigen >1 yang berarti jumlah faktor yang akan dibentuk ada 2 faktor.
f. Componen Matrix
Tabel Component Matrix menjelaskan distribusi 6 variabel pada dua faktor yang ada. Sedangkan
angka pada tabel adalah faktor loading atau besar korelasi antara suatu variabel dengan faktor 1 dan 2.
Karena masih ada variabel yang tidak memiliki perbedaan yang nyata (Variabel
Dukungan_dari_rekan_kerja) dengan beberapa faktor lainnya, yaitu dengan nilai loading atau besar
korelasi kurang dari 0,55 maka variabel tersebut tidak dapat dimasukkan ke salah satu variabel dengan
melihat besar korelasinya. Karena itu perlu dilakukan rotasi faktor untuk memperjelas kedudukan
variabel tersebut.
g. Rotated Componen Matrix
Component Matrix hasil dari proses rotasi
(Rotated Component Matrix) memperlihatkan distribusi
variabel yang lebih jelas dan nyata dibandingkan
dengan jika tidak dilakukan rotasi. Ditentukan angka
pembatas (cut of point) = 0.55. Variabel yang memiliki
faktor loading < 0.55 tidak dapat secara nyata
dimasukkan ke dalam salah satu faktor. Nilai loading
terbesar menunjukkan variabel tersebut masuk ke
dalam faktor kolom terbesar.
Variabel Penghargaan_atas_prestasi_kerja:
variabel ini masuk faktor 1 karena korelasi variabel
Penghargaan_atas_prestasi_kerja dengan faktor 1
(0.731) lebih kuat dibanding dengan korelasi dengan
faktor 2 (0.291).... Jadi faktor-faktor yang
mempengaruhi promosi jabatan baru adalah:
Faktor 1 (misalnya disebut Faktor Pendukung), dengan anggota-anggotanya adalah variabel:
Penghargaan_atas_prestasi_kerja
Kondisi_kerja_yang_kondusif
Dukungan_dari_rekan_kerja
Faktor 2 (misalnya disebut Faktor Penunjang), dengan anggota-anggotanya adalah variabel:
Tunjangan_diterima_di_luar_gaji
Rotasi_jabatan_lain
Analisis cluster K-Means cluster >>>>>mengelompokkan variabel sesuai yang kita inginkan
Langkah2 di spss:
Buka file tata letak toko buku.sav
Analyze>classify>K-means cluster
Variables: u1-u21
Label cases by: responden(variabel yang ingin dicluster)
Number of cluster: 3 (jml cluster yang ingin dibentuk)
Save: cluster membership dan distance cluster center
Option: intial cluster centers, ANOVA table dan cluster information for each case
Output yang ditampilin
intial cluster centers
Output ini berisi tentang informasi mengenai pusat cluster awal yang ditentukan secara acak oleh
program. Pusat cluster ini kemudian digunakan untuk menghitung jarak masing-masing objek
terhadap pusat cluster pada iterasi pertama. Initial Cluster Centers
Cluster
1 2 3
Tata letak Buku 1,000 5,320 5,320 Kelengkapan Buku 2,254 4,663 4,663 Buku yang Baru Terbit 4,692 3,335 4,692 Harga Buku yang Kompetitif 1,000 3,642 5,240 Desain Interior yang Menarik 2,000 3,503 5,184 Sistem Informasi yang Mudah Diakses 4,913 3,574 4,913 Pendingin Udara yang Memadai 4,761 4,761 4,761 Penitipan barang yang memadai 1,000 4,916 2,164 Kebersihan gedung 3,635 5,168 5,168 Tempat parkir yang luas 1,000 4,617 2,382 Keamanan tempat parkir 4,017 5,692 2,000 Lokasi TB Gramedia yang strategis 2,000 5,512 5,512 Pelayanan kasir yang cepat 5,478 5,478 3,817 Satpam bertugas dengan baik 5,360 5,360 3,719 Karyawan berpenampilan menarik 5,271 5,271 3,631 Karyawan memahami keinginan konsumen 3,373 4,853 2,000 Karyawan ramah dalam melayani konsumen 5,294 5,294 3,685 Pengetahuan karyawan tetang koleksi buku 2,754 5,708 2,754 Respon atas komplain konsumen 3,668 5,509 2,000 Fasilitas diskon kepada konsumen 1,000 4,680 2,368 Promosi kepada konsumen 5,823 4,123 2,790
Iteration history
Pada output ini diperlihatkan proses yang dilalui untuk memperoleh jumlah cluster yang
dikehendaki berdasarkan criteria yang diberikan. Tampak bahwa jumlah iterasi yang diperlukan
agar selisih nilai pusat cluster pada iterasi ke n dan iterasi ke n-1 adalah 0 tercapai pada iterasi ke
10, setelah sampai iterasi ke 10 ini proses berhenti karena salah satu kriteria sudah tercapai. Iteration History(a)
Iteration Change in Cluster Centers
1 2 3
1 5,936 4,420 5,513 2 ,737 ,468 ,207 3 ,394 ,173 ,091 4 ,297 ,132 ,097 5 ,280 ,110 ,106 6 ,224 ,070 ,090 7 ,204 ,000 ,088 8 ,094 ,000 ,043 9 ,073 ,084 ,056 10 ,049 ,000 ,024
a Iterations stopped because the maximum number of iterations was performed. Iterations failed to converge. The maximum absolute coordinate change for any center is ,018. The current iteration is 10. The minimum distance between initial centers is 9,069.
Final cluster center
Nilai rata-rata variabel tata letak toko buku di cluster 1 adalah sebesar 3,228. Pada cluster 2
sebesar 4,128 dan pada cluster 3 sebesar 3,773. Terlihat disini cluster 2 lbh puas tata letak toko
buku dibandingin cluster 1 dan 3. Istilahnya variabel ini lebih cenderung ke cluster 2. Final Cluster Centers
Cluster
1 2 3
Tata letak Buku 3,228 4,128 3,773 Kelengkapan Buku 2,758 3,897 3,416 Buku yang Baru Terbit 2,955 3,709 3,200 Harga Buku yang Kompetitif 2,916 3,374 3,047 Desain Interior yang Menarik 2,573 3,774 3,526 Sistem Informasi yang Mudah Diakses 3,206 4,252 3,706 Pendingin Udara yang Memadai 3,059 3,953 3,294 Penitipan barang yang memadai 2,850 3,597 3,295 Kebersihan gedung 3,596 4,507 3,757 Tempat parkir yang luas 1,944 3,051 2,897 Keamanan tempat parkir 3,969 4,667 3,925 Lokasi TB Gramedia yang strategis 4,054 5,120 4,223 Pelayanan kasir yang cepat 3,554 4,368 3,774 Satpam bertugas dengan baik 3,553 4,168 3,637 Karyawan berpenampilan menarik 3,282 4,146 3,483 Karyawan memahami keinginan konsumen 2,885 3,810 3,048 Karyawan ramah dalam melayani konsumen 3,562 4,284 3,537 Pengetahuan karyawan tetang koleksi buku 3,473 4,287 3,544 Respon atas komplain konsumen 3,315 3,927 3,516 Fasilitas diskon kepada konsumen 2,764 3,381 2,664 Promosi kepada konsumen 3,569 4,081 3,618
Anova
Pada tabel ANOVA diatas dilakukan pengujian terhadap pusat-pusat cluster yang terbentuk.
Tujuannya adalah untuk mengetahui apakah ada perbedaan yang nyata terhadap pusat cluster
yang terbentuk berdasarkan masing-masing variabel.
H0 : tidak terdapat perbedaan yang nyata antara cluster 1, cluster 2 dan cluster 3
H1 : terdapat perbedaan yang nyata antara cluster 1, cluster 2 dan cluster 3
Variabel tata letak toko buku, sig=0,000 < α=0,05 maka terdapat perbedaan yang nyata antara
cluster 1, cluster 2 dan cluster 3 berdasarkan jenis berita polkam. ANOVA
Cluster Error F Sig.
Mean Square df Mean Square df Mean Square df
Tata letak Buku 9,375 2 ,475 178 19,718 ,000 Kelengkapan Buku 14,970 2 ,558 178 26,830 ,000 Buku yang Baru Terbit 7,188 2 ,577 178 12,451 ,000 Harga Buku yang Kompetitif 2,744 2 ,637 178 4,305 ,015 Desain Interior yang Menarik 18,580 2 ,362 178 51,384 ,000 Sistem Informasi yang Mudah Diakses 12,723 2 ,513 178 24,789 ,000 Pendingin Udara yang Memadai 10,679 2 ,531 178 20,107 ,000 Penitipan barang yang memadai 6,453 2 ,624 178 10,349 ,000 Kebersihan gedung 12,140 2 ,265 178 45,831 ,000 Tempat parkir yang luas 16,814 2 ,547 178 30,737 ,000 Keamanan tempat parkir 9,727 2 ,342 178 28,414 ,000 Lokasi TB Gramedia yang strategis 16,997 2 ,317 178 53,613 ,000 Pelayanan kasir yang cepat 8,784 2 ,410 178 21,432 ,000 Satpam bertugas dengan baik 5,797 2 ,467 178 12,401 ,000 Karyawan berpenampilan menarik 10,278 2 ,440 178 23,340 ,000 Karyawan memahami keinginan konsumen 12,545 2 ,494 178 25,386 ,000 Karyawan ramah dalam melayani konsumen 10,032 2 ,438 178 22,923 ,000 Pengetahuan karyawan tetang koleksi buku 10,833 2 ,499 178 21,707 ,000 Respon atas komplain konsumen 4,732 2 ,443 178 10,685 ,000 Fasilitas diskon kepada konsumen 8,708 2 ,644 178 13,512 ,000 Promosi kepada konsumen 4,225 2 ,558 178 7,566 ,001
The F tests should be used only for descriptive purposes because the clusters have been chosen to maximize the differences among cases in different clusters. The observed significance levels are not corrected for this and thus cannot be interpreted as tests of the hypothesis that the cluster means are equal.
Number of cases in each cluster
Pada tabel output diperlihatkan jumlah objek atau responden untuk masing-masing cluster. Pada
cluster 1 berjumlah 42 responden, cluster 2 berjumlah 51 responden dan cluster 3 berjumlah 88
responden. Number of Cases in each Cluster
Cluster 1 42 responden 2 51 responden 3 88 responden Valid 181,000 Missing ,000
Untuk melihat responden masuk dalam cluster mana, dapat dilihat pada data view spss kolom
qcl_1 ATAU pada Cluster Membership dapat juga dilihat dari crostabulation antara responden dan
qcl_1 . Berikut tabel ringkasan dari output kolom qcl_1 :
Dengan analyze>deskrptive>crosstab
Row: responden Coloumn: qcl_1 Cell>persentage>row
Pada output ini terlihat bahwa responden 1,10,11,12, 17 dst masuk dalam cluster 1. Dengan kata
lain pembagian cluster sesuai responden.
Analisis cluster hierarchical Pelajaran terakhir sampai dengan K-mean cluster, dimana disitu dimulai dengan penentuan jml cluster terlebih
dahulu. Sedangkan yang kita pelajari pada hari ini, dimana dimualai menggabungkan dua objek yang paling
mirip, kemudian gabungan dua objek tersebut bergabung lg dengan satu atau lbh obyek yang paling mirip
lainnya.
Langkah2 di spss:
Buka file hierarki.sav
Analyze>classify>hierarchical cluster
Variables: semua variabel
Label cases by: susu (variabel yang ingin dicluster)
Statistic: aglomeration, range of solution (ketik 2 from serta 4 untuk through)
Plots: dendogram
Icicle: none
Method: cluster method>between group linkage, measure>>>squared eclideon distance,
transform value>>>>none (untuk data yang tidak bervariasi, shg tdk perlu
ditransformasikan)///zscore(untuk data yang bervariasi, sehingga perlu
ditransformasikan),
Tambahan aja::::: Untuk standarisasi data pada k-mean cluster dengan:
analyze>descriptive>masukkan data kecuali data yang kategori>aktifkan save standardized values as
variables
Output yang ditampilin
Proximity matrix
Menyatakan ringkasan data, dari semua data (18 objek) telah diproses tanpa ada data yang hilang.
Pada kolom Euclidean distance , menunjukkan jarak anatara 2 variabel. Berikut beberapa contoh
interpretasi dari output proximities:
Jarak antara susu 1(oat quaker) dengan susu 2(nestle carnation) sebesar 15,758. Sedangkan
jarak antara susu 1(oat quaker) dengan susu 3(Ligo), hanyalah 0,608. Ini berarti susu 1 lebih
mirip karakteristiknya dengan susu 3, tetapi berbeda jauh dengan susu 2.
Proximity Matrix
Case Squared Euclidean Distance
1:OAT
Quaker
2:Nestle
Carnation
3:LIGO Haverm
out 4:Ovalti
ne 5:Mil
o
6:Dancow
balita
7:Frisian
Flag Instan
8:Frisian
Flag Full Cr
9:Frisian
Flag Coklat
10:Frisian Flag Madu
11:Dancow
Coklat
12:Dancow Full Cream
13:Indomilk Full Cream
14:Indomilk
Coklat
15:Prosteo
rendah lemak
16:Anlene
Kalsium
Tingg 17:Tropicana Slim
18:Protifar
1:OAT Quaker
,000 15,758 ,608 1,464 2,85
7 4,860 7,889 8,140 2,059 4,279 18,954 8,068 8,339 4,014 10,062 4,919 ,593 10,895
2:Nestle Carnation
15,758
,000 21,134 26,051 22,6
05 21,996
24,321
24,699
26,130
22,993 41,554 24,570 24,356 25,265 20,705 14,707 12,320 14,616
3:LIGO Havermout
,608 21,134 ,000 ,638 3,99
2 7,445
11,188
11,457
2,196 6,411 20,644 11,387 11,770 5,442 13,835 7,984 2,077 16,005
4:Ovaltine
1,464 26,051 ,638 ,000 2,35
9 6,419 9,729
10,123
,809 4,875 19,125 9,851 10,523 3,440 11,621 7,107 2,949 15,371
5:Milo 2,857 22,605 3,992 2,359 ,000 2,666 4,305 4,874 ,735 1,201 16,293 4,297 5,174 ,376 3,682 1,925 2,675 7,017 6:Dancow balita
4,860 21,996 7,445 6,419 2,66
6 ,000 ,383 ,445 3,142 ,352 13,953 ,426 ,519 1,440 4,808 3,335 4,509 4,578
7:Frisian Flag Instan
7,889 24,321 11,188 9,729 4,30
5 ,383 ,000 ,036 5,347 ,989 14,697 ,003 ,060 2,496 4,619 4,203 7,080 3,946
8:Frisian Flag Full Cr
8,140 24,699 11,457 10,123 4,87
4 ,445 ,036 ,000 5,717 1,251 14,549 ,053 ,008 2,927 5,436 4,867 7,457 4,420
9:Frisian Flag Coklat
2,059 26,130 2,196 ,809 ,735 3,142 5,347 5,717 ,000 1,892 15,813 5,403 6,062 ,974 7,441 4,545 2,964 10,811
10:Frisian Flag Madu
4,279 22,993 6,411 4,875 1,20
1 ,352 ,989 1,251 1,892 ,000 14,477 ,995 1,412 ,388 3,494 2,315 3,891 4,722
11:Dancow Coklat
18,954
41,554 20,644 19,125 16,2
93 13,953
14,697
14,549
15,813
14,477 ,000 14,724 14,843 15,076 23,062 21,464 22,440 26,222
12:Dancow Full Cream
8,068 24,570 11,387 9,851 4,29
7 ,426 ,003 ,053 5,403 ,995 14,724 ,000 ,082 2,476 4,480 4,174 7,225 3,899
13:Indomilk Full Cream
8,339 24,356 11,770 10,523 5,17
4 ,519 ,060 ,008 6,062 1,412 14,843 ,082 ,000 3,193 5,557 4,973 7,583 4,299
14:Indomilk Coklat
4,014 25,265 5,442 3,440 ,376 1,440 2,496 2,927 ,974 ,388 15,076 2,476 3,193 ,000 3,556 2,409 3,875 6,382
15:Prosteo rendah lemak
10,062
20,705 13,835 11,621 3,68
2 4,808 4,619 5,436 7,441 3,494 23,062 4,480 5,557 3,556 ,000 1,075 7,250 1,932
16:Anlene Kalsium Tingg
4,919 14,707 7,984 7,107 1,92
5 3,335 4,203 4,867 4,545 2,315 21,464 4,174 4,973 2,409 1,075 ,000 2,814 2,129
17:Tropicana Slim
,593 12,320 2,077 2,949 2,67
5 4,509 7,080 7,457 2,964 3,891 22,440 7,225 7,583 3,875 7,250 2,814 ,000 7,381
18:Protifar
10,895
14,616 16,005 15,371 7,01
7 4,578 3,946 4,420
10,811
4,722 26,222 3,899 4,299 6,382 1,932 2,129 7,381 ,000
This is a dissimilarity matrix
Agglomeration schedule
Aglgomerasi akan melakukan pengelompokkan satu per satu. Pada stage 1, objek (susu) nomor
7 dan nomor 12 adalah yang paling mirip, maka mereka menjadi satu kelompok terlebih dahulu.
Kemudian lihat kolom next stage terlihat stage 3 yang berarti proses dilanjutkan ke stage 3. Pada
stage 3, terdapat objek nomor 7 dan nomor 8, hal ini berarti objek nomor 8 masuk pada
kelompok pertama yang sudah terbentuk yaitu 7 dan 12. Dengan demikian sekarang terdapat ada
3 anggota yang sudah diketahui clusternya. Begitu juga seterusnya. Agglomeration Schedule
Stage
Cluster Combined Coefficients
Stage Cluster First Appears
Next Stage Cluster 1 Cluster 2 Cluster 1 Cluster 2
1 7 12 ,003 0 0 3 2 8 13 ,008 0 0 3 3 7 8 ,058 1 2 8 4 6 10 ,352 0 0 8 5 5 14 ,376 0 0 9 6 1 17 ,593 0 0 11 7 3 4 ,638 0 0 11 8 6 7 ,803 4 3 14 9 5 9 ,855 5 0 13 10 15 16 1,075 0 0 12 11 1 3 1,775 6 7 13 12 15 18 2,031 10 0 14 13 1 5 3,057 11 9 15 14 6 15 4,340 8 12 15 15 1 6 6,611 13 14 16 16 1 11 17,896 15 0 17 17 1 2 22,575 16 0 0
cluster membership
Terbentuk 2-4 cluster yang anggota dari masing-masing cluster optimum bel output di atas.
Berikut tabel ringkasan dari output diatas: Cluster Membership
Case 4 Clusters 3 Clusters 2 Clusters
1:OAT Quaker 1 1 1 2:Nestle Carnation 2 2 2 3:LIGO Havermout 1 1 1 4:Ovaltine 1 1 1 5:Milo 1 1 1 6:Dancow balita 3 1 1 7:Frisian Flag Instan 3 1 1 8:Frisian Flag Full Cr 3 1 1 9:Frisian Flag Coklat 1 1 1 10:Frisian Flag Madu 3 1 1 11:Dancow Coklat 4 3 1 12:Dancow Full Cream 3 1 1 13:Indomilk Full Cream 3 1 1 14:Indomilk Coklat 1 1 1 15:Prosteo rendah lemak 3 1 1 16:Anlene Kalsium Tingg 3 1 1 17:Tropicana Slim 1 1 1 18:Protifar 3 1 1
Jika terbentuk 4 cluster
Cluster 1 :Susu oat, ligo, ovaltine, milo, frisian flag coklat, indomilk coklat, dan tropicana slim
Cluster 2 :Nestle
Cluster 3 :Dancow balita, Frisian flag instan, Frisian flag full cr, Frisian flag madu, dancow
full cream, indomilk full cream, Prosteo rendah lemak, Anlene Kalsium tinggi, Protifar
Cluster 4 : Dancow Coklat
Jika terbentuk 3 cluster......
Jika terbentuk 2 cluster......
Dendogram
Memperlihatkan proses pengklasteran. Dari dendogram terlihat pengklasteran yang mungkin dengan jumlah
2,3, dan 4. Misalkan ingin dibagi menjadi 2 klaster, maka ditarik garis dari angka 20 kemudian terlihat bahwa
cluster 1 terdiri dari surat kabar paling atas yaitu frisian flag instan sampai dancow coklat, sedangkan nestle
terletak pada cluster 2 karena tidak dalam satu garis dengan kelompok cluster 1. Berikut seterusnya cara
membaca dendogram jika ingin melihat dibagi menjadi 3 cluster, maupun 4 cluster.
Diskriminan: 2 faktor atau 3 faktor Sedikit afak Mirip dengan Regresi Logistik Ganda
Tujuan Analisis Ini:
1. Ingin mengetahui apakah ada perbedaan yang jelas antar grup pada variabel dependen
2. Jika ada, variabel independen manakah pada fungsi diskriminan yang membuat perbedaan grup tersebut
3. Membuat Fungsi/Model Diskriminan
4. Melakukan klasifikasi terhadap obyek
Analisis diskriminan dua faktor Langkah2 di spss:
Buka file LDA 2 faktor .sav
Langkah pertama: checking variabel terlebih dahulu
Analyze>classify>diskriminant
Masukkan variabel minum ke bagian grouping variabel>>>>>>dikarenakan variabel minum
dinyatakan variabel dependen yang berupa kategori
Pada define range untuk variabel minum ditulis 0 pada minimum dan 1 pada maximum
(sesuai kategori dalam data variabel tersebut)
Masukan semua variabel kecuali variabel minum dan nama ke dalam variabel independent
Statistik: univariate ANOVAs dan Box’s M
OUTPUTNYA:
Checking Variable: Tests of Equality of Group Means
Wilks' Lambda F df1 df2 Sig.
usia .945 4.247 1 73 .043
berat .934 5.173 1 73 .026
tinggi .946 4.186 1 73 .044
income .894 8.656 1 73 .004
jamkerja .999 .076 1 73 .783
olahraga .946 4.183 1 73 .044
Ada dua cara dalam mengambil keputusan
Dengan angka wilk’s lambda (U/ MENGUJI RATA-RATA TIAP VARIABEL)
Angka ini hanya berkisar 0-1.....jika angka mendekati 0, mk data tiap grup cenderung berbeda,
sedang jika mendekati 1 data tiap grup cenderung sama.
Terkadang kriteria mendekati 1 sangat sulit ditentukan secara pasti, seperti contoh ini semua
variabel memungkinkan anka wilk’s lambda mendekati 1, tp jika dilihat sig....ternyata hanya 1
variabel saja yang tidak lolos....sehingga lebih mudah melihatnya, dengan menggunakan F test
Dengan F test (PAKE NI AJA)
dilihat dari sig
Apabila sig> α, berarti tidak ada perbedaan antar grup (G LOLOS)
Apabila sig<α, berarti ada perbedaan antar grup
1. Menilai var yg layak dianalisis
Ternyata var jam kerja tdk signifikan sehingga tidak dimasukkan ke dalam analisis selanjutnya
2. Proses diskriminan
Variabel yg digunakan: Usia Berat Tinggi Income olahraga
Box's M U/ MENGUJI VARIANSI DARI SETIAP VARIABEL
ASUMSI DALAM ANALISIS DISKRIMINAN
1. Variansi Variabel Independen u/ tiap Grup seharusnya sama => LOG DETERMINAN
2. Variansi di antara variabel-variabel independen seharusnya sama => BOX’S Test Results
Box's M 28.145
F Approx. 1.222
df1 21
df2 19569.371
Sig. .220
Tests null hypothesis of equal population covariance matrices.
Digunakan untuk uji asumsi matriks kovarians tiap variabel independen.
H0 : group covariance matrice relative sama.
H1 : group covariance matrice berbeda secara nyata.
Karena nilai sig =0,220 > α=0,05 maka H0 tidak ditolak, yang berarti bahwa group covariance matrice
relative sama (homogen). Log Determinants
minum Rank Log Determinant
sedikit 6 14.085
banyak 6 14.258
Pooled within-groups 6 14.556
The ranks and natural logarithms of determinants printed are those of the group covariance matrices.
Nilai log determinant yang dihasilkan TIDAK berbeda cukup jauh (RELATIF SAMA), hal ini
berarti bahwa group covariance matrice tidak berbeda secara nyata untuk kedua faktor(“sedikit”
dan “banyak”)
Langkah berikutnya analisis diskriminan.
Analyze>classify>diskriminant
Masukkan variabel minum ke bagian grouping variabel>>>>>>dikarenakan variabel minum
dinyatakan variabel dependen yang berupa kategori
Pada define range untuk variabel minum ditulis 0 pada minimum dan 1 pada maximum (sesuai
kategori dalam data variabel tersebut)
Masukan semua variabel kecuali variabel minum dan nama ke dalam variabel independent
Use stepwise method
Statistics: descriptive>>>>means, fuction coeficients>>>>>fisher’s dan unstandardized
Method: mahalobis, use probability of F
Classify: casewise result, leave one out classification
Save : prediction membership, discriminant scores
OUTPUT
Variables entered/removed Variables Entered/Removed
a,b,c,d
Step
Wilks' Lambda
Exact F
Entered Statistic df1 df2 df3 Statistic df1 df2 Sig.
1 income .894 1 1 73.000 8.656 1 73.000 .004
2 berat .834 2 1 73.000 7.170 2 72.000 .001
3 tinggi .763 3 1 73.000 7.343 3 71.000 .000
At each step, the variable that minimizes the overall Wilks' Lambda is entered.
a. Maximum number of steps is 10.
b. Minimum partial F to enter is 3.84.
c. Maximum partial F to remove is 2.71.
d. F level, tolerance, or VIN insufficient for further computation.
Karena proses stepwise(bertahap) maka akan dimulai dg variabel yg mempunyai angka F yang terbesar.
Tahap pemasukkan variabel independent:
Tahap pertama, angka F hitung variabel income adalah yang terbesar mencapai 8,656, maka pada tahap
pertama ini variabel income dipilih, Dst
Jika dilihat sig, maka ketiga variabel mempunyai sig < 0,05..dengan demikian ketiga variabel tersebut
mempengaruhi variabel minum.
Wilk’s lambda Wilks' Lambda
Step
Number of
Variables Lambda df1 df2 df3
Exact F
Statistic df1 df2 Sig.
1 1 .894 1 1 73 8.656 1 73.000 .004
2 2 .834 2 1 73 7.170 2 72.000 .001
3 3 .763 3 1 73 7.343 3 71.000 .000
Perinsipnya disini adalah varians total dalam discriminant scores yang tidak bisa dijelaskan oleh
perbedaan diantara grup-grup yang ada.
Jika dilihat sig pada F test terlihat ketiga variabel signifikan terhadap variabel minum, itu menandakan
bahwa ketiga variabel tersebut memang berbeda untuk kedua tipe konsumen.
Summary of canonical discriminant function
Eigenvalues
Function Eigenvalue % of Variance Cumulative %
Canonical
Correlation
1 .310a 100.0 100.0 .487
a. First 1 canonical discriminant functions were used in the analysis.
Ini untuk mengukur keeratan hubungan antara discriminant score dg grup(dalam hal ini ada dua grup
tipe konsumen). Angka 0,487 menunjukkan keeratan yg cukup tinggi, ukuran asosiasi 0-1
Wilk’s lambda Wilks' Lambda
Test of Function(s)
Wilks' Lambda Chi-square df Sig.
1 .763 19.321 3 .000
Dari output diatas, didapatkan nilai sig=0,000 < α=0,05 yang menunjukkan ada perbedaan yang jelas
antara 2 group
Structure matrix Pooled within-groups correlations between discriminating variables and standardized
canonical discriminant functions
Variables ordered by absolute size of correlation within function.
a. This variable not used in the analysis.
Output diatas menjelaskan korelasi antara variabel independen dengan fungsi
diskriminan yang terbentuk. Terlihat variabel income paling erat hubungannya
dengan fungsi distriminant, diikuti variabel usia, berat dan sterusnya. Hanya saja
variabel usia dan olahraga tidak dimasukkan ke dalam model discriminant.
Canonical discriminant function coefficients Canonical Discriminant Function
Coefficients
Function
1
berat .064
tinggi -.093
income .006
(Constant) 7.884
Unstandardized coefficients
Dari output diatas, didapatkan fungsi diskriminan sebagai berikut
incometinggiberatZscore 006,0093,0064,0884,7
Function at group centroids Functions at Group Centroids
minum
Function
1
sedikit .542
banyak -.557
Unstandardized canonical discriminant functions evaluated at group means
Prior Probabilities for Groups
minum Prior
Cases Used in Analysis
Unweighted Weighted
sedikit .500 38 38.000
banyak .500 37 37.000
Total 1.000 75 75.000
Structure Matrix
Function
1
income .618
usiaa .521
berat .478
olahragaa .475
tinggi -.430
Classification Resultsb,c
27 11 38
13 24 37
71,1 28,9 100,0
35,1 64,9 100,0
27 11 38
13 24 37
71,1 28,9 100,0
35,1 64,9 100,0
minumsedikit
banyak
sedikit
banyak
sedikit
banyak
sedikit
banyak
Count
%
Count
%
Original
Cross-validated a
sedikit banyak
Predicted GroupMembership
Total
Cross validation is done only for those cases in the analysis. Incross validation, each case is classified by the functions derivedfrom all cases other than that case.
a.
68,0% of original grouped cases correctly classified.b.
68,0% of cross-validated grouped cases correctly classified.c.
Kedua output diatas, digunakan untuk mencari nilai Zcritical unstandardized
BA
ABBAcu
NN
ZNZNZ
Keterangan :
A = “sedikit”
B =”banyak”
01483,03738
)542,0(37)557,0(38
cuZ
ZB Zcu ZA
-0,557 -0,01483 0,542
incometinggiberatZ score 006,0093,0064,0884,7
Penggunaan Zcu, jika :
o Nilai Zscore > Zcu masuk group “sedikit”
o Nilai Zscore < Zcu masuk group “banyak”
Untuk lebih jelasnya data terdapat dalam data view, dis_1 menunjukkan responden tersebut masuk
dalam group mana. Sedangkan dis1_1 adalah nilai dari Zscore dari responden tersebut.
Analisis diskriminan dua faktor
Langkah2 di spss:
Buka file LDA 3 faktor .sav
Langkah pertama: checking variabel terlebih dahulu sama seperti LDA 2
Langkah berikutnya analisis diskriminan.
Analyze>classify>diskriminant
Masukkan variabel minum ke bagian grouping variabel>>>>>>dikarenakan variabel minum
dinyatakan variabel dependen yang berupa kategori
Pada define range untuk variabel minum ditulis 0 pada minimum dan 2 pada maximum (sesuai
kategori dalam data variabel tersebut)
Masukan semua variabel kecuali variabel minum dan nama ke dalam variabel independent
Use stepwise method
Statistics: descriptive>>>>univariat ANOVAs, fuction coeficients>>>>>unstandardized
Method: mahalobis, criteria>>>use probability of F, display>>>>F for pairwise distances
Classify: display>>>>>>>casewise result, leave one out classification, plot>>>>>teritorial map
Save : prediction membership, discriminant scores
OUTPUT
Variables entered/removed Variables Entered/Removed
a,b,c,d
Step
Min. D Squared
Exact F
Entered Statistic Between Groups Statistic df1 df2 Sig.
1 usia .093 sedang and banyak 1.083 1 72.000 .302
2 berat .162 sedang and banyak .929 2 71.000 .400
At each step, the variable that maximizes the Mahalanobis distance between the two closest groups is entered.
a. Maximum number of steps is 12.
b. Maximum significance of F to enter is .05.
c. Minimum significance of F to remove is .10.
d. F level, tolerance, or VIN insufficient for further computation.
Karena proses stepwise(bertahap) maka akan dimulai dg variabel yg mempunyai angka F yang terbesar.
Tahap pemasukkan variabel independent:
Tahap pertama, angka F hitung variabel income adalah yang terbesar mencapai 1,083, maka pada tahap
pertama ini variabel income dipilih, Dst
Jika dilihat sig, maka ketiga variabel mempunyai sig < 0,05..dengan demikian kedua variabel tersebut
mempengaruhi variabel minum.
Wilk’s lambda Wilks' Lambda
Step Number of Variables Lambda df1 df2 df3
Exact F
Statistic df1 df2 Sig.
1 1 .904 1 2 72 3.821 2 72.000 .026
2 2 .789 2 2 72 4.456 4 142.000 .002
Step1 ke Step 2 Wiks’Lambda makin kecil itu lebih bagus
Perinsipnya disini adalah varians total dalam discriminant scores yang tidak bisa dijelaskan oleh
perbedaan diantara grup-grup yang ada.
Jika dilihat sig pada F test terlihat ketiga variabel signifikan terhadap variabel minum, itu menandakan
bahwa ketiga variabel tersebut memang berbeda untuk kedua tipe konsumen.
Pairwise group comparisons
Digunakan u/ melihat sejauh mana
perbedaan antar group
Group mana yg bedanya jauh, mana yg
bedanya dekat.
Yg paling jauh =grup sedikit dan banyak (liat
nile F)
Yg paling deket = grup sedang dan banyak
(liat nile F)
8,697 = Maksudnya konsumen di grup
sedikit berbeda jauh profilnya (usia&beratnya) dari
grup yg banyak
0,929 = Maksudnya konsumen di grup
sedang berbeda sangat kecil (sedikit) profilnya
(usia&beratnya) dari grup yg banyak
Pairwise Group Comparisonsa,b
Step minum sedikit sedang banyak
1 sedikit F 3.041 7.306
Sig. .085 .009
sedang F 3.041 1.083
Sig. .085 .302
banyak F 7.306 1.083
Sig. .009 .302
2 sedikit F 4.441 8.697
Sig. .015 .000
sedang F 4.441 .929
Sig. .015 .400
banyak F 8.697 .929
Sig. .000 .400
a. 1, 72 degrees of freedom for step 1.
b. 2, 71 degrees of freedom for step 2.
Summary of canonical discriminant function Eigenvalues
Function Eigenvalue % of Variance Cumulative % Canonical Correlation
1 .266a 99.7 99.7 .458
2 .001a .3 100.0 .030
a. First 2 canonical discriminant functions were used in the analysis.
Nile Canonical Correlation sudah cukup tinggi jika nilainya >0,4 yg lemah gpp,
.458 = maksudnya keeratannya cukup tinggi .030 = maksudnya keeratannya cukup rendah
cuz interpretasinya harus pake fungsi 2-2nya, maksudnya walaupun lemah tetap dipakai karena kita
menggunakan 2 variabel dan 2 variabel tersebut itu ada di step 2.
Wilk’s lambda =:= Bagusnya ada perbedaan karena kita ingin melihat perbedaan Wilks' Lambda
Test of Function(s) Wilks' Lambda Chi-square df Sig.
1 through 2 .789 16.908 4 .002
2 .999 .065 1 .799
1 through 2
H0 : tidak ada perbedaan rata2 (centroid/PUSAT) dari kedua fungsi diskriminan (ada
fungsi 1 dan fungsi 2).
H1 : ada perbedaan rata2 (centroid) dari kedua fungsi diskriminan.
,002 < 0.05, H0 ditolak
2 Fungsi yang ke-2 itu dari grup sedang dan banyak
H0 : tidak ada perbedaan rata2 (centroid) dari fungsi diskriminan 2 ( grup. Sedang-
banyak)
H1 : ada perbedaan rata2 (centroid) dari fungsi diskriminan 2 ( grup. Sedang-banyak).
,799 > 0.05, H0 diterima
Structure matrix
Menerangkan nile korelasi antara var. yg terbentuk
Yg ada tanda a, ga sig
Usia masuk ke fungsi dikriminan yg ke-2 karena nilai korelasi di
fungsi 2 > di fungsi 1
Usia masuk ke fungsi dikriminan yg ke-1 karena nilai korelasi di
fungsi 2 < di fungsi 1
Canonical discriminant function coefficients = pembuatan
fungsi diskriminan
Didapat fungsi
diskriminan
Zscore1 = -7,169 + ,079 berat
+,093 usia
Zscore2 = -,516 -,064berat +
,129 usia
Function at group centroids= pusatnyaFunctions at Group Centroids
minum
Function
1 2
sedikit .622 (pusatnya) -.012
sedang -.194 .039
banyak -.590 -.032
Unstandardized canonical discriminant functions evaluated at group means
Structure Matrix
Function
1 2
berat .812* -.583
tinggia .192
* -.102
jamkerjaa .054* -.043
usia .630 .776*
incomea .446 .663
*
olahragaa .199 .492*
Pooled within-groups correlations between discriminating variables and standardized canonical discriminant functions Variables ordered by absolute size of correlation within function.
*. Largest absolute correlation between each variable and any discriminant function
a. This variable not used in the analysis.
Canonical Discriminant Function Coefficients
Function
1 2
usia .093 .129
berat .079 -.064
(Constant) -7.169 -.516
Unstandardized coefficients
Prior Probabilities for Groups
minum Prior
Cases Used in Analysis
Unweighted
(orang) Weighted
sedikit .333 28 28.000
sedang .333 26 26.000
banyak .333 21 21.000
Total 1.000 75 75.000
Untuk menentukan var. mana aj yg masuk ke grup mana
Zscore1 = -7,169 + ,079 berat +,093 usia (sumbu x)
Zscore2 = -,516 -,064berat + ,129 usia (sumbu y)
Misal: Rusdi (SEDIKIT)
Zscore1 = -7,169 + ,079 berat +,093 usia = -7,169 + ,079 (60) +,093 (40) (sumbu x) = 1,686 (liat di Dist. 1_1)
Zscore2 = -,516 -,064berat + ,129 usia = -,516 -,064(60) + ,129 (40) = 0,480 (liat di Dist. 1_2)
Classification Resultsb,c
minum
Predicted Group Membership
Total sedikit sedang banyak
Original Count sedikit 19 4 5 28
sedang 7 9 10 26
banyak 4 4 13 21
% sedikit 67.9 14.3 17.9 100.0
sedang 26.9 34.6 38.5 100.0
banyak 19.0 19.0 61.9 100.0
Cross-validateda Count sedikit 18 4 6 28
sedang 8 6 12 26
banyak 4 4 13 21
% sedikit 64.3 14.3 21.4 100.0
sedang 30.8 23.1 46.2 100.0
banyak 19.0 19.0 61.9 100.0
a. Cross validation is done only for those cases in the analysis. In cross validation, each case is classified by the functions derived from all cases other than that case.
b. 54,7% of original grouped cases correctly classified.
c. 49,3% of cross-validated grouped cases correctly classified.
diprediksi dengan benar dr 75 responden sebanyak 54,7%