analisis multivariat - eko.staff.uns.ac.idanalisis regresi logistik multivariabel •1 variabel...
TRANSCRIPT
Analisis MultivariatMateri ke - 5
Dr. Eko Pujiyanto, S.Si., M.T.
Program Pascasarjana Teknik Industri - UNS
Isi
• Pendahuluan
• Model Regresi Linier Berganda
• Uji Statistik
• Diagnosis Asumsi Klasik (Analisis Sisa)
• Topik lain yang berkaitan
• Analisis Regresi Logistik
Program Pascasarjana Teknik Industri - UNS
Pendahuluan
• Regresi linier Mengetahui pengaruh antarasatu atau beberapa variabel bebas terhadapsatu buah variabel tidak bebas
• Regresi linier hanya dapat digunakanpada skala interval dan ratio
• Regresi linier
– Regresi linier sederhana : satu variabel bebasdan satu variabel tidak bebas
– Regresi linier berganda : dua atau lebihvariabel bebas dan satu variabel tidak bebas
Program Pascasarjana Teknik Industri - UNS
Model regresi linier berganda
• Model populasi secara umum
Program Pascasarjana Teknik Industri - UNS
� = �� + ���� + ���� +⋯+ ����+∈
Model regresi linier berganda
• Model sampel secara umum
�� penaksir �( biasanya cukup ditulis � )
��penaksir �� dan seterusnya
�̂ penaksir ∈
Program Pascasarjana Teknik Industri - UNS
�� = �� + ���� + ���� + ⋯+ ���� + �̂
Asumsi
1. Hub y dan xi adalah linier dan telah dinyatakandengan tepat.
2. Tidak ada hub linier antar variabel independen(prediktor) – tdk ada multikolenieritas
3. E(e) = 0 dan Var(e) = konstan(homokedastisitas)
4. Tidak ada korelasi antar nilai residual (tdk adaotokorelasi)
5. e berdistribusi normal
Program Pascasarjana Teknik Industri - UNS
Model regresi linier berganda
• Model dalam bentuk matrik
atau
Dengan asumsi
Program Pascasarjana Teknik Industri - UNS
Model regresi linier berganda
Mencari ��, ��, … �� sebagi penaksir �� , ��, …, �� dengan metode Least Squares Estimation
Program Pascasarjana Teknik Industri - UNS
Model regresi linier berganda
Least Squares Estimation
Optimal jika��
��= �
Sehingga diperoleh
Program Pascasarjana Teknik Industri - UNS
� = ��� ��. ��. �
Model regresi linier berganda
Contoh :
Menguji pull strength wire bond
1 variabel tidak bebas• Pull strength (y)
2 variabel bebas• Wire Length (x1)
• Die heigth (x2)
Program Pascasarjana Teknik Industri - UNS
Model regresi linier berganda
Contoh :
Program Pascasarjana Teknik Industri - UNS
Model regresi linier berganda
Contoh : Plot data dalam 2 dimensi (minitab)
Program Pascasarjana Teknik Industri - UNS
(�)
(��)
(��)
��
�
�
��
Model regresi linier berganda
Contoh :
Program Pascasarjana Teknik Industri - UNS
x1 x2
Model regresi linier berganda
Contoh :
Program Pascasarjana Teknik Industri - UNS
Model regresi linier berganda
Contoh :
Program Pascasarjana Teknik Industri - UNS
Model regresi linier berganda
Contoh 2 (Gudono, 2014):
Diketahui data Plot data 3 Dimensi
Program Pascasarjana Teknik Industri - UNS
Y X1 X2
5 4 2
7 6 5
6 5 5
20 12 18
15 10 13
12 9 10
10 8 9
10.714 7.714 8.857
5.407 2.870 5.460
MeanStdev
Model regresi linier berganda
Contoh 2 (Gudono, 2014):
Program Pascasarjana Teknik Industri - UNS
Model regresi linier berganda
Contoh 2 (Gudono, 2014): Minitab
Data distandarisasi Plot data
Program Pascasarjana Teknik Industri - UNS
Ys X1s X2s
-1.06 -1.29 -1.26
-0.69 -0.60 -0.71
-0.87 -0.95 -0.71
1.72 1.49 1.67
0.79 0.80 0.76
0.24 0.45 0.21
-0.13 0.10 0.03
0.00 0.00 0.00
1.00 1.00 1.00
MeanStdev
Model regresi linier berganda
Contoh 2 (Gudono, 2014):
Program Pascasarjana Teknik Industri - UNS
Uji statistik
• Signifikansi koefisien ( uji t )
Rumus
Dimana
�� koefisien regresi
��elemen diagonal matriks
s adalah��.�
���
N jumlah data dan k jumlah variabel bebas
Program Pascasarjana Teknik Industri - UNS
���� =��
� ��
��� ��
Uji statistik
• Signifikansi koefisien ( uji t )
Program Pascasarjana Teknik Industri - UNS
Uji statistik
• Korelasi parsial Y dan X1 dengan mengontrol X2
Dimana
��,�� korelasi biasa antara Y dan X1
Program Pascasarjana Teknik Industri - UNS
��,����� =��,�� − ��,��. �����
1 − ������. 1 − ����
�
Uji statistik
Program Pascasarjana Teknik Industri - UNS
Uji statistik
• Coefficient of determination
� = �� koefisien multiple correlation
��� �� = 1 − 1 − �����
�����adjusted ��
Untuk mengujia �� digunakan uji F
����,��� =��
��
(����)(�����)�
Program Pascasarjana Teknik Industri - UNS
�� =������
= 1 −∑ ∈�
∑ �� − ���
Uji statistik
• Coefficient of determination
Program Pascasarjana Teknik Industri - UNS
Uji statistik
• Goddness of fit (Partial F test)
� =�������
(�����)�
�����
(������
Program Pascasarjana Teknik Industri - UNS
Uji statistik
• Goddness of fit (Partial F test)
� =�������
(�����)�
�����
(������
Program Pascasarjana Teknik Industri - UNS
Diagnosis Asumsi Klasik (Analisis Sisa)
• Pengujian asumsi klasik dengan caramenganalisis pola sisa
• Sisa ∈ mewakili varian Y
• Jika ada pelanggaran asumsi , dapat dilihat daripola sisa
Program Pascasarjana Teknik Industri - UNS
Diagnosis Asumsi Klasik (Analisis Sisa)
Program Pascasarjana Teknik Industri - UNS
Contoh 1 : Menghitung sisa
Persamaan regresi digunakan untuk menaksir nilaipull strength , untuk semua nilai
Misalkan untuk
Maka
Dari data sebelumnya
Maka sisanya adalah
x1 dan x2
x1 = 2 , x2 = 50
Diagnosis Asumsi Klasik (Analisis Sisa)
1. Uji linieritas
a. Melihat pola scatter plot sisa (RES_1) dannilai prediksi Y (PRE_1)
Program Pascasarjana Teknik Industri - UNS
Diagnosis Asumsi Klasik (Analisis Sisa)
1. Uji linieritas
a. Melihat pola scatter plot sisa (RES_1) dannilai prediksi Y (PRE_1)
Program Pascasarjana Teknik Industri - UNS
Rata-rata prediksi Y = (0 , 10.71)
Diagnosis Asumsi Klasik (Analisis Sisa)
1. Uji linieritas
a. Melihat pola scatter plot nilai prediksi Y dansisa
Program Pascasarjana Teknik Industri - UNS
Diagnosis Asumsi Klasik (Analisis Sisa)
2. Uji Heterokedastisitas (Uji Goldfeld-Quandt Test)
– Urutkan data sisa sesuai ukuran Y dan bagilahmenjadi 3 kelompok
– Hilangkan kelompok tengah (midle)
– Buat model regresi dan hitung SSE-nya untukkelompok bawah dan atas
– Uji dengan F=(SSE1)/(SSE2)
– Jika nilai F hitung > F tabel maka terdapatHeterokedastisitas
Program Pascasarjana Teknik Industri - UNS
Diagnosis Asumsi Klasik (Analisis Sisa)
2. Uji Heterokedastisitas (Uji Goldfeld-Quandt Test)
Program Pascasarjana Teknik Industri - UNS
TerdapatHeterokedastisitas
Tidak adaHeterokedastisitas
Diagnosis Asumsi Klasik (Analisis Sisa)
3. Uji Normalitas
– Scatter plot nilai prediksi Y dan sisa Acak
Program Pascasarjana Teknik Industri - UNS htt
ps:
//to
ben
eo.f
iles.
wo
rdp
ress
.co
m/2
01
3/1
2/p
lot.
jpg
Diagnosis Asumsi Klasik (Analisis Sisa)
3. Uji Normalitas
– Normal probability plot berada disekitar garis
Program Pascasarjana Teknik Industri - UNS
http://facweb.cs.depaul.edu/sjost/csc423/documents/nplots.gif
Topik lainnya
1. Uji Multikolinieritas
– Jika jumlah variabel bebas lebih dari 1 makabisa terjadi korelasi antar variabel bebas
– Cara menguji dengan variance inflation factor (VIF)
– Rumus VIF variabel ke-j
– Jika VIF > 10 maka terdapat multikolinieritas
Program Pascasarjana Teknik Industri - UNS
���� =1
1 − ��
Topik Lainnya
2. Uji Autokorelasi
– Korelasi dengan dirinya sendiri
– Tidak berakibat pada koefisien regresi tetapimenghasilkan standar error yang lebih kecildari yang sesungguhnya
– Durbin-Watson test
– Jika mendekati 2 tidak ada korelasi
Program Pascasarjana Teknik Industri - UNS
�� =∑ �� − ����
�����
∑ ������
Topik Lainnya
3. Outlier
– Berakibat pada koefisien regresi menguatatau melemah
Program Pascasarjana Teknik Industri - UNS htt
p:/
/ww
w.f
ao.o
rg/w
aird
ocs
/ilr
i/x5
46
9e/
x54
69
e0e
.htm
Topik Lainnya
4. Variable promoderasi
– Ada varibel bebas yang tidak langsungberpengaruh terhadap variabel tidak bebas
– Varibel bebas tersebut berpengaruh padavariabel bebas lain yang berpengaruhterhadap variabel tidak bebas
– Model untuk 2 variabel bebas
Program Pascasarjana Teknik Industri - UNS
�� = �� + ���� + ������ + �̂
Topik Lainnya
5. Control variable
– Ada varibel bebas yang dikontrol ataunilainya tetap dalam eksperimen
– Supaya hubungan variabel bebas lain danvariabel tidak bebas dapat diamati denganlebih cermat
– Contoh
Program Pascasarjana Teknik Industri - UNS
�� = 0.5 − 0.5��Muda
Tua�� = 0.5 + 1��
�� = 0.5 − 1.5��
Analisis Regresi Logistik
• Digunakan untuk menjelaskan hubungan antaravariabel tidak bebas (Y) yang berupa data dikotomik/biner dengan variabel bebas (X) yang berupa data berskala interval dan atau kategorik.
• Variabel yang dikotomik/biner adalah variabel yang hanya mempunyai dua kategori saja, yaitu kategoriyang menyatakan kejadian sukses (Y=1) dankategori yang menyatakan kejadian gagal (Y=0).
• Variabel tidak bebas (Y) diasumsikan mengikutidistribusi Bernoulli.
Program Pascasarjana Teknik Industri - UNS
Analisis Regresi Logistik
Contoh
• Pengaruh Tingkat Pendidikan, Lapangan Kerja ygdimasuki, Pendapatan, Pengeluaran, JumlahART ( X ) terhadap status kemiskinan (Y) (Miskin/TIdak Miskin).
• Pengaruh Pendapatan Keluarga, BanyaknyaAnggota Keluarga, Jenis rumah, Usia KepalaKeluarga (X) terhadap Kepemilikan rumah (Y) (Punya rumah/tidak)
Program Pascasarjana Teknik Industri - UNS
Analisis Regresi Logistik
Asumsi
• Tidak mengasumsikan hubungan linier antarvariabel tidak bebas dan bebas
• Variabel tidak bebas harus bersifat dikotomi (2 variabel)
• Variabel bebas tidak harus memiliki keragamanyang sama antar kelompok variabel
• Kategori dalam variabel bebas harus terpisah satusama lain atau bersifat eksklusif
• Sampel yang diperlukan dalam jumlah relatif besar, minimum dibutuhkan hingga 50 sampel data untuksebuah variabel bebas.
Program Pascasarjana Teknik Industri - UNS
Analisis Regresi Logistik
Model
Atau
Untuk 1 variabel bebas (x) dan 1 variabel takbebas (y)
Program Pascasarjana Teknik Industri - UNS
� = �� + ���
Analisis Regresi Logistik
Contoh 1
Pengaruh lingkungan (variabel bebas) terhadapkebangkrutan (variabel tak bebas)
Program Pascasarjana Teknik Industri - UNS
No Status Perubahan No Status Perubahan
1 1 1 12 0 1
2 1 1 13 0 0
3 1 1 14 0 0
4 1 1 15 0 0
5 1 1 16 0 0
6 1 1 17 0 0
7 1 1 18 0 0
8 1 1 19 0 0
9 1 1 20 0 0
10 1 0 21 0 0
11 1 0 22 0 0
Status1 : Bangkrut0 : Sehat
Perubahan1 : Cepat0 : Lambat
Analisis Regresi Logistik
Contoh 1
Menaksir �� dan��pada
Program Pascasarjana Teknik Industri - UNS
� = �� + ���
Analisis Regresi Logistik
Contoh 1
Program Pascasarjana Teknik Industri - UNS
3.806 = 2.197+1.609
Y' = -1.609 + 0.0 Perubahan_0 + 3.81 Perubahan_1
Analisis Regresi Logistik
Logistik v.s. linier
• Logistik
• Linier
Program Pascasarjana Teknik Industri - UNS
Status = 0.167 + 0.0 Perubahan_0 + 0.733 Perubahan_1
Status = -1.609 + 0.0 Perubahan_0 + 3.81 Perubahan_1
Analisis Regresi Logistik
Metode untuk mengestimasi parameter-parameter :
1. Metode kemungkinan maksimum (Maximum Likelihood Method)
2. Metode kuadrat terkecil tertimbangnoniterasi (Noniterative Weight Least Square Method)
3. Analisis fungsi diskriminan (Discriminant Fuction Analysis)
Program Pascasarjana Teknik Industri - UNS
Analisis Regresi Logistik
Metode kemungkinan maksimum (Maximum Likelihood Method)
• Fungsi likelihood distribusi Bernoulli
• Log-likelihood
Program Pascasarjana Teknik Industri - UNS
Analisis Regresi Logistik
Metode kemungkinan maksimum (Maximum Likelihood Method)
• Taksiran parameter βk , diperoleh denganmendiferensialkan fungsi log-likelihood terhadap βk dengan k = 0, 1.
• Nilai maksimum diperoleh bila hasil diferensialfungsi log-likelihood bernilai nol.
• Diperlukan metode iterasi untuk mendapatkantaksiran pada metode maksimum likelihood karena tidak bisa diperoleh taksiran parameter dari pendeferensialan fungsi log-likelihood.
Program Pascasarjana Teknik Industri - UNS
Analisis Regresi Logistik
Uji Signifikansi Parameter
• Mengetahui apakah taksiran parameter yang diperoleh berpengaruh secara signifikanterhadap model atau tidak, dan seberapa besarpengaruh masing-masing parameter tersebutterhadap model.
• Uji signifikansi terdiri dari dua tahap
– Uji signifikansi parameter model secarabersama
– Uji signifikansi parameter model secaraterpisah.
Program Pascasarjana Teknik Industri - UNS
Analisis Regresi Logistik
Uji Signifikansi Parameter secara bersama
• Uji rasio likelihood
– Lo adalah log-likelihood dari model tanpavariabel bebas
– L1 adalah log-likelihood dari model dengan p variabel bebas
– H0 : βk = 0 , k = 1, 2, ..., p
– H0 ditolak jika
Program Pascasarjana Teknik Industri - UNS
Analisis Regresi Logistik
Uji Signifikansi Parameter secara terpisah
• Uji Wald Chi-square
– H0 : βk = 0 , k = 1, 2, ..., p
– H0 ditolak jika
Program Pascasarjana Teknik Industri - UNS
Analisis Regresi Logistik
Uji Kecocokan Model
• 2 Log Likelihood
• Cox and Snel Pseduo ��
• Nagelkerke ��
• Uji Hosmer dan Lemeshow
Program Pascasarjana Teknik Industri - UNS
Analisis Regresi Logistik
Penggunaan SPSS ( Contoh 1 )
Program Pascasarjana Teknik Industri - UNS
Analisis Regresi Logistik Multivariabel
• 1 variabel tidak bebas dengan 2 katagori
• 2 atau lebih variabel bebas
• Contoh
– Seorang peneliti ingin mengetahui bagaimanapengaruh kualitas pelayanan publik terhadapkepuasan pengguna (masyarakat).
– Kualitas pelayanan publik diteliti melaluivariabel Daya Tanggap (X1) dan Empati (X2).
– Kepuasan penggunana layanan (Y) sebagaivariabel dependen puas (1) dan tidak puas(0).
Program Pascasarjana Teknik Industri - UNS
Analisis Regresi Logistik Multinomial
• 1 variabel tidak bebas
dengan 3 atau
lebih katagori
• 2 atau lebih
variabel bebas
• Contoh
Program Pascasarjana Teknik Industri - UNS