analisis komponen utama

Post on 19-Jul-2016

173 Views

Category:

Documents

29 Downloads

Preview:

Click to see full reader

DESCRIPTION

presentasi

TRANSCRIPT

ANALISIS KOMPONEN UTAMA Budi Subandrio

Ika NuryaniK. Nurika Damayanti

Nita Ferdiana

ANALISIS KOMPONEN UTAMA

3

Apa itu Komponen Utama

• Merupakan kombinasi linear dari peubah yang diamati informasi yang terkandung pada KU merupakan gabungan dari semua peubah dengan bobot tertentu

• Kombinasi linear yang dipilih merupakan kombinasi linear dengan ragam (varian) paling besar memuat informasi paling banyak

• Antar KU bersifat ortogonal tidak berkorelasi informasi tidak tumpang tindih

4

Analisis Komponen Utama

Gugus peubah asal

{X1, X2, …, Xp}

Gugus KU{KU1, KU2, …,

KUp}Hanya dipilih k < p KU saja, namun mampu memuat sebagian besar

informasi

Analisis Komponen Utama

•Tujuan: - diharapkan dapat disusutkan dimensi banyaknya variabel atau dapat disederhanakan struktur hubungan variabel sehingga dengan dimensi yang lebih kecil - diharapkan lebih mudah melakukan interpretasi tanpa kehilangan banyak informasi tentang data, bahkan informasi yang didapat menjadi lebih padat dan bermakna. - data (skor komponen) dapat digunakan sebagai input analisis lanjut (misal: Bi-plot, An. Komponen Regresi, An. Cluster)

𝑿𝟏 ,𝑿𝟐 ,…. ,𝑿𝒑 𝐘𝟏 ,𝐘𝟐 ,…. ,𝐘𝐩AKU

Catatan:AKU tidak selalu berhasil dalam mereduksi banyaknya peubahAKU tidak bermanfaat bila peubah-peubah yang dianalisis tidak

saling berkorelasi. Dalam hal ini, KU yang dihasilkan akan sama dengan peubah asal, tapi terurut berdasarkan pentingnya peubah tersebut (atau terurut berdasarkan keragamannya)

Hasil terbaik adalah jika terdapat korelasi yang tinggi antar peubah. Pembentukan matriks korelasi merupakan analisis pendahuluan pada AKU

Menurut Koutsoyiannis (1973) serta Draper dan Smith (1981), metode komponen utama cocok untuk dua kasus, pertama bila jumlah variabel yang dimasukkan ke dalam fungsi relatif besar dibandingkan jumlah sampel, kedua sebagai penyelesaian masalah multikolinieritas antar variabel bebas.

komponen utama pertama (KU1) merupakan kombinasi linier dari seluruh variabel yang diamati dan memiliki varians terbesar

komponen utama kedua (KU2) merupakan kombinasi linier dari seluruh variabel yang diamati yang bersifat ortogonal terhadap KU1 dan memiliki varians kedua terbesar

komponen utama ketiga (KU3) merupakan kombinasi linier dari seluruh variabel yang diamati yang bersifat ortogonal baik terhadap KU1 maupun KU2, dan memiliki varians ketiga terbesar

komponen utama ke p (KUp) merupakan kombinasi linier dari seluruh variabel yang diamati yang bersifat ortogonal terhadap KU1, KU2, … , KU(p-1) dan memiliki varians yang terkecil.

Komponen utama dibentuk berdasarkan urutan varians dari yang terbesar hingga yang terkecil, dalam arti sbb:

9

Permasalahan Umum dalam AKU

• Penentuan KU menggunakan ‘matriks ragam-peragam’ vs ‘matriks korelasi’

• Penentuan banyaknya KU

10

Penggunaan Matriks ragam-peragam dalam komponen utama memerlukan persyaratan bahwa peubah yang diamati memiliki ukuran pada skala dengan perbedaan yang tidak besar atau jika satuan ukurannya sama. 

Sehingga bila peubah yang diamati ukurannya pada skala dengan perbedaan yang sangat lebar atau satuannya tidak sama, maka analisis komponen utama tidak menggunakan matriks ragam-peragam, tetapi harus menggunakan matriks korelasi R.

Komponen Utama dengan Menggunakan Matriks Ragam-Peragam

Komponen Utama dengan Menggunakan Matriks KORELASI

Selain berdasarkan matriks kovariansi, komponen utama juga dapat dibentuk berdasarkan matriks korelasi.

Matriks korelasi R ini dapat diperoleh dengan cara mentransformasi setiap variabel asal xij yang merupakan nilai pengamatan dengan rumus:

𝑍=(𝑉12 )−1 ( 𝑋−𝜇)

13

Penentuan Banyaknya KUMetode 1

• didasarkan pada kumulatif proporsi keragaman total yang mampu dijelaskan.

• Metode ini merupakan metode yang paling banyak digunakan, dan bisa diterapkan pada penggunaan matriks korelasi maupun matriks ragam peragam.

• Minimum persentase kergaman yang mampu dijelaskan ditentukan terlebih dahulu, dan selanjutnya banyaknya komponen yang paling kecil hingga batas itu terpenuhi dijadikan sebagai banyaknya komponen utama yang digunakan.

• Tidak ada patokan baku berapa batas minimum tersebut, sebagian buku menyebutkan 70%, 80%, bahkan ada yang 90%.

14

Penentuan Banyaknya KUMetode 2

• hanya bisa diterapkan pada penggunaan matriks korelasi. Ketika menggunakan matriks ini, peubah asal ditransformasi menjadi peubah yang memiliki ragam sama yaitu satu.

• Pemilihan komponen utama didasarkan pada ragam komponen utama, yang tidak lain adalah akar ciri. Metode ini disarankan oleh Kaiser (1960) yang berargumen bahwa jika peubah asal saling bebas maka komponen utama tidak lain adalah peubah asal, dan setiap komponen utama akan memiliki ragam satu.

• Dengan cara ini, komponen yang berpadanan dengan akar ciri kurang dari satu tidak digunakan. Jollife (1972) setelah melakukan studi mengatakan bahwa cut off yang lebih baik adalah 0.7.

15

Penentuan Banyaknya KUMetode 3

• penggunaan grafik yang disebut plot scree. • Cara ini bisa digunakan ketika titik awalnya matriks korelasi

maupun ragam peragam. • Plot scree merupakan plot antara akar ciri k dengan k. • Dengan menggunakan metode ini, banyaknya komponen

utama yang dipilih, yaitu k, adalah jika pada titik k tersebut plotnya curam ke kiri tapi tidak curam di kanan. Ide yang ada di belakang metode ini adalah bahwa banyaknya komponen utama yang dipilih sedemikian rupa sehingga selisih antara akar ciri yang berurutan sudah tidak besar lagi. Interpretasi terhadap plot ini sangat subjektif.

16

Kegunaan Lain KU

• Plot skor KU dua dimensi sebagai alat awal diagnosis pada analisis gerombol

• KU yang saling bebas mengatasi masalah multikolinear dalam analisis regresi

18

Contoh Penerapan AKU

Berdasarkan SDKI 2002-2003 cakupan imunisasi lengkap anak usia 12-23 bulan di Indonesia berdasarkan informasi dari KMS (Kartu Menuju Sehat) atau laporan ibu sebesar 52 persen. Angka ini masih kecil bila dibandingkan dengan 80 persen angka cakupan imunisasi lengkap yang ditargetkan oleh UCI ( Universal Chilhood Imunization). Bila dilihat pada cakupan imunisasi lengkap pada tingkat propinsi hanya ada dua propinsi yang telah memenuhi target UCI yaitu Yogyakarta (84 persen) dan Bali (80 persen).

Oleh karena itu, ingin diketahui faktor dominan apakah yang mempengaruhi ketidaklengkapan imunisasi anak usia 12-23 bulan di Indonesia. Faktor dominan yang ingin diketahui pengaruhnya dibatasi pada karakteristik ibu dan ayahSehingga inti dalam kasus ini yaitu ingin melihat Faktor – Faktor yang Mempengaruhi ketidaklengkapan Imunisasi Anak Usia 12 – 23 Bulan di Indonesia Tahun 2003

Tampilan data di SPSS

• Karena data memiliki variasi yang besar (karena satuan dan rentang data yang berbeda-beda), maka distandardisasi terlebih dahulu dengan mentransformasikan ke dalam bentuk Z-score, yaitu dengan klik Descriptive Statistics→Descriptives →Options. Maka akan muncul tampilan berikut.

Maka akan muncul variabel baru seperti gambar berikut :

Tabel Correlation Matrix

Merupakan tabel matriks korelasi yang berisi nilai-nilai korelasi antara variabel-variabel yang akan dianalisis. Pada bagian Correlation dapat dilihat besarnya korelasi antar variabel.Kemudian pada baris sig.(1-tailed) menunjukkan signifikansi korelasi antara variabel-variabel tersebut. P value < 0,05 menandakan adanya hubungan nyata antar variabel

Total Variance Explained

Tabel Total Variance Explained menunjukkan besarnya persentase keragaman total yang mampu diterangkan oleh keragaman faktor - faktor yang terbentuk. Untuk menentukan berapa komponen/faktor yang dipakai agar dapat menjelaskan keragaman total maka dilihat dari besar nilai eigenvaluenya, komponen dengan eigenvalue >1 adalah komponen yang dipakai

Tabel Matrik Komponen

Tabel component matrix menunjukkan koefisien dalam pembentukan komponen utama atau vektor ciri dari matriks korelasi.

Berdasarkan tabel tersebut, diperoleh persamaan komponen utama:

37

TERIMA KASIH

top related