principal component analisys (pca) with primer 6.1.13
DESCRIPTION
Principal Component Analisys (PCA) With PRIMER 6.1.13TRANSCRIPT
-
Principal Component Analisys (PCA) With PRIMER 6.1.13
By : FAJAR RAHMAWAN
Email : [email protected]
Phone : +6281944880181
Refferance :
Bambang S. Soedibjo
(ANALISIS KOMPONEN UTAMA DALAM KAJIAN EKOLOGI)
RIMER-E Ltd
-
Principal Component Analisys | 1
A. Principal Component Analisys (PCA) :
Merupakan salah satu metode analisa multivariate yang salah satu pengaplikasiannya
dibidang ekologi dapat digunakan untuk melihat bagaimana struktur komunitas suatu ekosistem
dalam wilayah yang diteliti dan bagaimana hubungannya dengan faktor lingkungan.
B. Alasan mengapa menggunakan metode PCA :
Ada beberapa alasan yang saya gunakan mengapa memilih metode PCA, antara lain
adalah sebagai berikut:
1. dapat menghilangkan korelasi =0
2. dapat digunakan untuk semua kondisi data
3. dapat digunakan tanpa mengurangi jumlah variable asal
4. dari berbagai penelitian, yang telah dilakukan analisa menggunakan PCA, ternyata hasil
lebih akurat
5. PCA mampu mentransformasi variable lama menjadi variable baru
C. Diskripsi perhitungan metode PCA :
Misalnya :
Faktor lingkungan / species (X1, X2, X3, X4, X5, . Xn)
Perhitungan PCA menggunakan konsep Euclidian
Z1 = e11X1, e12X2, e13X3, e14X4, e15X5, . e1nXn)
Z2 = e21X1, e22X2, e23X3, e24X4, e25X5, . e2nXn)
Z3 = e31X1, e32X2, e33X3, e34X4, e35X5, . e3nXn)
Zp = ep1X1, ep2X2, ep3X3, ep4X4, ep5X5, . EpnXn)
Dapat ditulis notasi :
Var (Z1) Var (Z2) Var (Z3) Var (Z4) Var (Z5) .. Var (Zp)
Sifat Varian Z tidak memiliki korelasi dengan yang lainnya
.
.
.
.
.
.
.
.
Komponen utama Pertama
Komponen utama Ke-2
Komponen utama Ke-3
Komponen utama dst
Kumpulan data yang dipelajari
-
Principal Component Analisys | 2
D. Contoh perhitungan menggunakan PCA dan diskripsinya :
Contoh data kelimpahan species :
Tabel 1 :
Spesies Stasiun (sampel)
ST 1 ST 2 ST 3 ST 4 ST 5 ST 6 ST 7
Spesies A 2 3 3 5 2 5 6
Species B 20 15 14 15 10 11 2
Species C 1 6 3 0 3 1 0
Species D 2 2 1 1 1 1 4
Hasil 1 :
Gambar 1. Hasil Eigenvalues
Eigenvalues (i) : Merupakan varians dari komponen utama
Persentase variasi = i/p * 100%
% Variasi Komulatif : % variasi komulatif Z1 = persentase variasi Z1
% variasi komulatif Z2 = persentase variasi Z1 + persentase variasi Z2
% variasi komulatif Z3 = persentase variasi Z1 + persentase variasi Z2 + persentase variasi Z3
% variasi komulatif Z3 = persentase variasi Z1 + persentase variasi Z2 + persentase variasi Z3 + persentase variasi Z4
Next Step :
Eigenvector (koeefisien komponen utama)
Gambar 2. Hasil Eigenvectors
Z1 - Z5 = Hasil Species A, B, C dan D (Lihat data diatas yang )
dan didapatkan kombinasi linier seperti dibawah ini : Z1 = 0.188 Species A 0.968 Species B 0.121 Species C + 0.112 Species D
Z2 = -0.354 Species A 0.186 Species B + 0.917 Species C - 0.018 Species D
Z3 = 0.885 Species A + 0.151 Species B + 0.377 Species C + 0.227 Species D
Z4 = -0.237 Species A + 0.073 Species B - 0.057 Species C + 0.967 Species D
Hasil tabel dicari terbesar dari +0-
Artinya adalah nilai terbesar tersebut berkontribusi tinggi dari kelimpahan komponen
utama (species) atau adanya dominan komponen ini.
Dim
ensi
Dihasilkan 4 komponen utama
-
Principal Component Analisys | 3
Next Step :
Perhitungan Score :
Berdasarkan kombinasi linier yang terbentuk di atas, maka dapat dihitung skor
dari masing-masing komponen utama dengan memasukkan nilai-nilai kelimpahan
masing masing spesies ke dalam persamaan tersebut, sehingga diperoleh SCORE
berikut pada Gambar 3 :
Gambar 3. Principal Component Scores
Next Step :
Plot Grafik :
Skor-skor di atas merupakan titik koordinat ordinasi untuk diplot dalam sumbu
komponen yang diinginkan. Dicontohkan ordinasi sampel dengan menggunakan sumbu
Z1 dan Z2 :
Gambar 4. Hasil plot ordinasi Z1 dan Z2
NB : jika ada 1 titik semakin jauh dari kelompok titik titik yang berkumpul maka
harus ada kajian yang mendalam
-
Principal Component Analisys | 4
Next Step (Conditional) :
Normalisasi data :
Normalisasi adalah mengurangi nilai kelimpahan dari setiap baris dengan rata
rata kelimpahan dari baris tersebut dibagi dengan simpangan bakunya (STDEV).
Normalisasi data menyebabkan varians sampel sepanjang sumbu spesies akan sama
yaitu 1. Ini berarti seluruh spesies memiliki nilai penting yang sama dalam menentukan
komponen utama. Namun demikian, tidak semua data perlu dinormalisasikan,
khususnya jika transformasi pada grafik PCA sudah memberikan gambaran yang
seimbang atas kelimpahan spesies diantara sampel. PCA yang didasarkan pada data
yang sudah dinormalisasi, disebut PCA berbasis korelasi. Sebaliknya, PCA yang datanya
tidak dinormalisasi disebut PCA berbasis kovarians. Untuk melakukan normalisasi
diperlukan data yang disajikan pada Tabel 2 berikut ini.
Tabel 2. Data kelimpahan species yang akan di Normalisasi
Spesies Stasiun (sampel)
Total Rata2 STDEV ST 1 ST 2 ST 3 ST 4 ST 5 ST 6 ST 7
Spesies A 2 3 3 5 2 5 6 26 3.71 1.6
Species B 20 15 14 15 10 11 2 87 12.43 5.6
Species C 1 6 3 0 3 1 0 14 2.00 2.2
Species D 2 2 1 1 1 1 4 12 1.71 1.1
Rumus Normalisasi
Normalisasi (tiap spesies dari seluruh sampel) dilakukan dengan menggunakan rumus
berikut :
Normalisasi Species x (Yx) =
Contoh 1 :
Normalisasi pada Species C ST 6 =
= -0.46
Contoh 2 :
Normalisasi pada Species D ST 7 =
= 2.08
-
Principal Component Analisys | 5
Selain transformasi data dan normalisasi data, hal lain yang penting diperhatikan sebelum PCA
dilakukan adalah mereduksi spesies-spesies yang jumlahnya sangat sedikit (langka). Misalnya
saja, dari 20 sampel yang diambil, Spesies A hanya muncul 1 individu dalam sedikit sampel.
Reduksi spesies ini sebaiknya dilakukan sebelum transformasi dan normalisasi dilakukan.
Menghilangkan spesies seperti ini akan banyak berpengaruh terhadap hasil ordinasi. Apalagi jika
jumlah spesies yang tercatat sangat banyak tetapi kelimpahannya sedikit. Hasil pembahasan di
atas mungkin timbul pertanyaan kapankah kita melakukan transformasi dan normalisasi atau
keduanya? Transformasi dalam data biotik umumnya tetap perlu ditransformasikan untuk
menghindari distribusi data yang miring ke kanan (yang umum dijumpai untuk data kelimpahan).
Normalisasi tidak selamanya perlu dilakukan. Normalisasi dalam PCA dilakukan apabila variabel-
variabel yang diamati memiliki unit pengukuran yang berbeda antara lain data lingkungan.
Contohnya suhu, salinitas, kimia hara, adalah variabel - variabel lingkungan yang memiliki satuan
pengukuran yang berbeda.
E. Penggunaan SOFTWARE PRIMER 6 Untuk melakukan analisa PCA :
Salah satu perangkat lunak yang banyak digunakan dalam analisis komunitas laut adalah
PRIMER yang dikembangkan oleh Plymouth Laboratory, Inggris
Contoh file dapat dilihat seperti Tabel 1 diketik pada MS Excel dimulai pada A1 :
1. Langkah
a. Buka Primer 6 File Open pilih yang Excel Files pilih contoh file nya
pilih dimana letak anda ketikkan data pada Excel worksheet nya Next Finish
-
Principal Component Analisys | 6
b. Setelah dibuka dapat dilihat seperti gambar dibawah ini :
c. Pilih Analyse PCA Maximum no of PCs ketikkan 4 (karna menghasilkan 4
komponen utama) OK
d. Maka akan dihasilkan :