principal component analisys (pca) with primer 6.1.13

Upload: fajar-rahmawan

Post on 28-Oct-2015

192 views

Category:

Documents


1 download

DESCRIPTION

Principal Component Analisys (PCA) With PRIMER 6.1.13

TRANSCRIPT

  • Principal Component Analisys (PCA) With PRIMER 6.1.13

    By : FAJAR RAHMAWAN

    Email : [email protected]

    Phone : +6281944880181

    Refferance :

    Bambang S. Soedibjo

    (ANALISIS KOMPONEN UTAMA DALAM KAJIAN EKOLOGI)

    RIMER-E Ltd

  • Principal Component Analisys | 1

    A. Principal Component Analisys (PCA) :

    Merupakan salah satu metode analisa multivariate yang salah satu pengaplikasiannya

    dibidang ekologi dapat digunakan untuk melihat bagaimana struktur komunitas suatu ekosistem

    dalam wilayah yang diteliti dan bagaimana hubungannya dengan faktor lingkungan.

    B. Alasan mengapa menggunakan metode PCA :

    Ada beberapa alasan yang saya gunakan mengapa memilih metode PCA, antara lain

    adalah sebagai berikut:

    1. dapat menghilangkan korelasi =0

    2. dapat digunakan untuk semua kondisi data

    3. dapat digunakan tanpa mengurangi jumlah variable asal

    4. dari berbagai penelitian, yang telah dilakukan analisa menggunakan PCA, ternyata hasil

    lebih akurat

    5. PCA mampu mentransformasi variable lama menjadi variable baru

    C. Diskripsi perhitungan metode PCA :

    Misalnya :

    Faktor lingkungan / species (X1, X2, X3, X4, X5, . Xn)

    Perhitungan PCA menggunakan konsep Euclidian

    Z1 = e11X1, e12X2, e13X3, e14X4, e15X5, . e1nXn)

    Z2 = e21X1, e22X2, e23X3, e24X4, e25X5, . e2nXn)

    Z3 = e31X1, e32X2, e33X3, e34X4, e35X5, . e3nXn)

    Zp = ep1X1, ep2X2, ep3X3, ep4X4, ep5X5, . EpnXn)

    Dapat ditulis notasi :

    Var (Z1) Var (Z2) Var (Z3) Var (Z4) Var (Z5) .. Var (Zp)

    Sifat Varian Z tidak memiliki korelasi dengan yang lainnya

    .

    .

    .

    .

    .

    .

    .

    .

    Komponen utama Pertama

    Komponen utama Ke-2

    Komponen utama Ke-3

    Komponen utama dst

    Kumpulan data yang dipelajari

  • Principal Component Analisys | 2

    D. Contoh perhitungan menggunakan PCA dan diskripsinya :

    Contoh data kelimpahan species :

    Tabel 1 :

    Spesies Stasiun (sampel)

    ST 1 ST 2 ST 3 ST 4 ST 5 ST 6 ST 7

    Spesies A 2 3 3 5 2 5 6

    Species B 20 15 14 15 10 11 2

    Species C 1 6 3 0 3 1 0

    Species D 2 2 1 1 1 1 4

    Hasil 1 :

    Gambar 1. Hasil Eigenvalues

    Eigenvalues (i) : Merupakan varians dari komponen utama

    Persentase variasi = i/p * 100%

    % Variasi Komulatif : % variasi komulatif Z1 = persentase variasi Z1

    % variasi komulatif Z2 = persentase variasi Z1 + persentase variasi Z2

    % variasi komulatif Z3 = persentase variasi Z1 + persentase variasi Z2 + persentase variasi Z3

    % variasi komulatif Z3 = persentase variasi Z1 + persentase variasi Z2 + persentase variasi Z3 + persentase variasi Z4

    Next Step :

    Eigenvector (koeefisien komponen utama)

    Gambar 2. Hasil Eigenvectors

    Z1 - Z5 = Hasil Species A, B, C dan D (Lihat data diatas yang )

    dan didapatkan kombinasi linier seperti dibawah ini : Z1 = 0.188 Species A 0.968 Species B 0.121 Species C + 0.112 Species D

    Z2 = -0.354 Species A 0.186 Species B + 0.917 Species C - 0.018 Species D

    Z3 = 0.885 Species A + 0.151 Species B + 0.377 Species C + 0.227 Species D

    Z4 = -0.237 Species A + 0.073 Species B - 0.057 Species C + 0.967 Species D

    Hasil tabel dicari terbesar dari +0-

    Artinya adalah nilai terbesar tersebut berkontribusi tinggi dari kelimpahan komponen

    utama (species) atau adanya dominan komponen ini.

    Dim

    ensi

    Dihasilkan 4 komponen utama

  • Principal Component Analisys | 3

    Next Step :

    Perhitungan Score :

    Berdasarkan kombinasi linier yang terbentuk di atas, maka dapat dihitung skor

    dari masing-masing komponen utama dengan memasukkan nilai-nilai kelimpahan

    masing masing spesies ke dalam persamaan tersebut, sehingga diperoleh SCORE

    berikut pada Gambar 3 :

    Gambar 3. Principal Component Scores

    Next Step :

    Plot Grafik :

    Skor-skor di atas merupakan titik koordinat ordinasi untuk diplot dalam sumbu

    komponen yang diinginkan. Dicontohkan ordinasi sampel dengan menggunakan sumbu

    Z1 dan Z2 :

    Gambar 4. Hasil plot ordinasi Z1 dan Z2

    NB : jika ada 1 titik semakin jauh dari kelompok titik titik yang berkumpul maka

    harus ada kajian yang mendalam

  • Principal Component Analisys | 4

    Next Step (Conditional) :

    Normalisasi data :

    Normalisasi adalah mengurangi nilai kelimpahan dari setiap baris dengan rata

    rata kelimpahan dari baris tersebut dibagi dengan simpangan bakunya (STDEV).

    Normalisasi data menyebabkan varians sampel sepanjang sumbu spesies akan sama

    yaitu 1. Ini berarti seluruh spesies memiliki nilai penting yang sama dalam menentukan

    komponen utama. Namun demikian, tidak semua data perlu dinormalisasikan,

    khususnya jika transformasi pada grafik PCA sudah memberikan gambaran yang

    seimbang atas kelimpahan spesies diantara sampel. PCA yang didasarkan pada data

    yang sudah dinormalisasi, disebut PCA berbasis korelasi. Sebaliknya, PCA yang datanya

    tidak dinormalisasi disebut PCA berbasis kovarians. Untuk melakukan normalisasi

    diperlukan data yang disajikan pada Tabel 2 berikut ini.

    Tabel 2. Data kelimpahan species yang akan di Normalisasi

    Spesies Stasiun (sampel)

    Total Rata2 STDEV ST 1 ST 2 ST 3 ST 4 ST 5 ST 6 ST 7

    Spesies A 2 3 3 5 2 5 6 26 3.71 1.6

    Species B 20 15 14 15 10 11 2 87 12.43 5.6

    Species C 1 6 3 0 3 1 0 14 2.00 2.2

    Species D 2 2 1 1 1 1 4 12 1.71 1.1

    Rumus Normalisasi

    Normalisasi (tiap spesies dari seluruh sampel) dilakukan dengan menggunakan rumus

    berikut :

    Normalisasi Species x (Yx) =

    Contoh 1 :

    Normalisasi pada Species C ST 6 =

    = -0.46

    Contoh 2 :

    Normalisasi pada Species D ST 7 =

    = 2.08

  • Principal Component Analisys | 5

    Selain transformasi data dan normalisasi data, hal lain yang penting diperhatikan sebelum PCA

    dilakukan adalah mereduksi spesies-spesies yang jumlahnya sangat sedikit (langka). Misalnya

    saja, dari 20 sampel yang diambil, Spesies A hanya muncul 1 individu dalam sedikit sampel.

    Reduksi spesies ini sebaiknya dilakukan sebelum transformasi dan normalisasi dilakukan.

    Menghilangkan spesies seperti ini akan banyak berpengaruh terhadap hasil ordinasi. Apalagi jika

    jumlah spesies yang tercatat sangat banyak tetapi kelimpahannya sedikit. Hasil pembahasan di

    atas mungkin timbul pertanyaan kapankah kita melakukan transformasi dan normalisasi atau

    keduanya? Transformasi dalam data biotik umumnya tetap perlu ditransformasikan untuk

    menghindari distribusi data yang miring ke kanan (yang umum dijumpai untuk data kelimpahan).

    Normalisasi tidak selamanya perlu dilakukan. Normalisasi dalam PCA dilakukan apabila variabel-

    variabel yang diamati memiliki unit pengukuran yang berbeda antara lain data lingkungan.

    Contohnya suhu, salinitas, kimia hara, adalah variabel - variabel lingkungan yang memiliki satuan

    pengukuran yang berbeda.

    E. Penggunaan SOFTWARE PRIMER 6 Untuk melakukan analisa PCA :

    Salah satu perangkat lunak yang banyak digunakan dalam analisis komunitas laut adalah

    PRIMER yang dikembangkan oleh Plymouth Laboratory, Inggris

    Contoh file dapat dilihat seperti Tabel 1 diketik pada MS Excel dimulai pada A1 :

    1. Langkah

    a. Buka Primer 6 File Open pilih yang Excel Files pilih contoh file nya

    pilih dimana letak anda ketikkan data pada Excel worksheet nya Next Finish

  • Principal Component Analisys | 6

    b. Setelah dibuka dapat dilihat seperti gambar dibawah ini :

    c. Pilih Analyse PCA Maximum no of PCs ketikkan 4 (karna menghasilkan 4

    komponen utama) OK

    d. Maka akan dihasilkan :