analisis diskriminan dan klasifikasi

Upload: ogijayaprana

Post on 03-Apr-2018

241 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    1/71

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    2/71

    Analisis Diskriminan danKlasifikasi

    1.Ayu Indri Astuti2.Yayan suyanto3.Yulli Anggraeni

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    3/71

    PemisahanPengalokasian

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    4/71

    Pemisahan dan Klasifikasi untuk 2Populasi

    Pemisahan dan Klasifikasi untuklebih dari 2 Populasi

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    5/71

    Pemisahan dan Klasifikasi untuk 2Populasi

    1 2

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    6/71

    ContohNo. Populasi dan Variabel X yang diukur

    1. Kesanggupan dan kesulitan

    membayar pertanggung

    jawaban properti perusahaan

    asuransi

    Total aset, biaya saham dan

    obligasi, nilai pasar dari saham

    dan obligasi, kerugian,

    kelebihan, jumlah hadiah yangtertulis

    2. Nonulcer dyspeptics (orang

    yang bermasalah dengan

    penyakit perut) dan normal

    Pengukuran dari kecemasan,

    ketergantungan, kesalahan dan

    kesempurnaan

    3. Keberhasilan atau kegagalanmahasiswa Skor ujian masuk, nilai rata-ratakenaikan kelas SMA,

    banyaknya kegiatan di SMA

    4. Pembeli produk baru dan

    laggard (orang yang selalu

    datang terlambat)

    Pendidikan, pendapatan, besar

    keluarga, banyaknya

    pergantian merek

    1 2

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    7/71

    1

    R1

    2

    R2

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    8/71

    Pengetahuan yang tidaklengkap dari kinerja yang akan

    datang Informasi sempurna yangmemerlukan penghancuran

    objek Tidak tersedia atau mahalnyainformasi

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    9/71

    Peluang kondisional,

    21 = 21) = 1

    2=

    1

    12 = 12) = 21

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    10/71

    Populasi

    sebenrnya

    0

    0C(1|2)

    C(2|1)

    Matriks Cost (biaya)

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    11/71

    ECM : expexted cost of

    misclassification

    =

    2

    1

    2

    1

    1+

    1

    2

    (1|2)

    2

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    12/71

    Daerah dan yang meminimasi ECM didefinisikan

    oleh nilai x sehingga pertidaksamaan di bawah inidipenuhi .

    1

    2

    1

    1()

    2(

    )

    (1|2)

    (2|1)

    2

    1

    2 1()2() < (1|2)(2|1) 21 <

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    13/71

    2/1 = 1 ( peluang prior yang sama)1 1()2()

    (1|2)(2|1) ; 2

    1()2() <

    (1|2)(2|1)

    c(1|2)/c(2|1) = 1 (biaya-biaya misklasifikasi yang sama)

    1 1()2() p2p1 ; 2 1()2() < 212/1 = 12/(2|1)= 1 atau 2/1 = 1/(c(1|2)/c(2|1)) (peluang prioryang sama dan biaya-biaya misklasifikasi yang sama)

    1 1(

    )

    2() 1 ; 2 1(

    )

    2() < 1

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    14/71

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    15/71

    Maka objek baru tersebutkita klasifikasikan kedalam 1

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    16/71

    total probabil i ty of misclassif ication (TPM)

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    17/71

    10 = (1 0)0 10 = 01)(1)01(1) + 022

    = 110110+220

    20 = 1 10 = 220110+220

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    18/71

    Layak

    Sederhana

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    19/71

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    20/71

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    21/71

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    22/71

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    23/71

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    24/71

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    25/71

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    26/71

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    27/71

    Mengevaluasi Fungsi Klasifikasi

    cara menilai hasil dari sebarang prosedur Jika bentuk dari populasi induk diketahui

    dapat dihitung dengan relatif (contoh 11.4)

    Untuk populasi induknya tidak diketahui,

    Dari (11-8) TPM = 1 1 2 221 ...(11-28)Adapun nilai terkecil dari jumlah ini disebut nilai error optimum (OER)

    OER = 1 1 2 221 ... (11-26)Dimana 12 ditentukan oleh kasus khusus (b) dalam (11-7)Oleh karena itu, OER adalah nilai error untuk kaidah klasifikasi TPM minimum.

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    28/71

    Contoh 11.4

    Misalkan diberikan sebuah pernyataan untuk nilai error optimum ketika 1 = 2 = 12dan12() merupakan fungsi densitas normal multivariat dalam (11-10).Sekarang, aturan klasifikasi ECM minimum dan TPM minimum tepat sama ketika

    12 = 21. Karena probabilitas priornya juga sama, daerah klasifikasi TPMminimum didefinisikan untuk populasi normal oleh (11-12), dengan 1221 21 = 0. Kitadapatkan

    1 1 2 1 121 2 1 + 21 0

    1 1 2 1 121 2 1 + 21 < 0

    Himpunan ini dapat dinyatakan dalam hubungan = 1 2 1 = sebagai

    1

    1

    2 1

    2

    (

    1

    1+

    2 )

    1 < 121 2 (11 + 2 )

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    29/71

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    30/71

    P21 = P < 12 1 2 1 + 21 = P1 untuk semua (11-40)atau, ekivalen dengan

    Alokasikan x pada

    jika

    ln > ln untuk semua (11-41)

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    46/71

    Dengan syarat klasifikasi ECM minimum diatas, karena identik

    dengan memaksimumkan probabilitas posterior,

    , dimana

    (11-42) 1,2, ,

    Persamaan diatas adalah bentuk umum untuk 2 grup.Secara umum, aturan ECM minimum memiliki 3 komponen;probabilitas prior, nilai misklasifikasi dan fungsi kepadatan.

    Ketiga komponen tersebut harus sudah diketahui atau sudah

    diestimasi, sebelum menggunakan aturan tersebut.

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    47/71

    Klasifikasi dengan Populasi Normal

    Kasus khusus terjadi jika

    exp , 1 , 2 , , (11-43)

    Persamaan tersebut adalah fungsi kepadatan berdistribusi normal

    multivariate dengan vector mean

    dan matriks kovarian

    . Untuk

    selanjutnya c(i|i)=0, c(k|i)=1, maka:

    Alokasikan x ke jikaln ln

    2

    ln 2 1

    2

    ln 1

    2

    max ln (11-44)

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    48/71

    Selanjutnya, kita definisikan nilai diskriminan kuadratik untuk

    populasi ke-i menjadi

    12 ln

    12

    + l n , 1 , 2 , , . (11-45) adalah nilai kuadratik yang terdiri dari kontribusi darivariansi umum , probabilitas prior , dan jarak kuadrat darix ke populasi mean .

    b bili l i i d i i kl ifik i k

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    49/71

    Probabilitas Total Minimum dari Aturan Misklasifikasi untuk

    Populasi Normal-.

    Alokasikan x ke jikaNilai kuadratik , , , ,dimana untuk persamaan yang telah disebutkan diatas,untuk i=1, 2,, g.

    Aturan Estimasi TPM Minimum untuk Beberapa Populasi

    normal-BerbedaAlokasikan x ke jikaNilai

    ,

    , ,

    dimana diberikan pada estimasi diatas, i=1,2,..,g.

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    50/71

    Penyederhanaan bisa dilakukan jika matriks kovarian populasi sama. Ketika , untuk i=1,2,,g, nilai diskriminan persamaan kuadratik akan menjadi

    12 ln i

    12 x

    x + ix 12 i

    i + l n piDua bentuk pertama sama dengan , , , sehingga

    dapat diabaikan untuk tujuan pengalokasian. Bentuk lainnya terdiri dari

    konstanta l n ii dan kombinasi linear dari komponen x.Definisi nilai diskriminan linier:

    ix 12 ii + l n Estimasi , dari nilai diskriminan linier sesuai dengan estimasigabungan ,

    1 + 1 + + 1

    + + +

    Dan diberikan oleh

    12

    + l n

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    51/71

    Aturan Estimasi TPM Minimum untuk Populasi Normal

    dengan Kovarian Sama

    Alokasi nilai x ke jikaNilaidiskriminan linier , , , dimana adalah diskriminan linier dengan , i= 1,2,...,g.

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    52/71

    Nilai diskriminan linier adalah fungsi linier dari x yang sesuai. Sama seperti

    untuk kasus kovarian sama yang didapat dari nilai diskriminan kuadrat untuk

    populasi ke-I dengan mengabaikan konstanta ln. Hasilnya, estimasisampel yang dimasukkan untuk kuantitas populasi yang tidak diketahui,selanjutnya dapat diinterpretasikan dalam bentuk kuadrat jarak

    Dari x ke vector mean sampel . Aturan penempatannya sebagai berikut:1. Masukkan x ke populasi dimana

    + ln memiliki nilai

    terbesar.2. Lihat aturan tersebut atau yang persamaan yang ekivalennya, lalu

    masukkan x ke populasi terdekat. (ukuran jarak dinyatakan oleh ln )3. Jika probabilitas priornya tidak diketahui, prosedur yang berguna adalah

    dengan menentukan

    .

    Observasi selanjutnya dimasukkan ke populasi yang terdekat.

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    53/71

    ContohHitung nilai diskriminan linier yang berasal dari data degan g = 3,

    populasi diasumsikan sebagai nomor bivariat dengan matrik kovarian

    biasa.Sampel acak dari populasi , , disebutkan , beserta meansampel dan matrik kovariannya.

    Metode Fisher untuk Pendiskriminasian diantara

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    54/71

    Metode Fisher untuk Pendiskriminasian diantara

    Beberapa Populasi

    matriks kovarian populasi adalah sama, yaitu g .Misal = vector rata-rata dari kombinasi populasi=jumlah dari cross-products diantara grup.Maka

    =

    dengan

    =

    Lalu perhatikan kombinasi linear yang mempunyai nilaiekspektasi untuk populasi , dan variansi untuk semuapopulasi. Akibatnya, nilai ekspektasi

    berubah

    sebagaimana populasi yang berasal dari X yang dipilih berubah.

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    55/71

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    56/71

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    57/71

    kiuntuk

    xxxxyyr

    j

    r

    j

    r

    j

    ijkjkjj

    )(')(')(

    jikapadaxAlokasikan

    1 1 1

    222

    k

    Prosedur Klasifikasi Fisher

    Berdasarkan Diskriminan Sampel

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    58/71

    P P ilih V i b l

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    59/71

    Proses Pemilihan Variabel

    Tests of Equality of Group MeansWilks'

    Lambda F df1 df2 Sig.Usia ,945 4,247 1 73 ,043

    Berat ,934 5,173 1 73 ,026Tinggi ,946 4,186 1 73 ,044Olahraga ,894 8,656 1 73 ,004

    Bekerja ,968 2,432 1 73 ,123

    Income ,951 3,779 1 73 ,056

    Tabel 3.2 Tabel Tests of Equality of Group Means

    1. Wilks Lambda

    Angka Wilks Lambda berkisar 0 sampai 1. Jika angka mendekati 0, maka data

    tiap grup cenderung berbeda, sedangkan jika angka mendekati 1, data tiap grup

    cenderung sama.

    P P ilih V i b l

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    60/71

    Proses Pemilihan Variabel

    2. Uji Signifikansi (F test)

    Uji F dilakukan untuk menguji hipotesis berikut:

    Ho : group means dari masing-masing kelompok adalah relatif sama

    H1 : group means dari masing-masing kelompok memilik perbedaan secara

    nyata.

    Jika Sig < 0,05, maka Ho ditolak, yang berarti ada perbedaan antar grup. Jika

    Sig > 0,05, maka Ho diterima yang berarti group means masing-masingkelompok relatif sama. Hal ini menunjukkan bahwa tidak ada perbedaan

    antar grup.

    Proses Pemilihan Variabel

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    61/71

    Proses Pemilihan Variabel

    Analisis Diskriminan mempunyai asumsi bahwa :

    Variansi variabel bebas untuk setiap grup seharusnya sama.

    Variansi diantara variabel-variabel bebas seharusnya juga sama.

    Kedua pengertian diatas dapat disimpulkan bahwa group covariance

    matrices adalah relatif sama.

    Untuk itu, perlu dilakukan pengujian hipotesis sebagai berikut :

    Ho : group covariance matrices adalah relatif samaH1 : group covariance matrices adalah berbeda secara nyata

    Adapun penilaian signifikansi dari pengujian hipotesis diatas sebagai

    berikut:

    Jika Sig < 0,05, maka Ho ditolak.Jika Sig > 0,05, maka Ho diterima.

    Proses Pemilihan Variabel

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    62/71

    Proses Pemilihan Variabel

    Dari tampilan tabel test resultoutput,

    Test Results

    Box's M 33,189

    F Approx. 1,441

    df1 21

    df2 19569,371

    Sig. ,087

    Tests null hypothesis of equal population covariance matrices.

    Dalam kasus ini memiliki nilai sig. 0,087 > 0,05 maka Ho diterima ini artinya bahwa

    data telah memenuhi asumsi analisis diskriminan. Sehingga proses dapat

    dilanjutkan.

    Proses Diskriminan

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    63/71

    Proses Diskriminan

    Variables Entered/Removeda,b,c,dStep

    Entered

    Min. D Squared

    Statistic BetweenGroups

    Exact F

    Statistic df1 df2 Sig.1 Olahraga ,462 sedikit and

    banyak8,656 1 73,000 ,004

    2 Berat ,776 sedikit andbanyak

    7,170 2 72,000 ,001

    3 Tinggi 1,208 sedikit andbanyak

    7,343 3 71,000 ,000

    At each step, the variable that maximizes the Mahalanobis distance between the twoclosest groups is entered.a. Maximum number of steps is 12.b. Maximum significance of F to enter is .05.c. Minimum significance of F to remove is .10.d. F level, tolerance, or VIN insufficient for further computation.

    Tabel diatas menunjukan variabel mana saja, dari keseluruhan variabel

    yang dimiliki, yang dapat dimasukan dalam model diskriminan.

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    64/71

    Proses Diskriminan

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    65/71

    Proses Diskriminan

    Perhatikan kolom Canonical Correlation. Hal tersebut untuk mengukur

    keeratan hubungan antara discriminant scores dengan grup. Pada kasus ini

    dapat dikatakan bahwa keeratan hubungan antara diskriminan skor dengan

    grup sebesar 48,7 %.

    a. First 1 canonical discriminant functions

    were used in the analysis.

    Function

    Eigenvalue% of

    VarianceCumulative

    %Canonical

    Correlation

    1,310a 100,0 100,0 ,487

    Eigenvalues

    Proses Diskriminan

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    66/71

    Proses Diskriminan

    Structure Matrix

    Function

    1Olahraga ,618

    usiaa ,521

    Berat ,478

    Tinggi -,430

    incomea ,266

    bekerjaa ,139

    Tabel diatas menunjukan korelasi antara

    variabel independen dengan fungsi

    diskriminan yang terbentuk. Variabel yangtidak dimasukan dalam analisis

    diskriminan adalah variabel dengan nilai

    korelasi rendah dan diberikan simbol a

    disebelah masing-masing variabel

    tersebut.

    Proses Diskriminan

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    67/71

    Proses Diskriminan

    Dari tabel diatas diperoleh gambaran model diskriminan yang

    terbentuk. Model diskriminannya sebagai berikut :

    Minum (D) = 7,884 + 0,064 berat ( - 0,093 tinggi ( + 0,006olahraga (

    Canonical DiscriminantFunction Coefficients

    Function

    1Berat ,064

    Tinggi -,093

    Olahraga ,006

    (Constant) 7,884

    Unstandardized coefficients

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    68/71

    Prior Probabilities for Groups Classification Function Coefficients

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    69/71

    Prior Probabilities for Groups

    Minum

    Prior

    Cases Used inAnalysis

    Unweight

    ed

    Weighte

    dSedikit ,500 38 38,000

    Banyak ,500 37 37,000

    Total 1,000 75 75,000

    Tabel 3.10 TabelPrior Probabilities for Groups

    Classification Function Coefficients

    Minum

    sedikit banyak

    berat ,035 -,035

    tinggi 3,587 3,690

    olahraga ,036 ,030

    (Constant) -297,882 -306,557

    Fisher's linear discriminant functions

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    70/71

  • 7/28/2019 Analisis Diskriminan Dan Klasifikasi

    71/71