pertemuan 6 pca-based speech recognition

26
Ekstraksi Ciri Ucapan Menggunakan Analisis Komponen Utama (Principal Components Analysis - PCA) Dr. R. Rizal Isnanto, S.T., M.M., M.T. Program Studi Sistem Komputer Universitas Diponegoro Semarang, Indonesia Matakuliah Speech Recognition (Pertemuan ke-6 dan ke-7)

Upload: tri-prasetyo

Post on 14-Nov-2015

234 views

Category:

Documents


1 download

DESCRIPTION

speech recognition

TRANSCRIPT

  • Ekstraksi Ciri Ucapan Menggunakan

    Analisis Komponen Utama

    (Principal Components Analysis - PCA)

    Dr. R. Rizal Isnanto, S.T., M.M., M.T.

    Program Studi Sistem Komputer

    Universitas Diponegoro

    Semarang, Indonesia

    Matakuliah Speech Recognition

    (Pertemuan ke-6 dan ke-7)

  • Pendahuluan

    Pada proses pengenalan ucapan, langkah yang dilakukan

    setelah pengambilan data atau sampel ucapan adalah

    EKSTRAKSI CIRI.

    Ekstraksi ciri bertujuan mengambil ciri-ciri utama dari data

    dengan mengambil informasi yang dominan dan membuang

    informasi lain. Ciri bersifat unik, seringkali hanya memiliki

    sejumlah kecil nilai, namun mewakili satu entitas yang besar.

    Dengan ekstraksi ciri, maka pengenalan, pembandingan,

    ataupun analisis dilakukan pada sejumlah nilai terbatas, misal

    vektor yang terdiri atas beberapa nilai, bukan pada

    keseluruhan nilai pada data.

    Dengan ekstraksi ciri diharapkan proses pengenalan dapat

    dilakukan dengan lebih cepat.

    9-2

    2

  • Contoh makalah

    9-3

    3

  • Background Mathematics

    9-4

    4Statistika

    1. Rerata (mean)

  • 2. Simpangan Baku

    (Standard Deviation)

    9-5

    5

  • 3. Varians

    9-6

    6

  • 4. Kovarians (covariance) (1)

    9-7

    7

  • Kovarians (covariance) (2)

    9-8

    8

  • Kovarians (covariance) (3)

    9-9

    9

  • 5. Matriks Kovarians (1)

    9-10

    10

  • Matriks Kovarians (2)

    9-11

    11

  • PR (2)

    9-12

    12

  • 6. Aljabar Matriks

    9-13

    13

  • Eigenvector dan Eigenvalues (1)

    9-14

    14

  • Eigenvector dan Eigenvalues (2)

    9-15

    15

  • Eigenvector dan Eigenvalues (2)

    9-16

    16

  • 9-17

    17

  • PenutupMinggu depan: baru PCA-nya!!

    Demikian paparan saya

    sampaikan

    Terima kasih

    Pa

    ge18

    2015 R. Rizal Isnanto, All rights reserved.

  • PCA (Pertemuan ke-7)

    Pada pengolahan sinyal ucapan, satu gelombang

    ucapan dibagi menjadi blok-blok berukuran sama.

    Blok 1 dimensi (vektor) dibuat sebagai matriks

    bujursangkar (n x n)

    Setiap blok dicari nilai-nilai eigen-nya (ada n nilai eigen)

    Setelah semua blok dicari nilai-nilai eigen-nya, maka

    semua nilai eigen tersebut diurutkan dari yang terbesar

    sampai yang terkecil (l1, l2, l3, l4, dst.)

    Nilai-nilai eigen itulah yang disebut sebagai komponen-

    komponen utama (principal components)

    9-19

  • Lanjutan PCA (2)

    Setelah itu, diambil beberapa komponen utama

    terbesar, misalnya 75 terbesar, 50 terbesar, atau 10

    terbesar.

    Komponen-komponen utama tersebut dimasukkan ke

    dalam vektor ciri.

    Vektor ciri dari sinyal ucapan uji dibandingkan dengan

    vektor ciri dari sinyal ucapan data latih menggunakan

    model similarity measures, misalnya Jarak Euclidean,

    Jarak Minkowski dan sebagainya.

    9-20

  • Lanjutan PCA (3)

    Jarak yang paling kecil (minimum) terhadap satu vektor

    ciri data latih menunjukkan bahwa data uji dikenali

    sebagai paling dekat kemiripannya dengan data latih

    tersebut, atau dikenali sebagai data latih tersebut

    Untuk implementasi, sering digunakan nilai ambang

    (threshold) untuk menentukan suatu data uji bisa

    dikenali atau tidak bisa dikenali. Jika jarak > nilai

    ambang, maka akan diperoleh keluaran TIDAK DIKENALI.

    Jika jarak

  • Efisiensi komputasi dengan PCA

    Misal dari seluruh komponen utamanya diambil 25%

    terbesarnya

    Dari n x n ciri (atau dalam sinyal ucapan adalah n2 ciri

    dalam baris yang sama) akan diperoleh n komponen

    utama

    Maka jumlah ciri uji yang harus dicocokkan dengan ciri

    pada data latih = 0,25n.

    Sehingga efisiensi komputasi = 1 [(0,25n) / n2]

    = 1 [0,25 / n]

    = {1 [1/(4n)]} x 100%9-22

  • Penutup

    Ada pertanyaan?

    Kita lanjutkan dengan Everything about UTS

    9-23

  • Everything about UTS (1)

    Buka ringkasan 1 lbr double folio asli (tulis tangan)

    Tutup buku, laptop, HP, dan sejenisnya

    Boleh buka kalkulator

    Waktu: 90 menit

    9-24

  • Everything about UTS (2)

    Materi yang harus dipersiapkan:

    1. Konversi analog ke digital

    2. Speaker Recognition vs Speech Recognition

    3. Teknologi Text-To-Speech (TTS) dan Speech-To-Text

    (STT)

    4. Similarity measures: Jarak Euclidean, Minkowski, dsb.

    5. PCA: mean, varians, kovarians, nilai dan vektor eigen.

    6. Sistem Biometrika: iris, sidik-jari, dsb., selain suara

    9-25

  • Selamat Belajar

    Semoga sukses

    9-26