pertemuan 6 pca-based speech recognition
Post on 14-Nov-2015
234 Views
Preview:
DESCRIPTION
TRANSCRIPT
-
Ekstraksi Ciri Ucapan Menggunakan
Analisis Komponen Utama
(Principal Components Analysis - PCA)
Dr. R. Rizal Isnanto, S.T., M.M., M.T.
Program Studi Sistem Komputer
Universitas Diponegoro
Semarang, Indonesia
Matakuliah Speech Recognition
(Pertemuan ke-6 dan ke-7)
-
Pendahuluan
Pada proses pengenalan ucapan, langkah yang dilakukan
setelah pengambilan data atau sampel ucapan adalah
EKSTRAKSI CIRI.
Ekstraksi ciri bertujuan mengambil ciri-ciri utama dari data
dengan mengambil informasi yang dominan dan membuang
informasi lain. Ciri bersifat unik, seringkali hanya memiliki
sejumlah kecil nilai, namun mewakili satu entitas yang besar.
Dengan ekstraksi ciri, maka pengenalan, pembandingan,
ataupun analisis dilakukan pada sejumlah nilai terbatas, misal
vektor yang terdiri atas beberapa nilai, bukan pada
keseluruhan nilai pada data.
Dengan ekstraksi ciri diharapkan proses pengenalan dapat
dilakukan dengan lebih cepat.
9-2
2
-
Contoh makalah
9-3
3
-
Background Mathematics
9-4
4Statistika
1. Rerata (mean)
-
2. Simpangan Baku
(Standard Deviation)
9-5
5
-
3. Varians
9-6
6
-
4. Kovarians (covariance) (1)
9-7
7
-
Kovarians (covariance) (2)
9-8
8
-
Kovarians (covariance) (3)
9-9
9
-
5. Matriks Kovarians (1)
9-10
10
-
Matriks Kovarians (2)
9-11
11
-
PR (2)
9-12
12
-
6. Aljabar Matriks
9-13
13
-
Eigenvector dan Eigenvalues (1)
9-14
14
-
Eigenvector dan Eigenvalues (2)
9-15
15
-
Eigenvector dan Eigenvalues (2)
9-16
16
-
9-17
17
-
PenutupMinggu depan: baru PCA-nya!!
Demikian paparan saya
sampaikan
Terima kasih
Pa
ge18
2015 R. Rizal Isnanto, All rights reserved.
-
PCA (Pertemuan ke-7)
Pada pengolahan sinyal ucapan, satu gelombang
ucapan dibagi menjadi blok-blok berukuran sama.
Blok 1 dimensi (vektor) dibuat sebagai matriks
bujursangkar (n x n)
Setiap blok dicari nilai-nilai eigen-nya (ada n nilai eigen)
Setelah semua blok dicari nilai-nilai eigen-nya, maka
semua nilai eigen tersebut diurutkan dari yang terbesar
sampai yang terkecil (l1, l2, l3, l4, dst.)
Nilai-nilai eigen itulah yang disebut sebagai komponen-
komponen utama (principal components)
9-19
-
Lanjutan PCA (2)
Setelah itu, diambil beberapa komponen utama
terbesar, misalnya 75 terbesar, 50 terbesar, atau 10
terbesar.
Komponen-komponen utama tersebut dimasukkan ke
dalam vektor ciri.
Vektor ciri dari sinyal ucapan uji dibandingkan dengan
vektor ciri dari sinyal ucapan data latih menggunakan
model similarity measures, misalnya Jarak Euclidean,
Jarak Minkowski dan sebagainya.
9-20
-
Lanjutan PCA (3)
Jarak yang paling kecil (minimum) terhadap satu vektor
ciri data latih menunjukkan bahwa data uji dikenali
sebagai paling dekat kemiripannya dengan data latih
tersebut, atau dikenali sebagai data latih tersebut
Untuk implementasi, sering digunakan nilai ambang
(threshold) untuk menentukan suatu data uji bisa
dikenali atau tidak bisa dikenali. Jika jarak > nilai
ambang, maka akan diperoleh keluaran TIDAK DIKENALI.
Jika jarak
-
Efisiensi komputasi dengan PCA
Misal dari seluruh komponen utamanya diambil 25%
terbesarnya
Dari n x n ciri (atau dalam sinyal ucapan adalah n2 ciri
dalam baris yang sama) akan diperoleh n komponen
utama
Maka jumlah ciri uji yang harus dicocokkan dengan ciri
pada data latih = 0,25n.
Sehingga efisiensi komputasi = 1 [(0,25n) / n2]
= 1 [0,25 / n]
= {1 [1/(4n)]} x 100%9-22
-
Penutup
Ada pertanyaan?
Kita lanjutkan dengan Everything about UTS
9-23
-
Everything about UTS (1)
Buka ringkasan 1 lbr double folio asli (tulis tangan)
Tutup buku, laptop, HP, dan sejenisnya
Boleh buka kalkulator
Waktu: 90 menit
9-24
-
Everything about UTS (2)
Materi yang harus dipersiapkan:
1. Konversi analog ke digital
2. Speaker Recognition vs Speech Recognition
3. Teknologi Text-To-Speech (TTS) dan Speech-To-Text
(STT)
4. Similarity measures: Jarak Euclidean, Minkowski, dsb.
5. PCA: mean, varians, kovarians, nilai dan vektor eigen.
6. Sistem Biometrika: iris, sidik-jari, dsb., selain suara
9-25
-
Selamat Belajar
Semoga sukses
9-26
top related