rancang bangun aplikasi speech to text
TRANSCRIPT
CKI On SPOT, Vol. 11, No. 1, Agustus 2018 ISSN Cetak: 1979-7044 ISSN Online: 2598-2990
48 Copyright © 2018 StikomCKI.ac.id
RANCANG BANGUN APLIKASI SPEECH TO TEXT
BERBASIS ANDROID PADA ELEVENIA
Dadang Iskandar Mulyana 1 Irbah Baihaqi 2
1 Program Teknik Informatika Informasi Sekolah Tinggi Ilmu Komputer CKI, Jakarta Timur
Email: [email protected] , [email protected]
ABSTRACT
Online shop today is no longer a stranger to the people of Indonesia, whether in daily use the
internet or not. With this online sale makes it easy for people to transact without having to go to the place of goods to be purchased. Before making a transaction, the user will first search for items to
be purchased in the search system. Each user would want an innovation of any e-commerce
applications that run for convenience when shopping and ease to transact. Search by voice allows users to search for items they want to buy in an online shop without having to type. Because in
some cases found, not all users who want to shop online feel comfortable typing, they want a
convenience. In addition to these conveniences there is a longer typing time than converter sound
into text. An appropriate innovation to increase the user's comfort in finding the product they want to buy is by using speech to text technology, where only with one click record sound of goods to be
searched and e-commerce will display products relevant to the keyword of the desired goods.With
a search application with this voice or speech to text, will give the user the convenience of shopping online. Elevenia.co.id is one of the most popular e-commerce community that allows to
adopt the application. If before Elevenia.co.id only provide keyword-based search, hopefully with
speech to text application is expected to provide benefits on the parties Elevenia.co.id and to its users.
Keywords: Speech to Text, Voice Search, Online Shop, E-Commerce
* E-mail address [email protected]
2598 – 2990 © 2018 The Authors. Published by STIKOM Cipta Karya Informatika.
Selection and peer-review under responsibility of The 11th STIKOM CKI on SPOT
CKI On SPOT, Vol. 11, No. 1, Agustus 2018 ISSN Cetak: 1979-7044 ISSN Online: 2598-2990
49 Copyright © 2018 StikomCKI.ac.id
1. PENDAHULUAN Online shop atau bisnis online saat ini bukan lagi menjadi sesuatu yang asing bagi masyarakat
Indonesia, baik yang dalam kesehariannya menggunakan internet ataupun tidak. Dengan adanya
penjualan secara online ini memudahkan masyarakat untuk bertransaksi tanpa harus pergi ke tempat barang yang ingin dibeli.
Product Search Engines (Mesin Pencari Produk) berperan penting dalam website sebagai
gerbang utama situs belanja online. Biasanya pelanggan akan menggunakan search engines untuk mencari produk yang pelanggan minati. Belakangan ini telah ramai metodologi pencarian suara
(Voice Search). Voice search memungkinkan user untuk mencari sesuatu menggunakan suara
dengan mengonversikan input suara ke dalam teks (Speech To Text) sebagai alternatif metode
input yang cepat serta dapat mengurangi kesalahan memasukkan input pada bidang teks. Elevenia.co.id merupakan situs e-commerce dengan konsep open marketplace nomor 23 di
Indonesia yang memberikan kemudahan dan keamanan berbelanja. Situs ini menawarkan berbagai
macam produk untuk para pecinta belanja online. Jika sebelumya Elevenia.co.id hanya menyediakan keyword-based search dalam system pencarian produknya, dengan adanya aplikasi
speech to text diharapkan dapat meningkatkan customer experience pelanggan dalam mengurangi
kesalahan memasukan input pada papan keyboard smartphone (Typo). Selain itu, juga dapat
memudahkandan mempercepat para customer saat mencari produk yang diminatinya, hanya dengan mengetuk ikon mikropon pada mesin pencarian produk, lalu aplikasi akan memberikan
hasil pencarian produk yang relevan sesuai dengan keyword yang diucapkan oleh user
.
1.1 Tinjauan Pustaka
Menurut penelitian yang dilakukan oleh (Elizabeth Irenne Yuwono dan Tony Antonio,
2015) yang berjudul “Studi Format Audio dan Teks Untuk Modul Speech to Text” menjelaskan bahwa akurasi hasil speech to text dipengaruhi oleh keterbatasan pemrosesan audio
pada format tertentu. Selain format audio, kompleksitas karakteristik ucapan manusia juga
merupakan aspek penting yang harus diperhitungkan dalam pengembangan modul speech to text.
Modul speech to text harus dapat mencakup ragam karakter huruf dalam berbagai bahasa yang ada di dunia.
Menurut penelitian yang dilakukan oleh (Candra Dinata dkk., 2017) dengan judul penelitian
“Implementasi Teknik Dynamic Time Warping (DTW) Pada Aplikasi Speech To Text” telah menghasilkan sebuah sistem speech to text yang menerapkan algoritma dynamic time warping.
Berdasarkan hasil pengujian data sinyal suara, untuk pengujian dengan satu kata memiliki jumlah
total 217 data yang diuji, sistem mampu mengenali sebanyak 208 kata dengan rata-rata akurasi sebesar 95.85% dan tingkat kesalahan sebesar 4,15 % atau sebanyak 9 kata. Sedangkan, untuk
pengujian data sinyal suara dengan menggunakan satu kalimat yang terdiri dari 5 kata, terhadap 50
data yang diuji, sistem berhasil mengenali dengan baik 47 kalimat dengan rata-rata akurasi sebesar
94%,3 kalimat lainnya tidak dapat dikenali dengan sempurna atau ia memiliki rata-rata tingkat kesalahan sebesar 6%.
Menurut penelitian yang dilakukan oleh (Khairunizam dkk., 2017) dengan judul penelitian
“Aplikasi Pemutar Musik Menggunakan Speech Recognition” yang dilakukan pada pembuatan aplikasi pemutar musik yang bekerja dengan cara melakukan pencarian menggunakan
pengucapan suara yang akan diproses menjadi sebuah perintah untuk memutarkan musik secara
langsung. Tidak hanya dalam melakukan pencarian tetapi dalam mengontrol musik juga dapat
menggunakan perintah suara diantaranya perintah sebelumnya, selanjutnya, berhenti, mainkan, dan keluar.
Berdasarkan hasil dan pengujian terhadap penggunaan aplikasi pemutar musik mengunakan
speech recognition diambil kesimpulan bahwa aplikasi sudah mampu memutar musik dengan perintah suara sesuai judul lagu yang kita ucapkan, walaupun ada kendala ketika jaringan internet
mengalami ganguan, maka google speech juga segi penggunaan speech to text terkadang proses
CKI On SPOT, Vol. 11, No. 1, Agustus 2018 ISSN Cetak: 1979-7044 ISSN Online: 2598-2990
50 Copyright © 2018 StikomCKI.ac.id
nya sedikit lambat, dikarenakan harus tergantung koneksi pada internet untuk mengunakan speech to text tersebut. Dan ketika memberi perintah suara seperti berhenti, mainkan, sebelumnnya,
selanjutnnya dan keluar sudah mampu sistem berkerja dengan baik sesuai dengan yang
diperintahkan mengunakan suara.
2. METODE PENELITIAN
Metode penelitian ini digunakan oleh penulis sebagai pedoman dalam melaksanakan penelitian agar hasil yang dicapai tidak menyimpang dari tujuan yang telah ditentukan
sebelumnya.
2.1 Metode Pengumpulan Data Pengumpulan informasi untuk memperoleh data dan kebutuhan tentang aturan-aturan, serta
sistem yang sedang berjalan. Adapun metode pengumpulan data yang digunakan dalam
penyusunan penelitian, yaitu :
1. Observasi
Observasi adalah pengamatan langsung terhadap kegiatan yang berhubungan dengan malasah yang diambil. Dari hasil pengamatan tersebut langsung di catat oleh peneliti dan dari hasil
pengamatan ini dapat diketahui proses dari kegiatan tersebut.
2. Wawancara Wawancara adalah teknik mengumpulkan data dengan mengajukan pertanyaan langsung
kepada narasumber yang mempunyai peranan penting dalam kegiatan penelitian ini.
3. Studi pustaka
Studi pustaka adalah teknik pengumpulan data berupa teori dari berbagai jurnal, dan website terpercaya maupun buku-buku yang berhubungan dengan aplikasi Speech to Text, voice
search dalam search engines maupun e-commerce.
4. Daftar Pertanyaan (Questionnaire) Suatu daftar pertanyaan yang berisi dengan pertanyaan-pertanyaan untuk tujuan khusus yang
memungkinkan analis sistem dapat memungkinkan analis sistem dapat mengumpulkan data
dan pendapat dari responden-responden.
2.2 Metode Analisis
Metode analisis yang digunakan dalam penelitian ini adalah metode perancangan layar
(storyboard) dan UML (Unified Model Language) yang terdiri dari analisis dan perancangan. Tahap ini mengolah syarat kebutuhan ke sebuah perancangan software yang dapat diperkirakan
sebelum melakukan pemrograman. Tahap UML (Unified Model Language) terdiri dari lima
diagram yaitu: a. Flowmap Diagram
b. Use Case Diagram
c. Activity Diagram
d. Sequence Diagram e. Class Diagram
2.3 Metode Pengolahan / Perancangan Penulis menggunakan metode waterfall dalam merancang aplikasi. Metode waterfall adalah
suatu proses pembuatan sistem/ aplikasi secara terstrukturdan berurutan dimulai dari penentuan
masalah, analisa kebutuhan, perancangan implementasi, uji coba sistem/ aplikasi, dan pemeliharaan sistem/ aplikasi. Metode ini membutuhkan pendekatan sistematis dan sekuensial
dalam mengembangkan sistem/ aplikasi yang dimulai dari rekayasa dan permodelan sistem/
aplikasi, analisis kebutuhan, desain, coding, pengujian dan pemeliharaan sistem/ aplikasi.
CKI On SPOT, Vol. 11, No. 1, Agustus 2018 ISSN Cetak: 1979-7044 ISSN Online: 2598-2990
51 Copyright © 2018 StikomCKI.ac.id
3. HASIL DAN PEMBAHASAN Sistem pencarian produk pada Elevenia.co.id yang masih menggunakan system keyword-
based search harus segera dikembangkan agar dapat memepermudah dan mempercepat pencarian
produk serta mengurangi keselahan dalam mengetik pada papan keyboard dengan membuat aplikasi fitur voice search pada search engine agar mempermudah konsumen dalam mesin
pencarian tanpa harus mengetik barang yang ingin dicari hanya dengan merekam suara.
3.1 Analisa Sistem Berjalan
Analisis Sistem Berjalan merupakan penguraian dari suatu sistem informasi yang utuh ke
dalam bagian-bagian komponennya dengan maksud untuk mengidentifikasikan dan mengevaluasi
permasalahan, kesempatan, hambatan yang terjadi dan kebutuhanyang diharapkan sehingga dapat
diusulkan perbaikan.
Pada diagram ini, menggambarkan bagaimana proses system berjalan pencarian produk
menggunakan simbol-simbol flowmap, yaitu sebagai berikut:
Gambar 1 Flowmap diagram sistem berjalan
3.2 Rancangan Sistem Usulan
Perancangan sistem secara umum ini menggambarkan perancangan sistem secara garis
besar yaitu dengan menggambarkan prosedur sistem yang diusulkan,kemudian membuat database yang berisi tabel-tabel yang akan dibutuhkan, kemudian menghubungkan antar tabel
satu dengan tabel yang lain.
Adapun rancangan sistem yang diusulkan pada sistem pencarian produk pada Elevenia, yaitu:
3.2.1. Flowmap Diagram Sistem Usulan Pada diagram ini, peneliti menggambarkan bagaimana proses aplikasi Speech to Text
menggunakan simbol-simbol flowchart yaitu sebagai berikut :
CKI On SPOT, Vol. 11, No. 1, Agustus 2018 ISSN Cetak: 1979-7044 ISSN Online: 2598-2990
52 Copyright © 2018 StikomCKI.ac.id
Gambar 2 Flowmap sistem usulan
3.2.2. Usecase Diagram Diagram ini menggambarkan tentang tindakan yang biasa dilakukan oleh aktor-aktor,
dalam hal ini stakeholder terdapat ketergantungan antara proses yang terjadi.Berikut ini adalah
usecase diagram dari sistem pencarian suara aplikasi Speech to Text pada Elevenia:
Gambar 3 Use Case Diagram Sistem Aplikasi Speech to Text
3.2.3. Activity Diagram Diagram ini menggambarkan proses aktivitas recording yang berjalan pada sistem aplikasi
Speech to Text yaitu sebagai berikut:
CKI On SPOT, Vol. 11, No. 1, Agustus 2018 ISSN Cetak: 1979-7044 ISSN Online: 2598-2990
53 Copyright © 2018 StikomCKI.ac.id
Gambar 4 Activity Diagram Sistem Aplikasi Speech to Text
3.2.4. Sequence Diagram Untuk menjelaskan kronologi (urutan) sistem secara logis yang seharusnya dilakukan untuk
menghasilkan sesuatu yang sesuai dengan use case diagram penulis menggunakan sequence
diagram. Sequence diagram dari aplikasi ini adalah:
Gambar 5 Sequency Diagram Sistem Aplikasi
Speech to Text
3.2.5. Class Diagram
Class diagram atau diagram kelas menggambarkan kelas-kelas yang terlibat di dalam
proses pengolahan data yang berbentuk tabel, di dalam tabel tersebut ada nama kelas yang
terlibat, nama atribut, serta method atau operasi yang dapat dilakukan. Berikut ini adalah
gambar Class Diagram pada aplikasi speech to text pada Elevenia , sebagai berikut:
CKI On SPOT, Vol. 11, No. 1, Agustus 2018 ISSN Cetak: 1979-7044 ISSN Online: 2598-2990
54 Copyright © 2018 StikomCKI.ac.id
Gambar 6 Class Diagram Sistem Aplikasi Speech to Text
3.2.6. Rancang Basis Data
Melalui deskripsi rancang basis data dapat ditentukan jenis data, hubungan dan
konstrain data yang ada di dalam aplikasi. Berikut adalah diagram arsitektur database
yang ada di aplikasi Speech to Text pada Elevenia:
Gambar 7 Diagram rancang basis data Sistem Aplikasi Speech to Text
3.2.7. Bagan Struktur Aplikasi Bagan strukur aplikasi ini menjelaskan tentang bagian atau breakdown dari Aplikasi
Speech to Text. Aplikasi Speech to Text ini terdiri atas tiga proses utama, yaitu Merekam suara
dan mengkonvert ke dalam teks, Memindai konvert suara, dan Memberikan Hasil Produk Terkait. Berikut ini adalah bagan struktur aplikasi Speech to Text pada Elevenia:
Gambar 8 Bagan struktur Sistem Aplikasi Speech to Text
CKI On SPOT, Vol. 11, No. 1, Agustus 2018 ISSN Cetak: 1979-7044 ISSN Online: 2598-2990
55 Copyright © 2018 StikomCKI.ac.id
3.2.8. Flowchart Aplikasi Agar dapat memahami proses apa saja yang berjalan pada aplikasi Speech to Text maka
dibuatlah flowchart yang berisikan detail tentang proses-proses apa saja yang ada dan
dijalankan pada aplikasi. Berikut ada flowchart aplikasi Speech to Text pada Elevenia:
Gambar 9 Flowchart Sistem Aplikasi Speech to Text
3.2.9. Implementasi Program
Gambar 10 Tampilan Icon Aplikasi di Android
CKI On SPOT, Vol. 11, No. 1, Agustus 2018 ISSN Cetak: 1979-7044 ISSN Online: 2598-2990
56 Copyright © 2018 StikomCKI.ac.id
Gambar 11 Tampilan Loading Aplikasi
Gambar 12 Tampilan Connection Dialog
Gambar 13 Tampilan Menu Utaman Aplikasi
CKI On SPOT, Vol. 11, No. 1, Agustus 2018 ISSN Cetak: 1979-7044 ISSN Online: 2598-2990
57 Copyright © 2018 StikomCKI.ac.id
Gambar 14 Tampilan Menu Search Product
Gambar 16 Tampilan Menu Pop Up Speech To Text
Gambar 17 Tampilan Product Result
CKI On SPOT, Vol. 11, No. 1, Agustus 2018 ISSN Cetak: 1979-7044 ISSN Online: 2598-2990
58 Copyright © 2018 StikomCKI.ac.id
Gambar 18 Tampilan Product View
Gambar 19 Tampilan Botton Menu More
Gambar 20 Tampilan Toolbar Menu
CKI On SPOT, Vol. 11, No. 1, Agustus 2018 ISSN Cetak: 1979-7044 ISSN Online: 2598-2990
59 Copyright © 2018 StikomCKI.ac.id
Gambar 21 Tampilan Menu My Cart
Gambar 22 Tampilan Menu Setting
Gambar 23 Tampilan Menu Product
CKI On SPOT, Vol. 11, No. 1, Agustus 2018 ISSN Cetak: 1979-7044 ISSN Online: 2598-2990
60 Copyright © 2018 StikomCKI.ac.id
4. KESIMPULAN Perancangan aplikasi Speech to Text yang merupakan voice search engine yang diterapkan
di e-commerce Elevenia.co.id yang digunakan untuk mempermudah pengguna untuk mencari
produk tanpa harus mengetik di papan ketik dengan merekam suara mengucapkan produk yang ingin dicari. Berdasarkan rancangan dan implementasi yang telah dilakukan dan
diuraikan pada bab-bab sebelumnya di penelitian ini, maka penulis dapat mengambil
kesimpulan sebagai berikut : 1. Aplikasi Speech to Text merupakan plugin dalam sistem pencarian di e-commerce
Elevenia.co.id berbasis sistem operasi android diharapkan dapat berguna menjadikan
proses pencarian produk lebih efektif dan akurat, sehingga dapat menciptakan kenyamanan
bagi pengguna selama melakukan proses pembelian dan menambah nilai komersil bagi Elevenia.co.id.
2. Melalui aplikasi Speech to Text ini perusahaan maupun seller dapat mempromosikan dan
membentuk citra perusahaan, karna dapat diuntungkan dengan adanya fasilitas di berbagai macam search engine yang tersedia. Beberapa keuntungannya yaitu :
a. Mudah digunakan untuk ajang promosi.
b. Biaya mengakses relatif lebih murah dibanding secara langsung.
c. Jangkauan bagi konsumen lebih luas dan tak terbatas. d. Dapat berinovasi untuk menjadi posisi teratas dalam search engine.
3. Dengan adanya aplikasi pencarian berdasarkan suara ini, alih-alih mengetik yang tidak
aman untuk dilakukan di semua situasi seperti saat sedang menyetir, maka dengan aplikasi Speech toText ini hanya cukup merekam suara dan mengucapkan produk yang ingin dicari
maka akan muncul informasi yang berkaitan maupun serupa.
4. Aplikasi yang sudah dibuat masih dapat dimodifikasi agar dapat mengikuti perkembangan proses bisnis perusahaan, hal - hal yang dapat dikembangkan lagi adalah bentuk pencarian
audio yang tidak terpaku hanya pada pengambilan suara satu bahasa namun juga dapat
menambahkan program beberapa bahasa asing.
5. Saran untuk penelitian selanjutnya diharapkan adanya proses pendaftaran modeling suara pengguna pada akun user sebelum menggunakan fitur speech to text ini untuk mencegah
bentrok suara user dengan lingkungan disekitarnya agar mikropon smartphone hanya
berfokus pada input satu suara user yang sudah terverifikasi pada fitur speech to text ini sehingga menghasilkan kata atau kalimat yang sesuai diucapkan oleh user.
5. REFERENSI. Dinata, Candra, Diyah Puspitaningrum dan Ernawati, Implementasi Teknik Dynamic Time
Warping (DTW) Pada Aplikasi Speech To Text, Jurnal Teknik Informatika, Vol. 10, No. 1-April,
2017, ISSN 1979-1960.
Khairunizam, Danuri dan Jaroji, Aplikasi Pemutar Musik Menggunakan Speech Recognition, Jurnal INOVTEK POLBENG – Seri Informatika, Vol. 2, No. 2, November, 2017, ISSN : 2527-
9866.
Sarhan, Shahenda, International Journal of Computer Applications, Vol. 90, No 3, Maret, 2014 : 40-44, 0975 – 8887.
Shalahuddin M, Rosa, 2013. Rekayasa Perangkat Lunak Terstruktur dan Berorientasi Objek,
Jakarta: INFORMATIKA.
Yakub. 2012. Pengantar Sistem Informasi. Yogyakarta: Graha Ilmu. Yasin, Verdi. 2012. Rekayasa Perangkat Lunak Berorientasi Objek, Jakarta: Mitra Wacana Media.
Yuwono, Elizabeth Irenne dan Tony Antonio, Studi Format Audio dan Teks Untuk Modul Speech
to Text, JUISI, Vol. 01, No. 01, Februari, 2015, ISSN: 2460-1306.