rancang bangun aplikasi speech to text

CKI On SPOT, Vol. 11, No. 1, Agustus 2018 ISSN Cetak: 1979-7044 ISSN Online: 2598-2990

48 Copyright © 2018 StikomCKI.ac.id

RANCANG BANGUN APLIKASI SPEECH TO TEXT

BERBASIS ANDROID PADA ELEVENIA

Dadang Iskandar Mulyana 1 Irbah Baihaqi 2

1 Program Teknik Informatika Informasi Sekolah Tinggi Ilmu Komputer CKI, Jakarta Timur

Email: [email protected] , [email protected]

ABSTRACT

Online shop today is no longer a stranger to the people of Indonesia, whether in daily use the

internet or not. With this online sale makes it easy for people to transact without having to go to the place of goods to be purchased. Before making a transaction, the user will first search for items to

be purchased in the search system. Each user would want an innovation of any e-commerce

applications that run for convenience when shopping and ease to transact. Search by voice allows users to search for items they want to buy in an online shop without having to type. Because in

some cases found, not all users who want to shop online feel comfortable typing, they want a

convenience. In addition to these conveniences there is a longer typing time than converter sound

into text. An appropriate innovation to increase the user's comfort in finding the product they want to buy is by using speech to text technology, where only with one click record sound of goods to be

searched and e-commerce will display products relevant to the keyword of the desired goods.With

a search application with this voice or speech to text, will give the user the convenience of shopping online. Elevenia.co.id is one of the most popular e-commerce community that allows to

adopt the application. If before Elevenia.co.id only provide keyword-based search, hopefully with

speech to text application is expected to provide benefits on the parties Elevenia.co.id and to its users.

Keywords: Speech to Text, Voice Search, Online Shop, E-Commerce

* E-mail address [email protected]

2598 – 2990 © 2018 The Authors. Published by STIKOM Cipta Karya Informatika.

Selection and peer-review under responsibility of The 11th STIKOM CKI on SPOT

mailto:[email protected]





1. PENDAHULUAN Online shop atau bisnis online saat ini bukan lagi menjadi sesuatu yang asing bagi masyarakat

Indonesia, baik yang dalam kesehariannya menggunakan internet ataupun tidak. Dengan adanya

penjualan secara online ini memudahkan masyarakat untuk bertransaksi tanpa harus pergi ke tempat barang yang ingin dibeli.

Product Search Engines (Mesin Pencari Produk) berperan penting dalam website sebagai

gerbang utama situs belanja online. Biasanya pelanggan akan menggunakan search engines untuk mencari produk yang pelanggan minati. Belakangan ini telah ramai metodologi pencarian suara

(Voice Search). Voice search memungkinkan user untuk mencari sesuatu menggunakan suara

dengan mengonversikan input suara ke dalam teks (Speech To Text) sebagai alternatif metode

input yang cepat serta dapat mengurangi kesalahan memasukkan input pada bidang teks. Elevenia.co.id merupakan situs e-commerce dengan konsep open marketplace nomor 23 di

Indonesia yang memberikan kemudahan dan keamanan berbelanja. Situs ini menawarkan berbagai

macam produk untuk para pecinta belanja online. Jika sebelumya Elevenia.co.id hanya menyediakan keyword-based search dalam system pencarian produknya, dengan adanya aplikasi

speech to text diharapkan dapat meningkatkan customer experience pelanggan dalam mengurangi

kesalahan memasukan input pada papan keyboard smartphone (Typo). Selain itu, juga dapat

memudahkandan mempercepat para customer saat mencari produk yang diminatinya, hanya dengan mengetuk ikon mikropon pada mesin pencarian produk, lalu aplikasi akan memberikan

hasil pencarian produk yang relevan sesuai dengan keyword yang diucapkan oleh user

.

1.1 Tinjauan Pustaka

Menurut penelitian yang dilakukan oleh (Elizabeth Irenne Yuwono dan Tony Antonio,

2015) yang berjudul “Studi Format Audio dan Teks Untuk Modul Speech to Text” menjelaskan bahwa akurasi hasil speech to text dipengaruhi oleh keterbatasan pemrosesan audio

pada format tertentu. Selain format audio, kompleksitas karakteristik ucapan manusia juga

merupakan aspek penting yang harus diperhitungkan dalam pengembangan modul speech to text.

Modul speech to text harus dapat mencakup ragam karakter huruf dalam berbagai bahasa yang ada di dunia.

Menurut penelitian yang dilakukan oleh (Candra Dinata dkk., 2017) dengan judul penelitian

“Implementasi Teknik Dynamic Time Warping (DTW) Pada Aplikasi Speech To Text” telah menghasilkan sebuah sistem speech to text yang menerapkan algoritma dynamic time warping.

Berdasarkan hasil pengujian data sinyal suara, untuk pengujian dengan satu kata memiliki jumlah

total 217 data yang diuji, sistem mampu mengenali sebanyak 208 kata dengan rata-rata akurasi sebesar 95.85% dan tingkat kesalahan sebesar 4,15 % atau sebanyak 9 kata. Sedangkan, untuk

pengujian data sinyal suara dengan menggunakan satu kalimat yang terdiri dari 5 kata, terhadap 50

data yang diuji, sistem berhasil mengenali dengan baik 47 kalimat dengan rata-rata akurasi sebesar

94%,3 kalimat lainnya tidak dapat dikenali dengan sempurna atau ia memiliki rata-rata tingkat kesalahan sebesar 6%.

Menurut penelitian yang dilakukan oleh (Khairunizam dkk., 2017) dengan judul penelitian

“Aplikasi Pemutar Musik Menggunakan Speech Recognition” yang dilakukan pada pembuatan aplikasi pemutar musik yang bekerja dengan cara melakukan pencarian menggunakan

pengucapan suara yang akan diproses menjadi sebuah perintah untuk memutarkan musik secara

langsung. Tidak hanya dalam melakukan pencarian tetapi dalam mengontrol musik juga dapat

menggunakan perintah suara diantaranya perintah sebelumnya, selanjutnya, berhenti, mainkan, dan keluar.

Berdasarkan hasil dan pengujian terhadap penggunaan aplikasi pemutar musik mengunakan

speech recognition diambil kesimpulan bahwa aplikasi sudah mampu memutar musik dengan perintah suara sesuai judul lagu yang kita ucapkan, walaupun ada kendala ketika jaringan internet

mengalami ganguan, maka google speech juga segi penggunaan speech to text terkadang proses



nya sedikit lambat, dikarenakan harus tergantung koneksi pada internet untuk mengunakan speech to text tersebut. Dan ketika memberi perintah suara seperti berhenti, mainkan, sebelumnnya,

selanjutnnya dan keluar sudah mampu sistem berkerja dengan baik sesuai dengan yang

diperintahkan mengunakan suara.

2. METODE PENELITIAN

Metode penelitian ini digunakan oleh penulis sebagai pedoman dalam melaksanakan penelitian agar hasil yang dicapai tidak menyimpang dari tujuan yang telah ditentukan

sebelumnya.

2.1 Metode Pengumpulan Data Pengumpulan informasi untuk memperoleh data dan kebutuhan tentang aturan-aturan, serta

sistem yang sedang berjalan. Adapun metode pengumpulan data yang digunakan dalam

penyusunan penelitian, yaitu :

1. Observasi

Observasi adalah pengamatan langsung terhadap kegiatan yang berhubungan dengan malasah yang diambil. Dari hasil pengamatan tersebut langsung di catat oleh peneliti dan dari hasil

pengamatan ini dapat diketahui proses dari kegiatan tersebut.

2. Wawancara Wawancara adalah teknik mengumpulkan data dengan mengajukan pertanyaan langsung

kepada narasumber yang mempunyai peranan penting dalam kegiatan penelitian ini.

3. Studi pustaka

Studi pustaka adalah teknik pengumpulan data berupa teori dari berbagai jurnal, dan website terpercaya maupun buku-buku yang berhubungan dengan aplikasi Speech to Text, voice

search dalam search engines maupun e-commerce.

4. Daftar Pertanyaan (Questionnaire) Suatu daftar pertanyaan yang berisi dengan pertanyaan-pertanyaan untuk tujuan khusus yang

memungkinkan analis sistem dapat memungkinkan analis sistem dapat mengumpulkan data

dan pendapat dari responden-responden.

2.2 Metode Analisis

Metode analisis yang digunakan dalam penelitian ini adalah metode perancangan layar

(storyboard) dan UML (Unified Model Language) yang terdiri dari analisis dan perancangan. Tahap ini mengolah syarat kebutuhan ke sebuah perancangan software yang dapat diperkirakan

sebelum melakukan pemrograman. Tahap UML (Unified Model Language) terdiri dari lima

diagram yaitu: a. Flowmap Diagram

b. Use Case Diagram

c. Activity Diagram

d. Sequence Diagram e. Class Diagram

2.3 Metode Pengolahan / Perancangan Penulis menggunakan metode waterfall dalam merancang aplikasi. Metode waterfall adalah

suatu proses pembuatan sistem/ aplikasi secara terstrukturdan berurutan dimulai dari penentuan

masalah, analisa kebutuhan, perancangan implementasi, uji coba sistem/ aplikasi, dan pemeliharaan sistem/ aplikasi. Metode ini membutuhkan pendekatan sistematis dan sekuensial

dalam mengembangkan sistem/ aplikasi yang dimulai dari rekayasa dan permodelan sistem/

aplikasi, analisis kebutuhan, desain, coding, pengujian dan pemeliharaan sistem/ aplikasi.



3. HASIL DAN PEMBAHASAN Sistem pencarian produk pada Elevenia.co.id yang masih menggunakan system keyword-

based search harus segera dikembangkan agar dapat memepermudah dan mempercepat pencarian

produk serta mengurangi keselahan dalam mengetik pada papan keyboard dengan membuat aplikasi fitur voice search pada search engine agar mempermudah konsumen dalam mesin

pencarian tanpa harus mengetik barang yang ingin dicari hanya dengan merekam suara.

3.1 Analisa Sistem Berjalan

Analisis Sistem Berjalan merupakan penguraian dari suatu sistem informasi yang utuh ke

dalam bagian-bagian komponennya dengan maksud untuk mengidentifikasikan dan mengevaluasi

permasalahan, kesempatan, hambatan yang terjadi dan kebutuhanyang diharapkan sehingga dapat

diusulkan perbaikan.

Pada diagram ini, menggambarkan bagaimana proses system berjalan pencarian produk

menggunakan simbol-simbol flowmap, yaitu sebagai berikut:

Gambar 1 Flowmap diagram sistem berjalan

3.2 Rancangan Sistem Usulan

Perancangan sistem secara umum ini menggambarkan perancangan sistem secara garis

besar yaitu dengan menggambarkan prosedur sistem yang diusulkan,kemudian membuat database yang berisi tabel-tabel yang akan dibutuhkan, kemudian menghubungkan antar tabel

satu dengan tabel yang lain.

Adapun rancangan sistem yang diusulkan pada sistem pencarian produk pada Elevenia, yaitu:

3.2.1. Flowmap Diagram Sistem Usulan Pada diagram ini, peneliti menggambarkan bagaimana proses aplikasi Speech to Text

menggunakan simbol-simbol flowchart yaitu sebagai berikut :



Gambar 2 Flowmap sistem usulan

3.2.2. Usecase Diagram Diagram ini menggambarkan tentang tindakan yang biasa dilakukan oleh aktor-aktor,

dalam hal ini stakeholder terdapat ketergantungan antara proses yang terjadi.Berikut ini adalah

usecase diagram dari sistem pencarian suara aplikasi Speech to Text pada Elevenia:

Gambar 3 Use Case Diagram Sistem Aplikasi Speech to Text

3.2.3. Activity Diagram Diagram ini menggambarkan proses aktivitas recording yang berjalan pada sistem aplikasi

Speech to Text yaitu sebagai berikut:



Gambar 4 Activity Diagram Sistem Aplikasi Speech to Text

3.2.4. Sequence Diagram Untuk menjelaskan kronologi (urutan) sistem secara logis yang seharusnya dilakukan untuk

menghasilkan sesuatu yang sesuai dengan use case diagram penulis menggunakan sequence

diagram. Sequence diagram dari aplikasi ini adalah:

Gambar 5 Sequency Diagram Sistem Aplikasi

Speech to Text

3.2.5. Class Diagram

Class diagram atau diagram kelas menggambarkan kelas-kelas yang terlibat di dalam

proses pengolahan data yang berbentuk tabel, di dalam tabel tersebut ada nama kelas yang

terlibat, nama atribut, serta method atau operasi yang dapat dilakukan. Berikut ini adalah

gambar Class Diagram pada aplikasi speech to text pada Elevenia , sebagai berikut:



Gambar 6 Class Diagram Sistem Aplikasi Speech to Text

3.2.6. Rancang Basis Data

Melalui deskripsi rancang basis data dapat ditentukan jenis data, hubungan dan

konstrain data yang ada di dalam aplikasi. Berikut adalah diagram arsitektur database

yang ada di aplikasi Speech to Text pada Elevenia:

Gambar 7 Diagram rancang basis data Sistem Aplikasi Speech to Text

3.2.7. Bagan Struktur Aplikasi Bagan strukur aplikasi ini menjelaskan tentang bagian atau breakdown dari Aplikasi

Speech to Text. Aplikasi Speech to Text ini terdiri atas tiga proses utama, yaitu Merekam suara

dan mengkonvert ke dalam teks, Memindai konvert suara, dan Memberikan Hasil Produk Terkait. Berikut ini adalah bagan struktur aplikasi Speech to Text pada Elevenia:

Gambar 8 Bagan struktur Sistem Aplikasi Speech to Text



3.2.8. Flowchart Aplikasi Agar dapat memahami proses apa saja yang berjalan pada aplikasi Speech to Text maka

dibuatlah flowchart yang berisikan detail tentang proses-proses apa saja yang ada dan

dijalankan pada aplikasi. Berikut ada flowchart aplikasi Speech to Text pada Elevenia:

Gambar 9 Flowchart Sistem Aplikasi Speech to Text

3.2.9. Implementasi Program

Gambar 10 Tampilan Icon Aplikasi di Android



Gambar 11 Tampilan Loading Aplikasi

Gambar 12 Tampilan Connection Dialog

Gambar 13 Tampilan Menu Utaman Aplikasi



Gambar 14 Tampilan Menu Search Product

Gambar 16 Tampilan Menu Pop Up Speech To Text

Gambar 17 Tampilan Product Result



Gambar 18 Tampilan Product View

Gambar 19 Tampilan Botton Menu More

Gambar 20 Tampilan Toolbar Menu



Gambar 21 Tampilan Menu My Cart

Gambar 22 Tampilan Menu Setting

Gambar 23 Tampilan Menu Product



4. KESIMPULAN Perancangan aplikasi Speech to Text yang merupakan voice search engine yang diterapkan

di e-commerce Elevenia.co.id yang digunakan untuk mempermudah pengguna untuk mencari

produk tanpa harus mengetik di papan ketik dengan merekam suara mengucapkan produk yang ingin dicari. Berdasarkan rancangan dan implementasi yang telah dilakukan dan

diuraikan pada bab-bab sebelumnya di penelitian ini, maka penulis dapat mengambil

kesimpulan sebagai berikut : 1. Aplikasi Speech to Text merupakan plugin dalam sistem pencarian di e-commerce

Elevenia.co.id berbasis sistem operasi android diharapkan dapat berguna menjadikan

proses pencarian produk lebih efektif dan akurat, sehingga dapat menciptakan kenyamanan

bagi pengguna selama melakukan proses pembelian dan menambah nilai komersil bagi Elevenia.co.id.

2. Melalui aplikasi Speech to Text ini perusahaan maupun seller dapat mempromosikan dan

membentuk citra perusahaan, karna dapat diuntungkan dengan adanya fasilitas di berbagai macam search engine yang tersedia. Beberapa keuntungannya yaitu :

a. Mudah digunakan untuk ajang promosi.

b. Biaya mengakses relatif lebih murah dibanding secara langsung.

c. Jangkauan bagi konsumen lebih luas dan tak terbatas. d. Dapat berinovasi untuk menjadi posisi teratas dalam search engine.

3. Dengan adanya aplikasi pencarian berdasarkan suara ini, alih-alih mengetik yang tidak

aman untuk dilakukan di semua situasi seperti saat sedang menyetir, maka dengan aplikasi Speech toText ini hanya cukup merekam suara dan mengucapkan produk yang ingin dicari

maka akan muncul informasi yang berkaitan maupun serupa.

4. Aplikasi yang sudah dibuat masih dapat dimodifikasi agar dapat mengikuti perkembangan proses bisnis perusahaan, hal - hal yang dapat dikembangkan lagi adalah bentuk pencarian

audio yang tidak terpaku hanya pada pengambilan suara satu bahasa namun juga dapat

menambahkan program beberapa bahasa asing.

5. Saran untuk penelitian selanjutnya diharapkan adanya proses pendaftaran modeling suara pengguna pada akun user sebelum menggunakan fitur speech to text ini untuk mencegah

bentrok suara user dengan lingkungan disekitarnya agar mikropon smartphone hanya

berfokus pada input satu suara user yang sudah terverifikasi pada fitur speech to text ini sehingga menghasilkan kata atau kalimat yang sesuai diucapkan oleh user.

5. REFERENSI. Dinata, Candra, Diyah Puspitaningrum dan Ernawati, Implementasi Teknik Dynamic Time

Warping (DTW) Pada Aplikasi Speech To Text, Jurnal Teknik Informatika, Vol. 10, No. 1-April,

2017, ISSN 1979-1960.

Khairunizam, Danuri dan Jaroji, Aplikasi Pemutar Musik Menggunakan Speech Recognition, Jurnal INOVTEK POLBENG – Seri Informatika, Vol. 2, No. 2, November, 2017, ISSN : 2527-

9866.

Sarhan, Shahenda, International Journal of Computer Applications, Vol. 90, No 3, Maret, 2014 : 40-44, 0975 – 8887.

Shalahuddin M, Rosa, 2013. Rekayasa Perangkat Lunak Terstruktur dan Berorientasi Objek,

Jakarta: INFORMATIKA.

Yakub. 2012. Pengantar Sistem Informasi. Yogyakarta: Graha Ilmu. Yasin, Verdi. 2012. Rekayasa Perangkat Lunak Berorientasi Objek, Jakarta: Mitra Wacana Media.

Yuwono, Elizabeth Irenne dan Tony Antonio, Studi Format Audio dan Teks Untuk Modul Speech

to Text, JUISI, Vol. 01, No. 01, Februari, 2015, ISSN: 2460-1306.

rancang bangun aplikasi speech to text

Documents