Artikel tentang Browsing Audio Data, Speech Recognition, dan Speech Synthesis

November 08, 2016

Browsing Audio Data, Speech Recognition, Speech Synthesis.

Teknologi yang terkait dengan telematika ini berkaitan dengan beberapa fitur yang ada diatas, berikut penjelasannya :

1.Browsing Audio Data
Browsing audio data adalah kemampuan mesin untuk mencari data dengan menggunakan input audio. Suatu ketika kita mendengarkan sebuah kilasan lagu dan kemudian kita merasa terkesan dengan lagu tersebut. Meskipun kita hanya mendengarkan secara sekilas, tetapi membuat kita ingin tahu lagu siapakah itu? Browsing audio data pada suara tidak seperti browsing teks pada tulisan. Hal ini disebabkan perbedaan sifat antara tulisan dan suara. Pada tulisan, apa yang ditulis bisa tetap ada secara permanen tertulis sedangkan pada audio atau suara sifatnya hanyalah sementara maksudnya setelah bunyi suara terdengar maka selanjutnya suara tersebut akan menghilang. Karena sifat suara yang tidak permanen itulah maka untuk melakukan pencarian dalam audio data harus selalu dilakukan pengulangan dalam membunyikan suara tersbut.

Browsing audio data dilakukan dengan cara konsep pendengar dan pembicara/speaker. Sebuah rekaman suara dirubah menjadi beberapa bagian dan setiap bagian akan dibunyikan oleh pembicara/speaker yang berbeda. Semua bagian dari rekaman tersebut dibunyikan secara bersamaan atau dengan kata lain semua pembicara atau speaker sedang berbicara dalam waktu yang sama. Pendengar mendengarkan semua suara dari semua pembicara atau speaker, jika ada perkataan dari seorang pembicara (misalnya pembicara 1) yang sama atau mirip dengan kata-kata search-key yang sedang dicari maka suara dari pembicara yang lainnya akan dikecilkan untuk memperjelas dan memastikan bahwa suara dari pembicara 1 adalah yang sama kemudian didapat kesimpulan bahwa sebuah rekaman yang tadinya dipotong menjadi beberapa bagian itu adalah data audio yang sedang dicari.

2.Speech Recognition
Dikenal juga dengan pengenal suara otomatis (automatic speech recognition) atau pengenal suara komputer (computer speech recognition). Merupakan salah satu fitur antarmuka telematika yang merubah suara menjadi tulisan. Istilah ‘voice recognition’ terkadang digunakan untuk menunjuk ke speech recognition dimana sistem pengenal dilatih untuk menjadi pembicara istimewa, seperti pada kasus perangkat lunak untuk komputer pribadi, oleh karena itu disana terdapat aspek dari pengenal pembicara, dimana digunakan untuk mengenali siapa orang yang berbicara, untuk mengenali lebih baik apa yang orang itu bicarakan. Speech recognition merupakan istilah masukan yang berarti dapat mengartikan pembicaraan siapa saja.

3.Speech Synthesis
Speech synthesis merupakan hasil kecerdasan buatan dari pembicaraan manusia. Komputer yang digunakan untuk tujuan ini disebut speech syhthesizer dan dapat diterapkan pada perangkat lunak dan perangkat keras. Sebuah sistem text to speech (TTS) merubah bahasa normal menjadi pembicaraan.

Cari Blog Ini

Rheza's Blog

Artikel tentang Browsing Audio Data, Speech Recognition, dan Speech Synthesis

Komentar

Posting Komentar

Postingan populer dari blog ini

Contoh Proposal Aplikasi Wisata Berbasis Android dan iOS

Pantun dan Ciri-cirinya