Artikel tentang Browsing Audio Data, Speech Recognition, dan Speech Synthesis

Browsing Audio Data, Speech Recognition, Speech Synthesis.

Teknologi yang terkait dengan telematika ini berkaitan dengan beberapa fitur yang ada diatas, berikut penjelasannya :

1.Browsing Audio Data
Browsing audio data adalah kemampuan mesin untuk mencari data dengan menggunakan input audio. Suatu ketika kita mendengarkan sebuah kilasan lagu dan kemudian kita merasa terkesan dengan lagu tersebut. Meskipun kita hanya mendengarkan secara sekilas, tetapi membuat kita ingin tahu lagu siapakah itu? Browsing audio data pada suara tidak seperti browsing teks pada tulisan. Hal ini disebabkan perbedaan sifat antara tulisan dan suara.  Pada tulisan, apa yang ditulis bisa tetap ada secara permanen tertulis sedangkan  pada audio atau suara sifatnya hanyalah sementara maksudnya setelah bunyi suara  terdengar maka selanjutnya suara tersebut akan menghilang. Karena sifat suara yang tidak permanen  itulah maka untuk melakukan pencarian dalam audio data harus selalu dilakukan pengulangan dalam membunyikan suara tersbut.

Browsing audio data dilakukan dengan cara konsep pendengar dan pembicara/speaker. Sebuah rekaman suara dirubah menjadi beberapa bagian dan setiap bagian akan dibunyikan oleh pembicara/speaker yang berbeda. Semua bagian dari rekaman tersebut dibunyikan secara bersamaan atau dengan kata lain semua pembicara atau speaker sedang berbicara dalam waktu yang sama. Pendengar mendengarkan semua suara dari semua pembicara atau speaker,  jika ada perkataan dari seorang pembicara (misalnya pembicara 1) yang sama atau mirip dengan  kata-kata search-key yang sedang dicari maka suara dari pembicara yang lainnya akan dikecilkan  untuk memperjelas dan memastikan bahwa suara dari pembicara 1 adalah yang sama kemudian didapat kesimpulan  bahwa sebuah rekaman yang tadinya dipotong menjadi beberapa bagian itu adalah data audio yang sedang dicari.

2.Speech Recognition
Dikenal juga dengan pengenal suara otomatis (automatic speech recognition) atau pengenal suara komputer (computer speech recognition). Merupakan salah satu fitur antarmuka telematika yang merubah suara menjadi tulisan. Istilah ‘voice recognition’ terkadang digunakan untuk menunjuk ke speech recognition dimana sistem pengenal dilatih untuk menjadi pembicara istimewa, seperti pada kasus perangkat lunak untuk komputer pribadi, oleh karena itu disana terdapat aspek dari pengenal pembicara, dimana digunakan untuk mengenali siapa orang yang berbicara, untuk mengenali lebih baik apa yang orang itu bicarakan. Speech recognition merupakan istilah masukan yang berarti dapat mengartikan pembicaraan siapa saja.

3.Speech Synthesis
Speech synthesis merupakan hasil kecerdasan buatan dari pembicaraan manusia. Komputer yang digunakan untuk tujuan ini disebut speech syhthesizer dan dapat diterapkan pada perangkat lunak dan perangkat keras. Sebuah sistem text to speech (TTS) merubah bahasa normal menjadi pembicaraan.

Komentar

Postingan populer dari blog ini

Resensi Novel Surat Kecil Untuk Tuhan

Resensi Novel Assassin's Creed: Renaissance

Resensi Novel Bunga Cantik di Balik Salju