Speech Recognition adalah suatu pengembangan teknik dan sistem yang
memungkinkan komputer untuk menerima masukan berupa kata yang diucapkan.
Teknologi ini memungkinkan suatu perangkat untuk mengenali dan memahami
kata-kata yang diucapkan dengan cara digitalisasi kata dan mencocokkan sinyal
digital tersebut dengan suatu pola tertentu yang tersimpan dalam suatu
perangkat. Kata-kata yang diucapkan diubah bentuknya menjadi sinyal digital
dengan cara mengubah gelombang suara menjadi sekumpulan angka yang kemudian
disesuaikan dengan kode-kode tertentu untuk mengidentifikasikan kata-kata
tersebut. Hasil dari identifikasi kata yang diucapkan dapat ditampilkan dalam
bentuk tulisan atau dapat dibaca oleh perangkat teknologi sebagai sebuah
komando untuk melakukan suatu pekerjaan, misalnya penekanan tombol pada telepon
genggam yang dilakukan secara otomatis dengan komando suara.
Alat
pengenal ucapan, yang sering disebut dengan Speech Recognition, membutuhkan
sampel kata sebenarnya yang diucapkan dari pengguna. Sampel kata akan
didigitalisasi, disimpan dalam komputer, dan kemudian digunakan sebagai basis
data dalam mencocokkan kata yang diucapkan selanjutnya. Sebagian besar alat
pengenal ucapan sifatnya masih tergantung kepada pembicara. Alat ini hanya
dapat mengenal kata yang diucapkan dari satu atau dua orang saja dan hanya bisa
mengenal kata-kata terpisah, yaitu kata-kata yang dalam penyampaiannya terdapat
jeda antar kata. Hanya sebagian kecil dari peralatan yang menggunakan teknologi
ini yang sifatnya tidak tergantung pada pembicara. Alat ini sudah dapat
mengenal kata yang diucapkan oleh banyak orang dan juga dapat mengenal kata-kata
kontinu, atau kata-kata yang dalam penyampaiannya tidak terdapat jeda antar
kata.
Pengenalan
ucapan dalam perkembangan teknologinya merupakan bagian dari pengenalan suara
(proses identifikasi seseorang berdasarkan suaranya). Pengenalan suara sendiri terbagi
menjadi dua, yaitu pengenalan pembicara (identifikasi suara berdasarkan orang
yang berbicara) dan pengenalan ucapan (identifikasi suara berdasarkan kata yang
diucapkan).
Sejarah
Speech Recognition :
Sejak
tahun 1940, perusahaan American Telephone and Telegraph Company (AT&T)
sudah mulai mengembangkan suatu perangkat teknologi yang dapat mengidentifikasi
kata yang diucapkan manusia. Sekitar tahun 1960-an, para peneliti dari
perusahaan tersebut sudah berhasil membuat suatu perangkat yang dapat mengidentifikasi
kata-kata terpisah dan pada tahun 1970-an mereka berhasil membuat perangkat
yang dapat mengidentifikasi kata-kata kontinu. Alat pengenal ucapan kemudian
menjadi sangat fungsional sejak tahun 1980-an dan masih dikembangkan dan terus
ditingkatkan keefektifannya hingga sekarang. Hingga sampai tahun ini sudah
banyak aplikasi maupun web yang menggunakan Speech Recognition System, salah
satunya adalah Google. Web ini menyediakan aplikasi tersebut yang bernama
Google Speech Recognition, dimana user dapat mencari artikel tanpa harus
mengetik melainkan cukup berbicara.
Jenis-jenis
pengenalan ucapan :
Berdasarkan
kemampuan dalam mengenal kata yang diucapkan, terdapat 5 jenis pengenalan kata,
yaitu :
- Kata-kata yang terisolasi
Proses
pengidentifikasian kata yang hanya dapat mengenal kata yang diucapkan jika kata
tersebut memiliki jeda waktu pengucapan antar kata
- Kata-kata yang berhubungan
Proses
pengidentifikasian kata yang mirip dengan kata-kata terisolasi, namun
membutuhkan jeda waktu pengucapan antar kata yang lebih singkat
- Kata-kata yang berkelanjutan
Proses
pengidentifikasian kata yang sudah lebih maju karena dapat mengenal kata-kata
yang diucapkan secara berkesinambungan dengan jeda waktu yang sangat sedikit
atau tanpa jeda waktu. Proses pengenalan suara ini sangat rumit karena
membutuhkan metode khusus untuk membedakan kata-kata yang diucapkan tanpa jeda
waktu. Pengguna perangkat ini dapat mengucapkan kata-kata secara natural
- Kata-kata spontan
Proses
pengidentifikasian kata yang dapat mengenal kata-kata yang diucapkan secara
spontan tanpa jeda waktu antar kata.
- Verifikasi atau identifikasi suara
Proses
pengidentifikasian kata yang tidak hanya mampu mengenal kata, namun juga
mengidentifikasi siapa yang berbicara.
Cara
kerja Speech Recognition System :
1. Tahap
penerimaan masukan
Masukan
berupa kata-kata yang diucapkan lewat pengeras suara.
2. Tahap
ekstraksi
Tahap
ini adalah tahap penyimpanaan masukan yang berupa suara sekaligus pembuatan
basis data sebagai pola.
3. Tahap
pembandingan
Tahap
ini merupakan tahap pencocokan data baru dengan data suara (pencocokan tata
bahasa) pada pola.
4. Tahap
validasi identitas pengguna
Alat
pengenal ucapan yang sudah memiliki sistem verifikasi/identifikasi suara akan
melakukan identifikasi orang yang berbicara berdasarkan kata yang diucapkan
setelah menerjemahkan suara tersebut menjadi tulisan atau komando.
IMPLEMENTASI SPEECH RECOGNITION
Hardware
yang dibutuhkan dalam implementasi Speech Recognition :
- Sound card : Merupakan perangkat yang ditambahkan dalam suatu Komputer yang fungsinya sebagai perangkat input dan output suara untuk mengubah sinyal elektrik, menjadi analog maupun menjadi digital.
- Microphone : Perangkat input suara yang berfungsi untuk mengubah suara yang melewati udara, air dari benda orang menjadi sinyal elektrik.
- Komputer atau Komputer Server : Dalam proses suara digital menterjemahkan gelombang suara menjadi suatu simbol biasanya menjadi suatu nomor biner yang dapat diproses lagi kemudian diidentifikasikan dan dicocokan dengan database yang berisi berkas suara agar dapat dikenali.
Contoh
Implementasi teknologi Speech Recognition :
Saat
ini pada tahun 2010 Microsoft windows vista dan windows 7 , speech recognition
telah disertakan dalam system operasinya . sebagaimana fungsi dari speech
recognition menterjemahkan pengucapan kata – kata kedalam bentuk teks digital.
Salah satu implementasi speech recognition adalah pada konfrensi PBB dimana
seluruh Negara tergabung dalam keanggotaan nya , fungsi speech recognition
dalam hal ini menterjemahkan bahasa pembicara dari suatu Negara kedalam bahasa
yang dipahami pendengar . Contoh penggunaan lain speech recognition adalah
Perawatan kesehatan.
Dalam
perawatan kesehatan domain, bahkan di bangun meningkatkan teknologi pengenalan
suara, transcriptionists medis (MTs) belum menjadi usang. Layanan yang
diberikan dapat didistribusikan daripada diganti. Pengenalan pembicaraan dapat
diimplementasikan di front-end atau back-end dari proses dokumentasi medis.
Front-End SR adalah salah satu alat untuk mengidentifikasi kata-kata yang
ucapkan dan ditampilkan tepat setelah mereka berbicara Back-End SR atau SR
tangguhan adalah di mana penyedia menentukan menjadi sebuah sistem dikte
digital, dan suara yang diarahkan melalui pidato-mesin pengakuan dan draft
dokumen diakui dirutekan bersama dengan file suara yang asli ke MT / editor,
yang mengedit draft dan memfinalisasi laporan. Ditangguhkan SR sedang banyak
digunakan dalam industri saat ini.
Banyak
aplikasi Electronic Medical Records (EMR) dapat menjadi lebih efektif dan dapat
dilakukan lebih mudah bila digunakan dalam hubungannya dengan pengenalan-mesin
bicara. Pencarian, query, dan pengisian formulir semua bisa lebih cepat untuk
melakukan dengan suara dibandingkan dengan menggunakan keyboard.
Contoh
Software Speech Recognition :
Voice
Search
Aplikasi
ini diluncurkan oleh google dengan tujuan agar para user yang menggunakan jasa
pencarian google lebih dimudahkan dalam mencari data maupun artikel. Dengan
adanya aplikasi ini user cukup menggunakan suara tanpa harus mengetik kata
artikel yang ingin dicari. Fitur ini juga sangat membantu anda jika sedang
dalam keadaan berkendara. jadi anda tidak perlu repot-repot untuk mengetik
keypad handphone anda melainkan cukup bersuara jadi anda bisa lebih fokus
berkendara.
Cara
penggunaan aplikasi ini cukup mudah. berikut ini adalah langkah-langkahnya :
- Buka aplikasi Voice Search di hanphone anda.
- Ketika aplikasi dibuka, akan terdapat icon mic klik icon tersebut sampai icon mic berubah.
- Ketika icon mic tersebut berubah warna menjadi merah dan muncul gelombang disekita icon tersebut, itu berati bahwa anda sudah bisa melakukan pencarian dengan menggunakan perintah suara. nah untuk mulai mencari dekatkan handphone anda dengan mulut anda dan mulai berbicara tentang artikel yang ingin anda cari. dan aplikasi ini akan langsung mulai bekerja sebagai contoh saya berbicara / bersuara “boom”.
Tidak ada komentar:
Posting Komentar