Ahli : Masuk |Pendaftaran |Naik pengetahuan
Carian
Pengenalan suara [Pengubahsuaian ]
Pengiktirafan ucapan adalah sub-bidang antara disiplin linguistik pengkomputeran yang membangunkan metodologi dan teknologi yang membolehkan pengiktirafan dan terjemahan bahasa lisan menjadi teks oleh komputer. Ia juga dikenali sebagai "pengecaman pertuturan automatik" (ASR), "pengenalan pertuturan komputer", atau hanya "ucapan untuk teks" (STT). Ia menggabungkan pengetahuan dan penyelidikan dalam bidang linguistik, sains komputer, dan bidang kejuruteraan elektrik.
Sesetengah sistem pengecaman pertuturan memerlukan "latihan" (juga dikenali sebagai "pendaftaran") di mana seorang pembicara individu membaca teks atau perbendaharaan kata terpencil ke dalam sistem. Sistem ini menganalisis suara khusus seseorang dan menggunakannya untuk menyempurnakan pengiktirafan ucapan orang tersebut, mengakibatkan peningkatan ketepatan. Sistem yang tidak menggunakan latihan dipanggil "pembicara bebas" sistem. Sistem yang menggunakan latihan dipanggil "bergantung kepada speaker".
Aplikasi pengiktirafan pertuturan termasuk antara muka pengguna suara seperti pendailan suara (contohnya "Panggilan rumah"), panggilan routing (contohnya "Saya ingin membuat panggilan mengumpul"), alat kawalan domotic, cari (misalnya mencari podcast di mana perkataan tertentu diucapkan ), kemasukan data mudah (cth. memasuki nombor kad kredit), penyediaan dokumen berstruktur (contohnya laporan radiologi), pemprosesan teks (misalnya, pemproses perkataan atau emel) dan pesawat udara (biasanya disebut input suara langsung) .
Istilah pengiktirafan suara atau pengenalan pembesar suara merujuk kepada mengenal pasti penceramah, daripada apa yang mereka katakan. Menyedari pembesar suara dapat memudahkan tugas menerjemahkan ucapan dalam sistem yang telah dilatih pada suara orang tertentu atau ia boleh digunakan untuk mengesahkan atau mengesahkan identiti pembicara sebagai sebahagian daripada proses keselamatan.
Dari perspektif teknologi, pengiktirafan ucapan mempunyai sejarah yang panjang dengan beberapa gelombang inovasi utama. Baru-baru ini, bidang ini mendapat manfaat daripada kemajuan dalam pembelajaran mendalam dan data besar. Kemajuan itu dibuktikan bukan sahaja oleh lonjakan kertas akademik yang diterbitkan dalam bidang, tetapi lebih penting lagi oleh penerapan industri di seluruh dunia dalam pelbagai kaedah pembelajaran mendalam dalam merancang dan menggerakkan sistem pengenalan suara. Pemain industri pertuturan ini termasuk Google, Microsoft, IBM, Baidu, Apple, Amazon, Nuansa, SoundHound, IflyTek, CDAC yang kebanyakannya telah mempublikasikan teknologi teras dalam sistem pengenalan ucapan mereka berdasarkan pembelajaran mendalam.
[Linguistik komputasi][Linguistik][Perbendaharaan kata][Pemproses kata][Apple Inc][Amazon: syarikat][Komunikasi Nuance]
1.Sejarah
1.1.Kerja awal
1.2.Pengiktirafan ucapan praktikal
1.3.Sistem moden
2.Model, kaedah, dan algoritma
2.1.Model Markov tersembunyi
2.2.Pengiktirafan ucapan berdasarkan dinamik warping (DTW)
2.3.Rangkaian saraf
2.3.1.Rangkaian neural yang berterusan dan berulang
2.4.Pengiktirafan ucapan automatik akhir-ke-akhir
3.Permohonan
3.1.Sistem dalam kereta
3.2.Penjagaan kesihatan
3.2.1.Dokumentasi perubatan
3.2.2.Penggunaan terapeutik
3.3.Tentera
3.3.1.Pesawat pejuang berprestasi tinggi
3.3.2.Helikopter
3.3.3.Latihan pengawal trafik udara
3.4.Telefoni dan domain lain
3.5.Penggunaan dalam pendidikan dan kehidupan seharian
3.6.Orang kurang upaya
3.7.Permohonan lanjut
4.Prestasi
4.1.Ketepatan
4.2.Kebimbangan keselamatan
5.Maklumat lanjut
5.1.Persidangan dan jurnal
5.2.Buku
5.3.Perisian
[Memuat naik More Kandungan ]


Copyright @2018 Lxjkh