Neural mapping phonetic to sensorimotor maps

Pemrosesan suara neurokumputasi (Bahasa Inggris: Neurocomputational speech processing) merupakan bagian dari pemrosesan suara, dan bahasa (Speech language processing) dilakukan pada berbagai bidang seperti Ilmu Komputer (Pemrosesan Bahasa Alami, Natural Language Processing, NLP), Ilmu Bahasa (Komputasi Linguistik, Computational Linguistics), Elektro (Speech Recognition), Psikologi (Komputasi Psikolinguistik, Computational Psycholinguistics). Sejarah perkembangan pemrosesan suara, dan bahasa sejalan dengan perkembangan teknologi komputer. [1]

Tahapan perkembangan

sunting

Seiring dengan perkembangan teknologi komputer, berbarengan pula perkembangan pemrosesan suara yang terdiri dari beberapa tahap:

Patung Alan Turing

Tahap 1940–1960: Pada tahap ini, ada dua paradigma untuk pemrosesan suara: paradigma automata (yang melandasi teori bahasa formal, teori bahasa formal) dan paradigma probabilistik (yang melandasi teori informasi). Automata pertama kali muncul sebagai hasil dari model komputasi Turing, yang kemudian berkembang menjadi finite state automata dan ekspresi regular (Kleene, 1951 dan 1956). Model probabilistik untuk pemrosesan bahasa diciptakan oleh Shannon (1948)—juga dikenal sebagai Proses Markov Diskret. [1]

Noam Chomsky

Selanjutnya, Chomsky (1956) menciptakan grammar finite state (context-free) untuk bahasa alami.Model komputasi probabilistik untuk pemrosesan bahasa dan suara dikenal sebagai paradigma kedua. Pada titik ini, Shannon membuat metaphor untuk channel bising dan decoding untuk mentranslasi bahasa melalui media komunikasi. [1]

Tampilan Spektogram

Selain itu, Shannon memperkenalkan entropi sebagai ukuran kapasitas informasi suatu channel atau kandungan informasi suatu bahasa dari teori termodinarnika. Dia juga pertama kali menggunakan ukuran entropi untuk model probabilistik bahasa Inggris. Pada tahap ini, spektrogram pertama kali dibuat, memicu penelitian tentang fonetik, yang merupakan dasar pengenalan suara. Dari sinilah ditemukan mesin pengenalan suara pertama (1950).[1]

Dependent recognizer dengan model statistik yang mampu mengenali sepuluh digit yang mewakili dua format. Mesin yang dilatih dengan sepuluh speaker ini dapat mengenali sepuluh digit dari setiap speaker dengan akurasi 97–99%, berbasis template yang bergantung pada korelasi antara pola dan input.[1]

Tahap 1957–1970: Dua paradigma digunakan dalam penelitian pengenalan suara. Ahli komputer dan linguistik melakukan penelitian pada paradigma simbolik, sedangkan paradigma stokastik banyak dilakukan oleh ahli matematika dan teknik listrik.[1]

Mengikuti penelitian Chomsky, algoritma parsing dan algoritma AI (Joh McCarthy, Marvin Minsky, Claude Shannon, dan Nathaniel Rochester), jalur simbolik muncul. Pada titik ini, pemahaman bahasa alami yang sederhana mulai terbentuk, yang memungkinkan untuk memberikan jawaban atas pertanyaan. Berbagai sistem mulai dikembangkan dalam pendekatan stokastik, termasuk pengenalan karakter optik dan pengenalan teks (Bledsoe dan Browning), yang menggunakan metode Bayes. Pada titik ini, korpus yang memuat satu juta kata dibuat dari lima ratus teks dari berbagai sumber, termasuk novel, surat kabar, nonfiksi, dan akademik.[1]

Tahap 1970–1983: Pada periode ini, banyak penelitian dilakukan tentang pemrosesan ucapan dan bahasa menggunakan paradigma stokastik, dan logika. Beberapa penelitian tentang paradigma stokastik, seperti yang dilakukan oleh Jelinek, Bahl, dan Mercer, para ahli dari IBM dan Cameige Mellon University (CMU), termasuk penerapan Hidden Markov Model (HMM) untuk algoritma pengenalan suara dan metaphor dari kanal suara bising, dan decoding.[1]

Rabiner dan Juang (AT&T's Bell Labs) melakukan analisis suara, dan sintesis. Dalam paradigma logika (berbasis logika), penelitian terutama berfokus pada pengembangan gramar (gramar metamorphosis, gramar definite clause, dan gramar fungsional), serta struktur unifikasi. Penelitian tentang pemahaman bahasa alami saat ini sedang mengembangkan robot yang dapat menerima perintah dari teks berbahasa alami. Penelitian ini menggunakan model gramar, parsing, semantik, dan discourse.[1]

Referensi

sunting
  1. ^ a b c d e f g h i Agus Buono; Benyamin Kusumoputro; Wisnu Jatmiko (2009). "Sistem Pemrosesan Suara: Studi Kasus Perbandingan Power Spektrum dan Bispektrum pada Identifikasi Pembicara Menggunakan HMM". Seminar Nasional Teknologi Informasi. Pemeliharaan CS1: Banyak nama: authors list (link)

Pranala luar

sunting

📚 Artikel Terkait di Wikipedia

Ayu Purwarianti

Bahasa Inggris (2024), Expressive Conversational AI with Avatar and Speech Processing (2024), dan Prediksi Protein Pengikat DNA berbasis Capsule Network

Penerapan Kecerdasan Buatan

Pembelajaran Mendalam (Deep Learning), Pemrosesan Bahasa Alami (Natural Language Processing/NLP), dan Visi Komputer (Computer Vision). Dalam dunia pendidikan, kecerdasan

Pengenalan ucapan

Benesty, Jacob, M. Mohan Sondhi, dan Yiteng Huang (2008). Handbook of Speech Processing. Springer-Verlag. hlm. 6. ISBN 159904840X. Pemeliharaan CS1: Banyak

Gangguan pemrosesan pendengaran

1093/bmb/63.1.107. PMID 12324387. Auditory processing disorder: An overview for the clinician American Speech-Language-Hearing Association (ASHA) l b s

Bahasa Yunani Modern

Diarsipkan 2009-02-25 di Wayback Machine. of the Institute for Language & Speech Processing Audio example of Modern Greek Kursus Online course "Filoglossia" by

Linguistik komputasi

January 25, 2008) Language Technology World Resources for Text, Speech and Language Processing Diarsipkan 2019-10-25 di Wayback Machine. The Research Group

Model bahasa besar

"Language Models are Few-Shot Learners" (PDF). Advances in Neural Information Processing Systems. 33. Curran Associates, Inc.: 1877–1901. Manning, Christopher

Pe̍h-ōe-jī

Pemeliharaan CS1: Banyak nama: authors list (link) Iûⁿ Ún-giân (2009). Processing Techniques for Written Taiwanese – Tone Sandhi and POS Tagging (Doctoral