Docotel Official Blog
Docotel_ComputerVision

Peranan Computer Vision dan Speech Recognition, Atasi Problematika Komunikasi Penyandang Disabilitas

Terlahir dengan kehilangan fungsi pendengaran tentu bukan harapan semua orang yang lahir di dunia. Namun, pada kenyataanya ada orang yang harus mengalami gangguan pendengaran. Berdasarkan catatan World Health Organization (WHO) pada tahun 2018, kasus kehilangan pendengaran atau tuli diperkirakan terdapat 466 juta orang di seluruh dunia. Sekitar 7 persen atau 34 jutanya adalah anak-anak. Jumlah tersebut melonjak dari angka 360 juta orang penderita gangguan pendengaran lima tahun lalu.

Kehilangan fungsi pendengaran tentunya akan mempengaruhi orang dalam banyak hal seperti kemampuan berkomunikasi atau berbicara. Hal tersebut kemungkinan terjadi pada orang disabilitas pendengaran sebelum mengenal bahasa, sehingga menyebabkan ketidakpahaman pada suatu bahasa dan tidak dapat menyampaikan struktur bahasa ketika berkomunikasi. Lalu, bagaimana cara orang tuli berkomunikasi? Atau bagaimana cara untuk memahami apa yang dikatakan orang tuli?

Dalam mengatasi permasalahan komunikasi tersebut maka bahasa isyarat adalah jawabannya. Bahasa ini digunakan untuk berkomunikasi dengan menggunakan body language (bahasa tubuh)  seperti gerak bibir, tangan, tubuh, ekspresi wajah, hingga pandangan mata. Tidak hanya itu, bahasa isyarat juga diciptakan berdasarkan gerakan-gerakan yang sudah disepakati maknanya dan digunakan untuk bertukar informasi sehingga dengan begitu sangat membantu dalam mengurangi mis komunikasi.

Namun, apakah kamu tahu? Kendati bahasa isyarat telah diciptakan untuk berkomunikasi dengan orang tuli rupanya tidak semua orang mengerti dan menguasainya. Selain itu, terdapat 300 bahasa isyarat yang berbeda dan tersebar di dunia. Misalnya di Amerika, bahasa isyarat yang digunakan adalah American Sign Language (ASL). Sementara di Indonesia, terdapat dua bahasa isyarat yang dapat digunakan yaitu Bahasa Isyarat Indonesia (BISINDO) dan Sistem Isyarat Bahasa Indonesia (SIBI).

Biasanya setiap bahasa isyarat memiliki perbedaan dalam mengisyaratkan abjad. Pengisyaratan abjad dapat ditunjukkan hanya dengan satu atau dua tangan. Begitupun makna dari gerakan tangan, bisa memiliki arti yang berbeda dari setiap bahasa isyarat. Sekarang kamu mulai menyadari kalau bahasa isyarat ternyata sangat kompleks dan beragam, bukan? Namun, bagi kamu yang ingin mempelajari bahasa isyarat atau jika akan berkomunikasi dengan orang disabilitas pendengaran maka tidak perlu dikhawatirkan jika hidup di tengah kecanggihan teknologi.

SignAll, Si Computer Vision yang Permudah Komunikasi
Peranan Computer Vision dan Speech Recognition, Atasi Problematika Komunikasi Penyandang Disabilitas 1
Sumber: www.nanalyze.com

Kini dengan menggunakan teknologi kamu dapat memahami apa yang dikatakan oleh orang tuli ataupun sebaliknya. Sebagai contoh ada SignAll, produk besutan startup Hongaria yang dibangun sejak tahun 2016, menggunakan computer vision dalam menerjemahkan bahasa isyarat ASL menjadi bahasa tertulis. SignAll menawarkan solusi bagi satu juta orang Amerika yang tuli dalam memudahkan komunikasi. Selain computer vision, adapun ilmu dan teknologi pemrosesan bahasa alami yang disematkan dalam produk ini sehingga mampu menerjemahkan kalimat secara lengkap.

SignAll adalah salah satu perangkat yang memungkinkan proses komunikasi terjadi secara spontan antara orang tuli dan seseorang yang dapat mendengar. Cara kerjanya, orang tuli terlebih dulu harus mengenakan sepasang sarung tangan berwarna-warni (warna pada sarung tangan membantu teknologi untuk membedakan gerakan dengan lebih akurat), lalu menghadap ke kamera dan Personal Computer (PC). Nantinya kamera akan mendeteksi informasi termasuk ekspresi wajah dan gerakan. Sementara, orang yang dapat mendengar dan berbicara secara normal maka ucapannya akan diterjemahkan ke layar orang tuli menggunakan pemrosesan bahasa alami. Dalam pengimplementasiannya, SignAll dapat digunakan di dunia perekrutan karyawan.

Saat ini, SignAll telah mengumpulkan basis data atau database 250.000 gambar secara manual, yang kemudian kumpulan data itu digunakan untuk melatih algoritme produk tersebut. Perusahaan Hongaria tersebut berencana ke depannya orang dengan disabilitas pendengaran tidak perlu lagi menggunakan sarung tangan karena sistem telah dilatih dan belajar membaca bahasa isyarat dengan sangat baik. SignAll telah berhasil dimplementasikan sebagai proyek percontohan di Washington, D.C. di Universitas Gallaudet, Houston, dan Salt Lake City, Amerika Serikat.

Dari Suara ke Teks dengan Live Transcribe
Peranan Computer Vision dan Speech Recognition, Atasi Problematika Komunikasi Penyandang Disabilitas 2
Sumber: opensource.googleblog.com

Adapun Live Transcribe yang dikembangkan oleh Google, hadir untuk memecahkan masalah komunikasi bagi orang-orang dengan disabilitas pendengaran. Live Transcribe disajikan berupa aplikasi yang mampu mendengar ucapan lalu menuliskan semuanya di layar smartphone secara real-time. Kemudian, kamu juga dapat berinteraksi dengan menuliskan respons di aplikasi tersebut secara langsung. Dengan menerapkan teknologi speech recognition, aplikasi ini mampu membedakan kata ‘too‘ dan ‘two‘ atau your‘ dan ‘you’re‘ meski seseorang terbiasa mengucapkannya secara serupa berdasarkan konteks kalimat.

Hebatnya lagi, aplikasi ini didukung dengan sistem pengenal suara recurrent neural network berbasis cloud yang secara terus-menerus dapat mempelajari ucapan orang dan terdapat fitur auto-correct. Live Transcribe juga mahir mengelompokkan 570 tipe berbagai jenis bunyi mulai tangisan bayi hingga gonggongan anjing. Pengguna dapat memilih 70 bahasa dan dialek seperti bahasa sunda dan jawa, dan dilengkapi dengan fitur dua bahasa sehingga memudahkan pengguna dalam mengubah bahasa.

Live Transcribe saat ini bisa ditemukan langsung di Google Pixel 3 atau mengunduh versi beta-nya di Google Play. Langkah berikutnya setelah terinstal pengguna perlu menentukan bahasa dan baru setelah itu dapat menggunakannya. Terkait keamanan data, pihak Google menjamin segala percakapan yang terekam tidak akan tersimpan di server maupun ponsel pengguna. Jadi, ketika suara diproses maka Live Transcribe akan menampilkannya dalam bentuk teks di layar ponsel dan data suara pun secara otomatis terhapus, hal ini tentunya akan menjaga privasi pengguna.

Itulah tadi pemanfaatan teknologi computer vision dan speech recognition untuk mengatasi masalah komunikasi. Perkembangan teknologi yang semakin pesat tidak menutup kemungkinan akan ada aplikasi atau perangkat keras baru lainnya dalam membantu dan mempermudah proses berkomunikasi bagi orang-orang dengan disabilitas pendengaran. Terus ikut blog docotel untuk cari tahu informasi terbaru tentang kemajuan teknologi lainnya, ya!

Tentang Docotel

Docotel 4.0 meliputi tim yang berdedikasi, berpengalaman, dan ahli dalam menyediakan produk dan solusi yang bernilai tinggi di semua industri. Kami hadir dengan visi mengatasi permasalahan sehingga dapat menciptakan pengalaman terbaik bagi klien.

Avatar photo

Lukman M. Ardiansyah

Add comment

Follow us

Don't be shy, get in touch. We love meeting interesting people and making new friends.

Most discussed

Advertisement