Pembaca Dokumen Otomatis untuk Tunanetra

Tanpa kacamata berlensa minus delapan, Anto Satriyo Nugroho tidak bisa membaca buku secara jelas, tulisan-tulisan yang tertera di buku tampak kabur. Indra pelihatan Anto memang lemah sejak dia berusia 8 tahun. Karenanya, perekayasa di Badan Pengkajian dan Penerapan Teknologi (BPPT) itu kerap kebingungan ketika menjalankan aktivitas, terlebih pada saat melakukan penelitian di laboratorium atau mengajar di sejumlah perguruan tinggi di Jakarta jika tidak mengenakan kacamata. Kendati sangat bergantung pada alat bantu pelihatan itu, Anto tetap bersyukur.

Pasalnya, berkas pantulan cahaya dari benda-benda di sekitarnya masih bisa terlihat terang benderang ketika dia memakai kacamata. “Saya tidak bisa membayangkan kalau dunia ini menjadi gelap gulita,” bisik hati kecil Anto. Rasa syukur itu acap kali hadir pula ketika Anto membandingkannya dengan segala keterbatasan yang dialami para tunanetra. Sampai sekarang, sebagian besar penyandang tunanetra masih kesulitan mengakses informasi tekstual. Hanya melalui huruf Braille-lah mereka dapat mengakses sumber informasi tekstual. Braille merupakan sejenis tulisan atau cetakan sentuh untuk para tunanetra.

Tulisan itu berupa kode yang terdiri dari enam titik dengan pelbagai kombinasi yang ditonjolkan pada kertas sehingga dapat diraba. Penyandang tunanetra bisa mengakses informasi dalam buku cetak jika hurufnya sudah diganti Braille. Namun, yang jadi permasalahan, jumlah produsen buku khusus untuk tunanetra masih sangat minim. Begitu pula halnya dengan waktu yang dibutuhkan untuk mengonversi dari huruf cetak ke Braille cukup lama. Imbas nya, tidak semua buku cetak yang dibutuhkan para tunanetra bisa dikonversi ke dalam Braille.

Kalau pun dikonversi, tidak semua penyandang tunanetra dapat membaca buku khusus tersebut karena dibutuhkan keterampilan dan latihan untuk dapat membaca huruf Braille. Sejumlah yayasan tunanetra berusaha menyiasati permasalahan tersebut dengan mengundang orang yang bersedia membacakan isi buku cetak. Meski demikian, cara tersebut dianggap belum optimal karena harus melibatkan banyak orang untuk membacakan buku. Bisa jadi, satu orang penyandang tunanetra harus memiliki pendamping khusus untuk membacakan buku.

Para ilmuwan pun kemudian mengembangkan cara lain agar para tunanetra bisa mengakses informasi tekstual dengan lebih mudah dan mandiri, yakni dengan menggunakan speech screen reading. Perangkat lunak itu memungkinkan tunanetra yang menggunakan komputer bisa mengakses informasi tekstual pada layar monitor (screen reader) lewat suara. Sayangnya, penggunaan perangkat lunak itu belum dapat memecahkan persoalan secara utuh.

Pasalnya, harga speech screen reading yang beredar di pasaran internasional, semisal JAWS masih terlalu tinggi bagi para tunanetra. Satu paket perangkat lunak dibanderol harga sekitar delapan juta rupiah. Selain itu, perangkat lunak tersebut juga masih menggunakan dialek bahasa asing sehingga kerap membingungkan para tunanetra. Situasi yang dialami penyandang tunanetra tersebut lantas memotivasi Anto bersama koleganya di BPPT dan sejumlah perguruan tinggi untuk mengembangkan perangkat lunak automatics document reader.

Sistem cerdas itu bisa membantu penyandang tunanetra mengakses bermacam-macam informasi tekstual lewat suara. Informasi tekstual yang bisa diakses tidak terbatas pada teks yang telah ada di layar monitor komputer (screen reader), tetapi juga teks (text reader) semisal di buku cetak. Untuk teks yang berasal dari media cetak (hard copy), seperti buku, majalah, atau koran harus dipindai dulu dengan alat pemindai (scanner) beresolusi minimal 200 dot per inci (dpi). Lalu, data digital hasil pemindaian diproses sedemikian rupa lewat perangkat lunak automatics document reader menjadi suara.

Proses Konversi

Lebih terperinci, Anto menjelaskan, perangkat lunak automatics document reader merupakan gabungan dari teknologi optical character recognition (OCR) dan text to speech synthesizer (TTS). Teknologi OCR merupakan sistem komputer yang dapat mengonversi gambar dari hasil pemindaian ke sebuah dokumen tekstual menjadi teks. Proses konversi diawali dengan memindai dokumen (hard copy) menjadi suatu file gambar dengan alat pemindai. Lalu, bagian-bagian gambar yang tidak diperlukan dihilangkan dalam tahap preprocessing, misalnya kalau gambar hasil pemindaian itu ada yang kotor maka akan dibersihkan.

“Intinya, tahap preprocessing tersebut diperlukan untuk memudahkan proses selanjutnya, yaitu segmentasi,” jelas Anto. Segmentasi merupakan proses mengekstrak area teks dari suatu gambar. Dengan kata lain, memisahkan area pe nga matan pada setiap karakter yang akan dideteksi. Lalu, dinormalisasi dengan mengubah dimensi pengamatan dan ketebalan tiap karakter. Setelah proses segmentasi, selanjut nya masuk tahap pe ngenalan (recognition), yaitu proses me ngenali karakter yang diamati dengan cara membandingkan ciri-ciri karakter sesuai dengan basis data yang tersedia.

Sebagai contoh, gambar “M” diubah menjadi huruf M. Setelah sistem komputer berhasil mengubah gambar menjadi teks, maka dilakukan proses koreksi ejaan sesuai dengan bahasa yang digunakan. Tahap postprocessing untuk mencegah kesalahan komputer dalam mengenali bentuk huruf, contoh huruf “I” bisa saja dibaca komputer sebagai angka “1”. Tahap postprocessing itu menjadi penting agar ketika teks diubah menjadi suara dalam sistem TTS juga tidak salah, seperti kata “adil” dibaca “adii”, karena huruf “l” dibaca “i”.

“TTS adalah sistem untuk mengubah teks menjadi suara,” jelas Anto yang meraih gelar sarjana hingga doktor dari Nagoya Institute of Technology, Jepang. Dalam perangkat lunak automatics document reader, sistem TTS menggunakan perangkat lunak MBROLA yang dikembangakan Arry Akhmad Arman, dosen Sekolah Teknik Elektro dan Informatika (STEI), Institut Teknologi Bandung (ITB). Peranti lunak tersebut digunakan untuk mengubah perintah fonem tulisan ke format suara (wav) dengan basis data berdialek bahasa Indonesia.

Pada prinsipnya, jelas Anto, proses tersebut adalah konversi simbol tekstual menjadi simbol fonetik yang merepresentasikan unit terkecil suara dalam suatu bahasa. Cara untuk membaca dan pengucapan teks sangat spesifik untuk setiap bahasa. Hal itu menyebabkan implementasi sebuah teks menjadi unit converter fonem menjadi bahasa yang sangat spesifik.

“Jadi, sistem automatics document reader bekerja dengan mengonversi gambar sebagai hasil pemindaian ke dokumen tekstual ke dalam teks (fase OCR), kemudian diikuti oleh konversi dari teks ke suara dengan modul TTS,” urai Anto yang juga menjadi dosen di Swiss German University dan Universitas Al Azhar Indonesia. Automatics document reader telah diperkenalkan kepada publik pada konferensi regional tentang ASEAN dan Disabilitas pada pertengahan Desember 2010 di Hotel Bidakara, Jakarta.

Namun, perangkat lunak yang rencananya bisa diunduh secara cuma-cuma di internet itu sampai sekarang masih dalam tahap penyempurnaan. Hal itu dikarenakan suara yang dihasilkan masih seperti robot. Selain itu, sistem OCR masih belum dapat memilah secara tepat antara foto dan teks dalam sumber informasi tekstual. awm/L-2

Koran Jakarta [dot] com | Sabtu, 22 Januari 2011

Anto S Nugroho (alumni III Fis 2, Kasmaji 1989) | http://asnugroho.net

One Reply to “Pembaca Dokumen Otomatis untuk Tunanetra”

Leave a Reply

Your email address will not be published.

WhatsApp chat