Sukses

Microsoft Rilis Teknologi Speech to Text untuk Developer

Microsoft mengumumkan pratinjau privat Custom Recognition Intelligence Service dan pratinjau publik dua set antarmuka pemrogaman aplikasi.

Liputan6.com, Jakarta - Microsoft baru saja mengumumkan pratinjau privat (private preview) baru dari Custom Recognition Intelligence Service (CRIS), yakni sebuah alat yang sangat bisa disesuaikan, yang menawarkan fungsi mengubah ucapan menjadi teks (speech-to-text) mirip dengan aplikasi Siri.

Tak hanya itu, berdasarkan informasi yang dihimpun dari Venture Beat, Selasa (15/12/2015), Microsoft membuka pratinjau publik untuk dua set antarmuka pemrograman aplikasi (Application Programming Interface, API), yang menawarkan para developer (pengembang) teknologi, kemampuan untuk memahami siapa yang bicara dalam rekaman audio dan apa yang muncul di video.

Semua teknologi ini dikerjakan di bawah Oxford Project, sebuah inisiatif untuk memberikan kesempatan pada pengembang pihak ketiga untuk mengakses kecerdasan buatan (Artificial Intelligence) yang telah Microsoft bangun selama bertahun-tahun. Tidak lupa, Google juga tengah menggarap proyek serupa, misalnya dengan merilis dari Cloud Vision API.


Tak kalah menarik, Microsoft juga mengumumkan alat pendeteksi emosi di Oxford Project bulan lalu. Mereka mengumumkan bahwa versi beta publik untuk pengenalan pembicara (speaker recognition) akan tersedia pada akhir tahun ini. Sekarang, manajer program senior teknologi dan riset Microsoft, Ryan Galgon, mengatakan bahwa teknologi itu telah tersedia.

Sementara API audio dapat memverifikasi dan mengidentifikasi pembicara, API video dapat melacak wajah, mendeteksi gerakan untuk latar belakang diam, dan menstabilkan konten video. Namun yang jauh lebih menarik di sini adalah CRIS. Berikut deskripsi yang Microsoft sajikan bulan lalu:

Alat ini memudahkan orang untuk menyesuaikan pengenalan suara untuk lingkungan yang menantang, seperti ruang publik yang bising. Sebagai contoh, sebuah perusahaan dapat menggunakannya untuk membantu sebuah tim menggunakan alat pengenalan suara secara lebih baik saat bekerja di lantai toko yang berisik atau pusat perbelanjaan yang sibuk. Hal ini juga dapat digunakan untuk membantu sebuah aplikasi memahami orang-orang yang secara tradisional bermasalah dengan pengenalan suara, seperti orang-orang yang bukan penutur asli (non-native speaker) atau penyandang disabilitas.


Ketika pengembang mendaftar untuk menggunakan layanan ini, Microsoft akan mengajukan pertanyaan apakah mereka familiar dengan teknologi speech-to-text seperti HTK, Kaldi, dan SRILM, atau hanya pengguna teknologi asisten pribadi digital dari Google, Apple, atau, tentu saja Microsoft sendiri.

"Beberapa tahun terakhir (kami) menyaksikan peningkatan luar biasa dalam kinerja sistem pengenalan pembicara,"  tandas Galgon.

Sekarang pengembang dapat mengambil keuntungan dari teknologi di bidang ini yang telah Microsoft sediakan bersama-sama.

(Why/Isk)*

* Fakta atau Hoaks? Untuk mengetahui kebenaran informasi yang beredar, silakan WhatsApp ke nomor Cek Fakta Liputan6.com 0811 9787 670 hanya dengan ketik kata kunci yang diinginkan.

Video Terkini