"ВКонтакте" открыла для сторонних разработчиков доступ к технологиям распознавания речи
Технология распознавания работает на двух моделях: первая - нейтральная - подходит для распознавания более разборчивой речи, как в телешоу или интервью, а вторая - спонтанная - отвечает за распознавание обыденной речи
САНКТ-ПЕТЕРБУРГ, 22 сентября. /ТАСС/. Социальная сеть "ВКонтакте" разрешила сторонним разработчикам использовать технологию для расшифровки голосовых сообщений и их перевода в текст. Об этом рассказал технический директор "ВКонтакте" Александр Тоболь на открытии конференции Saint HighLoad++.
"Мы считаем важным помогать рынку и уже делимся широким набором собственных уникальных технологий. Каждый месяц пользователи "ВКонтакте" отправляют более 2 млрд голосовых. Применение технологии (ASR, Automatic Speech Recognition - прим. ТАСС) ограничено только вашей фантазией: можете сделать игру с голосовым управлением или с помощью чат-бота наконец добавить распознавание голосовых в какой-нибудь сторонний мессенджер", - сообщил Тоболь.
Технология распознавания работает на двух моделях, пояснили в пресс-службе. Первая (нейтральная) подходит для распознавания более разборчивой речи, как в телешоу или интервью, а вторая (спонтанная) отвечает за распознавание обыденной речи. Технология во время распознавания умеет удалять из расшифровки шумы и паузы, понимает неразборчивую речь.
Открытое решение поддерживает расшифровку аудио до 100 минут в сутки. Для безлимитного использования технологии можно отправить заявку на электронную почту соцсети, объяснили в пресс-службе.