«ВКонтакте» усовершенствовала технологию распознавания голосовых сообщений

12:41 пт, 27 ноября, 2020

«ВКонтакте» усовершенствовала технологию распознавания голосовых сообщений, сообщили в пресс-службе социальной сети. Теперь всего за секунду можно расшифровать записи продолжительностью до двух минут. Это 99% всех аудио, которые отправляют пользователи, уточнила команда «ВКонтакте».

Кроме того, можно записать голосовое длительностью до часа. Чтобы переводить в текст такие продолжительные записи и не жертвовать скоростью разработчики «ВКонтакте» нашли новое технологическое решение. Алгоритмы автоматически разбивают длинное аудио на короткие блоки. Расшифровка идет одновременно, а затем объединяется обратно в одно сообщение.

«Технология распознавания аудио помогает любителям и ненавистникам голосовых сообщений общаться друг с другом в удобном формате, а ещё экономит время — прочитать расшифровку можно быстрее, чем прослушать аудио», — сказал Сергей Ларионенко, старший разработчик команды Core Infrastructure «ВКонтакте».

Он также сообщил, что решение состоит из нескольких нейросетей, выдерживает высокую нагрузку, понимает русскоязычный сленг и показывает хорошие результаты даже при сложных условиях записи — например, посторонних шумах или скомканной речи.

Голосовые сообщения продолжают оставаться самым популярным типом вложений в мессенджере «ВКонтакте», обгоняя фотографии и файлы. С момента запуска технологии в июне аудитория, которая пользуется голосовыми, выросла на 10% — сейчас она составляет 33 миллиона человек в месяц. В среднем каждый пользователь сервиса читает 8 расшифровок в день.

Ранее «ВКонтакте» преобразовала раздел «Сообщения» в «Мессенджер»: к звонкам и чатам добавилась возможность написать человеку по номеру телефона.

 

Поделиться в соцсетях