Компания OpenAI представила нейросеть Voice Engine.
OpenAI презентовала инновационную нейросеть под названием Voice Engine, способную воспроизводить голос любого человека на основе 15-секундного аудиообразца, сообщает РБК со ссылкой на организацию.
После клонирования голоса пользователь может ввести текст в Voice Engine и получить результат, сгенерированный ИИ. Аудио воспроизводит нужные эмоции, акцент и может быть переведено на другие языки. Разработчики считают, что Voice Engine будет полезен для людей, имеющих проблемы с речью, а также поможет пациентам восстановить голос.
Эта технология уже используется в устном варианте разговора с ChatGPT, выпущенным в сентябре прошлого года, а также через текстовый API OpenAI для синтеза речи. Однако компания пока не готова предоставить широкий доступ к этой модели из соображений этики и безопасности. Сейчас Voice Engine тестируют вместе с избранными компаниями-партнерами.
OpenAI также отмечает, что голосовая технология сопряжена с серьезными рисками, поэтому там «внедрили ряд мер безопасности, в том числе водяные знаки, для отслеживания происхождения всякого звука, генерируемого Voice Engine, а также мониторинг того, как используется модель».