OpenAI ускоряет создание голосовых помощников: новые инструменты для разработчиков

На ежегодном DevDay 2024 OpenAI анонсировала революционные обновления, позволяющие разработчикам значительно упростить создание голосовых приложений на базе ИИ — теперь общение с виртуальными помощниками станет еще быстрее и реалистичнее.

На DevDay 2024 OpenAI представила инновационные инструменты для разработчиков, которые призваны сделать процесс создания приложений на основе ИИ более быстрым и эффективным, пишет Hightech. Одним из главных нововведений стал Realtime API, который позволяет разрабатывать голосовые интерфейсы практически в режиме реального времени, предоставляя выбор из шести новых голосов. Эти голоса отличаются от тех, что используются в ChatGPT, и не допускают сторонних аналогов, чтобы избежать проблем с авторскими правами.

Раньше процесс создания голосовых помощников включал несколько этапов — от преобразования речи в текст до генерации ответа и обратного перевода в голос. Теперь всё это объединено в единый процесс, что значительно экономит время и упрощает разработку.

На презентации OpenAI продемонстрировала приложение для планирования поездок, использующее Realtime API: пользователи могут голосом запрашивать информацию о путешествии в Лондон, а приложение отвечает мгновенно, отмечая на карте рестораны и другие важные места. Более того, Realtime API способен общаться по телефону с человеком для заказа еды или других услуг, интегрируясь с приложениями для звонков, такими как Twilio.

Дополнительно OpenAI представила новые инструменты для улучшения ИИ-моделей с помощью изображений и текста, а также функцию быстрого кэширования, которая позволяет сократить затраты на генерацию контента, повторно используя уже обработанные данные.