Компания-разработчик моделей искусственного интеллекта значительно расширила возможности своего нового продукта.
Компания OpenAI презентовала новую модель искусственного интеллекта — GPT-4o. Она быстрее и точнее старой и обладает более широкими функциями.
Среди обновлений, которые компания представила в понедельник, были возможность загружать изображения, аудио и текстовые документы для анализа моделью. Например, GPT-4o по фотографии ресторанного меню сможет перевести название блюд, рассказать об их истории и дать рекомендации.
Также с чат-ботом можно будет общаться по видео, и, например, попросить его объяснить происходящее в кадре. Эти функции OpenAI будет внедрять постепенно, чтобы обеспечить их безопасное использование.
«GPT-4o («o» от «omni») — это шаг к гораздо более естественному взаимодействию человека с компьютером: он принимает в качестве входных данных любую комбинацию текста, звука и изображения и генерирует любую комбинацию выходных текста, аудио и изображений. Он может реагировать на аудиовход всего за 232 миллисекунды, в среднем 320 миллисекунд, что аналогично времени реакции человека в разговоре», — говорится на сайте компании-разработчика.
Новая модель чат-бота поддерживается более чем на 50 языках, в том числе на казахском. Она также умеет моментально переводить сказанное и запоминать диалоги. Пока ChatGPT-4o доступен бесплатно, однако при оформлении платной подписки лимит взаимодействия с ПО увеличится в пять раз.
Ранее сообщалось, что в Казахстане появится аналог Chat-GPT на государственном языке. Продукт должен быть разработан к концу 2024 года.