Компания OpenAI представила последнюю версию технологии, которая лежит в основе ее чатбота ChatGPT.
GPT-4o будет доступен всем пользователям предыдущей версии, включая и тех, кто не платит подписку за пользование сервисом.
Как утверждают разработчики, новая версия работает быстрее предыдущей и ведет себя более раскованно — может позволить себе немного поболтать, а то и пофлиртовать.
GPT-4o может считывать изображения и обсуждать увиденное, переводить с одного языка на другой и определять эмоции по выражению лица. Бот, в отличие от прежних версий, также может запоминать предыдущие беседы.
Его можно прерывать на полуслове, и у него более легкий разговорный ритм — на демонстрации задержки между вопросом и ответом практически не было.
Компания OpenAI заявила, что будет внедрять новые функции постепенно, чтобы обеспечить их безопасное использование.
Новая модель — это шаг вперед в области искусственного интеллекта, убеждена главный технический директор OpenAI Мира Мурати. "Мы смотрим на будущее взаимодействия между нами и машинами, — говорит Мурати. — И мы считаем, что GPT-4o действительно меняет эту парадигму".
Во время демонстрации голосовой версии GPT-4o он не просто решил простое уравнение, написанное на листе бумаги, но и дал полезные рекомендации о том, как его решить. Он анализировал компьютерный код, переводя с итальянского на английский, и интерпретировал эмоции на фотографии улыбающегося человека.
В ходе демонстрации бот, говоривший женским голосом с американским акцентом, приветствовал обращавшихся к нему людей, а если его хвалили, отвечал: "Хватит, вы заставляете меня краснеть!".
Один исследователь попросил бот считать выражение его лица и определить, какие эмоции тот испытывает. GPT-4o посчитал, что он выглядит "счастливым и жизнерадостным, с широкой улыбкой и, возможно, даже с оттенком волнения". "Что бы ни происходило, похоже, у вас отличное настроение, — сказал бот. — Не желаете поделиться источником этих положительных эмоций?"
Разумеется, не всё во время презентации пошло по плану: в какой-то момент GPT-4o принял улыбающегося человека за деревянную поверхность, потом принялся решать уравнение, которое ему еще не показали. По-видимому, прежде чем стать надежным и, главное, безопасным помощником человека, искусственному интеллекту еще далеко.
Однако на сегодняшний день OpenAI, похоже, ставит перед собой не столь грандиозные задачи: сделать GPT-4o цифровым помощником нового поколения, своего рода Siri или Alexa на форсаже, который помнит предыдущие вопросы, которые ему задавали, и может отвечать не только голосом или текстом.
В целом презентация прошла вполне успешно, однако критики отметили, что на ней не прозвучало ни слова о том, насколько "экологичным" будет GPT-4o.
Искусственный интеллект — значительно более энергоемкое дело, чем традиционные вычислительные задачи, и чем "умнее" он становится, тем более серьезные вычислительные мощности ему требуется. На презентации OpenAI этот вопрос обошли стороной.
Делать слишком далеко идущие выводы о преимуществах нового чатбота тоже не следует: тщательно срежиссированная презентация разработчиков и работа с реальными пользователями — это не одно и то же.
Но перспективы у него, судя по всему, очень неплохие.
По-видимому, OpenAI не собирается останавливаться на достигнутом: на минувшей неделе появились слухи, что компания запускает поисковик — конкурент Google.
Агентство Reuters, однако, позже сообщило, что компания отложила запуск проекта. Генеральный директор OpenAI Сэм Альтман отметил, что запуск GPT-4o не связан с разработкой поискового сервиса, но в пятницу написал в соцсети Х: "Мы прилежно трудимся над некоторыми новыми штуками, которые, как мы думаем, понравятся людям! Для меня это похоже на волшебство".
Как сообщал Bloomberg, OpenAI вот-вот заключит соглашение с Apple по внедрению своих разработок в области ИИ в операционную систему для iPhone.
У Apple нет своего собственного чатбота, аналогичного GPT-4o или Gemini от Google, и компания в последнее время пытается направить в эту область новые ресурсы. GPT-4o может предложить более продвинутые функции, чем те, которые предоставляет встроенный голосовой помощник Siri.
Финансовая поддержка технологического гиганта не помешает: OpenAI все чаще обвиняют в том, что она использует материалы в СМИ для тренировки своих моделей искусственного интеллекта без компенсации или даже согласия издателей.
Например, в декабре прошлого года New York Times подала иск против OpenAI и Microsoft (которая финансово поддерживает OpenAI, хотя и разрабатывает свой собственный генеративный чатбот) о нарушении авторских прав.
В нем утверждается, что, хотя компании брали информацию из многих источников для создания своих систем, они уделяли контенту New York Times особое внимание, "стремясь задаром воспользоваться огромными инвестициями Times в журналистику, используя ее для создания замещающих продуктов без разрешения или оплаты".
За использование материалов, защищенных авторским правом, на OpenAI не раз подавали в суд и авторы художественных произведений.