Представлена новая модель ИИ Gemini 2.0 от Google, которая стала предельно универсальной — она генерирует текст, звук и изображения, а также предлагает новые мультимодальные возможности, которые закладывают основу для следующего большого этапа в развитии ИИ: агентов, которые в буквальном смысле могут заменить пользователя в рутинных операциях. Новая модель также стала заметно производительнее и энергоэффективнее.
Gemini 2.0 была представлена примерно через 10 месяцев после выхода версии 1.5. Генеральный директор Google DeepMind, Демис Хассабис, называет новую модель «всеобъемлющей» и высоко оценивает её потенциал, хотя Gemini 2.0 всё ещё находится на стадии «экспериментального предварительного просмотра» по определению Google. Тем не менее, Хассабис уверен, что новая модель предложит совершенно новый уровень возможностей, особенно в области агентского ИИ.
Агентскими ИИ называют ботов, способных действовать от имени пользователя. Примером такого ИИ является Project Astra от Google — визуальная система, которая умеет распознавать объекты, помогает ориентироваться в пространстве и находить пропавшие вещи. Как отметил Хассабис, функционал Astra в обновленной версии Gemini 2.0 значительно расширился.
План Google относительно Gemini 2.0 заключается в том, чтобы использовать её абсолютно везде. Google ставила своей целью внедрить как можно больше функций в единую модель, а не запускать множество отдельных разрозненных продуктов. Gemini 2.0 на данный момент находится на экспериментальной стадии, причём только в облегчённой версии Gemini 2.0 Flash. Выход окончательной версии запланирован на начало следующего года.
Горячие темы