Исследователи Apple выпустили новую модель, которая позволяет пользователям простым языком описывать то, что они хотят изменить на фотографии, даже не прикасаясь к программному обеспечению для редактирования.
Модель MGIE, над которой Apple работала совместно с Калифорнийским университетом в Санта-Барбаре, позволяет обрезать, изменять размер, переворачивать и добавлять фильтры к изображениям с помощью текстовых подсказок.
MGIE, что означает MLLM-Guided Image Editing, может применяться для простых и более сложных задач редактирования изображений, таких как изменение определенных объектов на фотографии, чтобы придать им другую форму или сделать их ярче. Модель учится интерпретировать подсказки пользователя. Затем он «воображает», как будет выглядеть редактирование (например, запрос на более синее небо на фотографии приводит к увеличению яркости части изображения с небом).
Горячие темы