В сотрудничестве с исследователями Калифорнийского университета Apple выпускает модель редактирования изображений MGIE с открытым исходным кодом на базе искусственного интеллекта и инструкциями на естественном языке.

Apple запустила новую модель редактирования изображений с использованием искусственного интеллекта, MGIE, в сотрудничестве с исследователями из Калифорнийского университета. MGIE, что означает MLLM-Guided Image Editing, использует мультимодальные модели большого языка (MLLM) и позволяет пользователям редактировать изображения на основе инструкций на естественном языке. Модель была представлена ​​в докладе на Международной конференции по обучению представлений 2024 года, демонстрируя ее способность улучшать автоматические показатели и человеческую оценку, сохраняя при этом эффективность конкурентного вывода.

February 07, 2024
4 Статьи

Дополнительное чтение