Apple выпустила новую модель искусственного интеллекта с открытым исходным кодом под названием MGIE, которая позволяет редактировать изображения с помощью текстовых команд.
MGIE (MLLM-Guided Image Editing) использует большие мультимодальные языковые модели (MLLM) для интерпретации пользовательских команд и внесения изменений на уровне пикселей.
Шаблон может предлагать различные варианты редактирования — редактирование в стиле Photoshop (обрезка, поворот, добавление фильтров, удаление объектов), общую оптимизацию фотографий (яркость, контрастность, цветовой баланс) и локальное редактирование (редактирование областей или конкретных объектов).
MGIE доступен в проекте с Открытый источник на Гитхабе. Проект также предоставляет демонстрационный блокнот, демонстрирующий, как использовать MGIE для различных задач редактирования. Пользователи также могут протестировать возможности MGIE онлайн через демо версияразмещено на Hugging Face Spaces, платформе для обмена информацией и совместной работы над проектами машинного обучения (ML).
Ранее сегодня Google изменил имя Бард о Близнецах, чтобы подчеркнуть мощь и высокую эффективность этой генеративной модели.