Яндекс представил новую технологию генерации изображений: скрытую диффузию. Шаблон ЯндексАРТ 1.3. лучше понимает текстовые запросы и создает более точные и реалистичные изображения.
Технология скрытой диффузии создает промежуточное представление изображения в формате скрытого кода — компактное описание с основными данными об изображении в сжатом формате. Затем нейронная сеть расширяет код до полного изображения с высоким разрешением. Как сообщили в Яндексе, этот метод более эффективен, чем многоступенчатое уточнение изображения при каскадировании. Технология скрытой потоковой передачи требует меньше вычислительной мощности при создании более совершенной графики.
Дополнительно компания увеличила набор данных, на котором обучалась нейросеть, в 2,5 раза, достигнув более 850 миллионов пар изображений с текстом. Также добавлены синтетические тесты.
Чтобы ЯндексАРТ мог учитывать больше деталей из промышленных данных, в новой модели используется не один, а два текстовых кодировщика, с помощью которых модель транслирует текстовый запрос.
ЯндексАРТ также теперь позволяет создавать изображения в разных форматах: 16:9, 4:3 или 3:4. Обновление уже вступило в силу в Masterpiece и вскоре появится и в других сервисах компании.
Напомним, в Masterpiece появился режим ручного создания видео.
Источник: РБ.РУ