Если вы являетесь подписчиком Adobe Creative Cloud и хотите привнести в свою жизнь немного генеративного ИИ, вам в первую очередь следует обратить внимание на Adobe Firefly. Семейство инструментов, встроенные непосредственно в Photoshop, позволяют обрабатывать и генерировать изображения по текстовым запросам. Да, функциональность не новая, однако нам интересно, как это реализовали в Adobe и добавили ли они что-то особенное, чего нет у конкурентов.
В этом обзоре мы будем сравнивать Adobe Firefly с двумя конкурирующими генераторами текста в изображение — Dall-E 3 и Googl ImageFX. И тут можно сразу оговориться, что Firefly не всегда выдавал лучшие результаты по сравнению с конкурентами, однако его работа точно заслуживает внимания. Результаты этой модели могут оживить посты в социальных сетях, брошюры и иллюстрации в блогах. Даже если вы хотите создавать уникальную рекламу для своего бизнеса, продукт от Adobe выдаст вам множество визуально привлекательных вариантов. Это определено хорошая замена оплате стоковых фотографий ,а также возможность в популярном редакторе креативить на новом уровне.
Вводные данные
Хотя Photoshop включает в себя инструменты Firefly, мы тестировали именно веб-версию, которая использует более мощный движок Firefly Image 2. Adobe обучила свой ИИ на некоторых лицензированных и общедоступных изображениях, но весь свой потенциал он все же реализует на богатстве высококачественного материала в своем собственном сервисе Adobe Stock. Такой подход помогает обойти правовые и этические проблемы, связанные с ИИ, обученными на данных, полученных из Интернета. Adobe также заявляет, что ИИ не обучается на личном контенте подписчиков Creative Cloud.
Инструмент преобразования текста в изображение недоступен как отдельный продукт, так как он встроен в подписку Adobe Creative Cloud. Вы можете создать учетную запись Creative Cloud бесплатно, но вы будете ограничены всего 25 изображениями в месяц. Если вы хотите большего, вам придется подписаться. Полнофункциональная версия Creative Cloud стоит 55 долларов в месяц и поставляется с Photoshop, Illustrator, Premiere Pro, Express, Lightroom и несколькими другими инструментами. Это дает вам 1000 генераций в месяц. Более узкие подписки, такие как Photoshop всего за 21 доллар в месяц, дают вам 500 генераций. Вы также можете заплатить 5 долларов в месяц, чтобы получить 100 изображений, например, если вы просто хотите использовать Firefly без других инструментов Adobe.
Качество генерации изображений
Возможно, самая важная способность сервиса преобразования текста в изображение — это понимание того, что пользователь с помощью текстового запроса хочет получить на выходе. Интересно наблюдать за логикой, которой пользуется генеративный ИИ для создания изображений, но печально осознавать тот факт, что его работа не лишена множества проблем.
В целом, Adobe AI хорошо улавливает суть запросов, но все же делает это чуть хуже, чем его основные конкуренты. Как нам показалось, он лучше работает с изображениями, похожими на стоковые, на которых он и учился. Этот «стоковый» стиль легко прослеживается во многих его генерациях. При этом очевидно, что Adobe Firefly понимает запросы и что от него хотят, но выдает он результат таким, каким его научили выдавать. Отметим, что модель отлично справляется со сложными промтами, где нужно в рамках одного изображения объединить несколько сложных элементов. Она все это понимает и даже правдоподобно генерирует.
Сгенерированные изображения страдали от множества распространенных проблем генеративного ИИ, таких как странная анатомия и нереальный рендеринг областей, где два субъекта соприкасаются. Как и в случае с другими сервисами, ИИ от Adobe наиболее качественно себя проявляет в художественном стиле, чем в фотореализме, где его ошибки более очевидны.
Чтобы продемонстрировать качество работы Adobe Firefly, мы будем использовать следующий промт: «Спокойная сцена с двумя людьми среднего возраста в пригороде Америки, прогуливающимися по гравийной дорожке в парке. Люди держатся за руки и одеты в кардиганы. По обе стороны — деревья с листьями, окрашивающимися в яркие осенние цвета. Пара находится на переднем плане и занимает половину кадра. Они смотрят в камеру». Модель выдала нам вот такой результат:
Нейросеть Adobe просто не хотела разворачивать персонажей лицом в камеру и тем более не удосужилась в большей части кадра. Повторный запрос уточнением деталей не дал нам нужных результатов. По сути, это хорошо характеризует стиль работы этой модели, которая, как нам кажется, в некоторых случаях просто сильно ограничена своей базой знаний.
И да, как и любая другая модель искусственного интеллекта для генерации изображений, она не умеет считать и не дружит нормально с цифрами. Попробуйте сами сгенерировать, например, бильярдные шары с разными цветами и цифрами. Результат во многих генеративных моделях будет очень похож — либо грубейшие ошибки с числами, либо генерация чего-то, не связанного с промтом.
Как улучшить результат генерации?
Генеративный ИИ — это всегда игра в кости, независимо от того, какие инструменты вы используете. Именно поэтому вашим основным инструментом для корректировки результатов будет повторное нажатие кнопки «Сгенерировать» после того, как вы внесли изменения в подсказку.
Но Adobe предлагает несколько полезных элементов управления, позволяющих направить результаты в нужном направлении. Зачастую модели генерации изображений требуют дополнительных текстовых уточнений для повторных генераций. У Firefly для этой задачи есть специальное меню, которые больше похоже на использование программных инструментов, с которыми обычно работают дизайнеры.
Firefly имеет встроенные параметры соотношения сторон, ползунок «визуальной интенсивности», десятки стилей, ползунки камеры для поля зрения и глубины резкости, а также отдельные ползунки для цвета и тона, освещения и композиции. Вы можете использовать столько эффектов, сколько захотите, при этом накладывая эффекты друг на друга.
Эти элементы управления являются одним из самых больших преимуществ Adobe Firefly. С их помощью появляется возможность более точно скорректировать изображение, чем это пришлось бы делать с помощью текстовых запросов.
Полезные опции
Также многие пользователи оценят опцию «создать похожее», которая создает новые генерации на основе понравившегося вам изображения. Еще отметим и функцию «использовать как эталон стиля», которая позволяет поддерживать определенную согласованность по стилю между несколькими изображениями. Удобная вещь, когда увидел удачный пример генерации, но хочешь немного откорректировать изображение, но так, чтобы сохранилась изначальная стилистика.
Вы также можете загрузить свое собственное референсное изображение. Но на практике эта опция демонстрирует рандомный результат. Иногда генератор нормально создает вариацию фотографии, но в других ситуациях он может сгенерировать странный гибрид референса. В общем, поиграться можно, но рассчитывать на какой-то определенный результат не стоит.
Важный нюанс
Firefly не имеет диалогового дизайна, как у Dall-E 3 со встроенным ChatGPT. Поэтому эта модель не будет итерировать подсказки типа «сделай проще». Вам придется повторно отправить совершенно новый, расширенный запрос, чтобы получить новую генерацию. Это оправданный подход к дизайну, особенно учитывая, что технология Adobe работает с графикой, а не с обработкой текста. Но такой формат взаимодействия многим может показаться непривычным, поскольку ИИ не поддерживает разговорный поток, а требует более строго и профессионального подхода к работе.
Скорость генерации
Генеративный ИИ выводит вычислительные технологии на новый уровень, а это значит, что при запуске сервиса необходимо сбалансировать затраты и скорость. Adobe ИИ здесь справляется довольно хорошо, тратя около 10 секунд на возврат результата в виде 4-х изображений. Это достаточно быстро, учитывая, сколько на это тратят время конкуренты и какие при этом результаты выдают.
Конечно, когда вы хотите много итерировать, пробуя новые вариации, идеи и стили, даже 10 секунд могут показаться вечностью. Но таковы нынешние реалии. Возможно, в ближайшем будущем скорость работы будет увеличена или за отдельный ценник можно будет купить подобное преимущество.
Заключение
Adobe Firefly — отличный генератор, который с прочими инструментами компании позволяет более профессионально подойти к созданию цифрового искусства. Несмотря на то, что модель часто создает изображения, в которых явно прослеживаются нереалистичные моменты, свойственные ИИ, она также может выдавать полезные результаты, особенно если вы готовы часто нажимать кнопку «сгенерировать».
Сильнейшими активами Firefly являются его мощные возможности художественного стиля. Adobe явно думает о потребностях профессионалов, что является его конкурентным преимуществом по сравнению с основными конкурентами.
Веб-интерфейс для модели изображения Firefly второго поколения работоспособен, но его необходимо встроить в Photoshop, чтобы вы могли напрямую интегрировать его со своей собственной работой, например, используя инструменты генеративной заливки и генеративного расширения программного обеспечения. В общем, инструмент выглядит достойно и точно найдет своих поклонников. Если вы уже оплачиваете подписку на Creative Cloud, вам точно следует серьезно оценить возможности Firefly.