Искусственный интеллект вышел на новый уровень

Журнал Science включил “креативность ИИ” в список прорывов года. “Искусственный интеллект проникает в области, которые считались исключительно человеческими, включая художественное самовыражение и научные открытия”, — пишут авторы статьи. По их словам, “вторжение машин” сначала шло медленно, но теперь приобрело лавинообразный характер.

Соцсети пестрят высококачественными картинками, сгенерированными кодом. Работают так называемые модели преобразования текста в изображение. С помощью машинного обучения нейросеть анализирует текст и визуальные материалы, выявляя шаблоны, на основе которых затем создает собственные произведения.

В 2021-м исследовательская лаборатория OpenAI представила программную систему DALL-E, запомнившуюся милыми рисунками по запросу вроде “кресло в форме авокадо”.

Весной 2022-го OpenAI выпустила DALL-E 2. В системе реализовали метод машинного обучения, известный как обратная диффузия. Качественное изображение поэтапно превращается в случайный шум. Используя датасет таких пар нормальных и испорченных картинок, нейросеть учится совершать обратное — формировать из хаоса четкие образы. Благодаря текстовым подсказкам результат становится более реалистичным и художественно убедительным.

В свободном доступе несколько диффузионных моделей. Одна из них — Midjourney, генерирующая изображения по запросу на английском языке. Чем подробнее расписана задача, тем точнее результат, который можно усовершенствовать с помощью специальных настроек.

Несмотря на существенный качественный прогресс, картины ИИ по-прежнему неидеальны. Однако уже сейчас нейросети способны выполнять значительную часть работы за художников и дизайнеров — тем остается лишь довести продукт до совершенства вручную. Так, Джейсон Аллен получил приз на конкурсе изящных искусств за произведение, созданное вместе с Midjourney.

По его словам, ему потребовалось несколько недель и более сотни попыток задать нужное описание. Получившуюся композицию он обрабатывал в фоторедакторе.