Photo by Eoneren
В конце марта OpenAI произвела революцию в области генерации изображений. Новая версия ChatGPT-4о справляется с визуализацией самостоятельно (раньше — отправлял такие запросы в другую сеть, DALL-E) и делает это в разы лучше и себя прежнего, и существующих аналогов. Чат теперь запоминает все итерации сгенерированных картинок, может вносить в них правки (а не генерировать заново) и, что важно, делает это на основе простых «человеческих» промптов, а не сложносочиненных комбинаций слов, которые пользователи копируют друг у друга. К тому же, 1 апреля эта версия стала бесплатно доступна всем пользователям.
Мы уже рассказывали о реакции сообщества на обновление и собирали самые яркие результаты работы ChatGPT-4о из соцсетей. Теперь — объясняем, как ее возможности можно использовать в работе и даем примеры промптов для каждой задачи.
ChatGPT умеет собирать простые и чистые инфографики, например по структуре «заголовок + 3 блока + подпункты». Это удобно, если нужно быстро объяснить что-то визуально: состав, симптомы, этапы, эффекты, и т. д.
Промпт: «Сделай инфографику про гормоны стресса — кортизол, адреналин, норадреналин. В нежных пастельных цветах».
Такой формат подходит для карточек в соцсетях, слайдов, обучающих материалов или постов в блоге. Можно делать целые серии в одном стиле — достаточно продолжать диалог и уточнять, что нужно изменить.
Инструмент можно использовать и как генератор идей для визуального стиля. Например, чтобы быстро получить варианты логотипа для проекта в нужной эстетике или на основе референса.
Промпт: «Оформи логотип Reminder в стиле Patagonia. Текущий логотип выглядит так...» (прикреплен файл и референс на желаемый ориентир).
Можно использовать для редизайна, мозговых штурмов, тестов стилистики и просто игры с визуальной айдентикой. Если задать несколько вариантов, можно быстро получить серию идей, на которые в ручном режиме ушли бы дни.
ChatGPT помогает быстро делать слайды для любых презентаций (как собрать полноценную продающую презентацию с помощью ИИ, мы подробно разбирали здесь). Например, можно попросить создать схему или метафору для объяснения сложной идеи и получить готовый слайд, подходящий и для образовательного контекста, и для рабочих задач, и просто for fun.
Промпт: «Сделай слайд для презентации, который показывает, как работает генерация изображений, от идеи к картинке. Стиль минималистичный, винтажный».
Подобные изображения можно использовать для вступлений, пояснений и визуального оформления докладов — особенно когда нужно помочь аудитории быстро ухватить логику.
Один из самых простых способов объяснить сложное через визуал — нарисовать комикс. ChatGPT дает такую возможность: достаточно описать сцену своими словами и формат, ИИ сам подберет стиль, раскадровку и текст в «пузырях».
Промпт: «Сделай комикс на русском языке про человека, который каждое утро открывает ноутбук и читает Reminder — медиа о здоровье, саморазвитии и практической философии».
Можно использовать такой прием для промо, карточек в соцсетях, пояснений на личных страницах или как легкое визуальное вступление к статье. Если нужно сделать более длинную историю, ИИ легко продолжит в том же стиле, если его направить.
Можно взять известный фильм и за минуту получить его альтернативный постер в совершенно другом стиле. Например, вот «Леон» в эстетике Studio Ghibli, которая рисует мультики Миядзаки.
Промпт: «Оформи этот постер к фильму "Леон" в стиле Studio Ghibli», в качестве точки отсчета прикрепить оригинальный постер.
Это может пригодиться для визуальных экспериментов, тестов идеи, оформления подборки, статьи или просто чтобы сыграть на контрасте. Сюжеты остаются те же — настроение меняется полностью.
GPT-4o справляется и с концептуальными визуализациями, если в промпте задать точное настроение и атмосферу. Например, можно создать необычную иллюстрацию для статьи, рассылки или презентации, не прибегая к работе с дизайнером или 3D-графикой (и серьезно экономя).
Промпт: «Изобрази 3D-блоки тетриса, часть из которых стоит на столе, а другая часть падает сверху. Блоки должны быть надувные, приятных ярких пастельных цветов, глянцевые и "вкусные". Светлый фон».
Такой подход помогает быстро генерировать визуальные метафоры или заставки для постов и статей. Особенно когда нужно что-то креативное, чего не найти на фотостоках.
Генерация картинок в ChatGPT — это диалог: вы описываете идею, уточняете детали, задаете стиль и получаете нужный результат, который напрямую зависит от точности инструкций. В новой версии ИИ диалог более осмысленный: можно описывать задачу своими словами и добавлять уточнения по ходу — чат поймет.
Опишите, что именно вы хотите получить, но пока без лишней детализации. Это может быть сцена, ситуация, объект или настроение. Когда первая версия картинки получена, ее легко корректировать — просить изменить стиль, цвет, добавить или убрать элементы.
Хорошо работают фразы вроде «в стиле старой инфографики», «как в комиксах The New Yorker» или «в духе Apple». Можно прикрепить пример и попросить сгенерировать что-то в похожей эстетике.
Чем четче вы зададите параметры изображения, тем выше шанс получить тот результат, который вы ожидаете увидеть. После того как будет сгенерировано первое изображение, уточните цветовую гамму, фон, формат (горизонтальный, вертикальный или квадратный), количество объектов или их расположение.
Обновленный ChatGPT запоминает то, что вы уже обсудили, сохраняет все версии картинок и хорошо справляется с уточнениями. Можно просить: «Сделай вариант с другим шрифтом», «Убери подписи», «Сделай композицию проще», — это быстрее, чем генерировать картинку с нуля.
Промпты не обязательно должны быть формальными и скопированными у других пользователей, как это было раньше. Иногда лучше работают образы: «логотип, вдохновленный утренней тишиной» или «слайд, как из презентации в 1970-х». Чем живее формулировка, тем интереснее результат.
Психологический прием «Попроси»
Научный взгляд на то, как тело, психика и окружение формируют настроение в первые минуты дня
14 приемов, проверенных наукой и лабораторией Яндекс Практикума