Новый мотор под капотом старого авто
Текст выходного дня, что намекает на несерьезность. И да: это – только один из множества сценариев, как не стоит использовать ChatGPT. Среди других и любимая тестировщиками задача по подсчету букв R в слове strawberry. И просить написать стихотворение – тоже так себе идея.
Несколько дней тому назад OpenAI обновила (обновил) работающую под капотом ChatGPT версии 4о модель-генератор изображений, заменив старушку DALL-E 3. Не расстраивайтесь, DALL-E 3 все еще доступна, если вам почему-то захочется к ней вернуться. Новая модель, если верить заявлениям ее создателей, замечательно понимает, что именно от нее хотят, принимая во внимание содержание целого диалога, а не только последнего промпта, аккуратно и точно обращается с текстом. И вообще легка и приятна в общении, то есть в использовании.
Устоять я не смог и вчера вечером вместе с внуком Николаем, парнем 14 лет, с моделью экспериментировали, создавали простую поздравительную открытку на годовщину школы, где учится он и его младший брат.
Проверяем
Начали с простого промпта “Create image Tomorrow is Venda School’s anniversary, where my grandson Vlad is a student. Please create an image that would commemorate this occasion.”

Затем пробовали постепенно изменять сгенерированную картинку, чтобы больше соответствовала “нашему представлению о прекрасном”.
Все шаги – промпты и результаты – ниже, видно, как менялся рисунок.
Let’s change the image a bit. Remove the glasses.

Remove 50 and change the text. It should be “Happy Anniversary Venda. Congratulations from Tishins”

Change the background. Let it be a building which looks like a school building.

replace the text, let it be “С днем рождения, любимая школа! Тишины”

change the boy’s hairstyle, let the hair be a little longer and a little lighter.

Make the text smaller and move the text to the bottom of the image.

Времени ушло немало: и на сами промпты, и генерация рисунков тянулась долго. А финальный результат получился так себе, ничего особенного, а последний промпт вообще не сработал – текст вниз не переместился. И да: ожидание этого рисунка очень затянулось, я его увидел только утром.
А если без нейронки?
Сегодня мне дошло, что сопоставимый по качеству средненький результат мы, наверное, могли бы получить более традиционным способом: нагуглив подходящую картинку и добавив в любом редакторе нужный текст.
Я попросил Николая это мое озарение проверить. И что же: вся работа у него заняла три минуты (он засек) и справился он в телефоне, не включая компьютер:
Поиск в Google по картинкам “мальчик у которого на заднем плане школа” показал:

Затем пара минут ушла на добавление текста прямо в “Галерее”:

А зачем все это?
Как на мой неискушенный взгляд, принципиальных различий в художественной ценности: обе открытки сложно назвать шедеврами, но что-то мне подсказывает, что три минуты с Гуглом победили целый вечер мучений с модным искусственным интеллектом
Ваше мнение?
Мораль сей басни такова: хайповые технологии — это круто, но здравый смысл — круче, нужно напоминать себе, что иногда лучшим инструментом может быть самая простая вещь — например, старый проверенный Google.
Автор: Gonchar_POTT