Нейромережі, що створюють зображення, з кожним днем збільшують свою кількість та якість роботи. Сьогодні в нас є вибір між десятками насправді хороших ШІ, які можуть замінити нам дизайнера. Чат GPT не ігнорує тренди та покращує свої алгоритми, аби не відставати від конкурентів. Зараз, на мою думку, його вже можна поставити в один ряд з такими гігантами цього направлення, як Midjourney та Lonardi AI. Щоб отримати від ГПТ бажану якість, треба просто сформулювати правильний промпт. Чи ви хочете отримати простий концепт чи детально опрацьований образ, чіткість і специфічність вашого промпту значно впливають на створення зображень. Давайте розглянемо різні типи промптів і корисні поради, як досягти найкращих результатів від ChatGPT.
Розуміння типів промптів: Концепт vs. конкретика
Коли створюєте промпт для генерації зображень, важливо вирішити, чи вам потрібен результат на рівні “концепту” чи на рівні “конкретики”:
Концептуальний промпт: надає загальну ідею або тему. Основний акцент робиться на передачу атмосфери, настрою або стилю, а не на деталях. Зазвичай такий промпт складається з одного, максимум двох речень. Наприклад, промпт може вимагати “персонажа, натхненного драконородженим у сетінгу Dungeons and Dragons”. Результат передасть суть ідеї, але може не мати багато деталей.

Приклад 2: Попросимо чат згенерувати картинку міста. Промпт залишимо на рівні концепту: “Створи картинку сучасного міста”. Чат створює картинку, що чудово нам підійде у випадку, коли нам просто потрібне зображення міста.

Конкретний промпт: тут ви прагнете до точного, дуже деталізованого результату. Промпт має включати точний опис кольорів, текстур, поз, а також елементів фону. Наприклад, запит “Створи картинку персонажа для Dungeons and Dragons. Це має бути дракононароджений. Це має бути ящірка зростом з людину. Вона має шкіру відтінку індіго та довгий хвіст. У неї немає крил. Ящірка елегантна, одягається у дорогі чоловічі костюми темносинього відтінку з білою сорочкою та червоною желеткою. На обличчі монокль, а у роті сигара. Помісти її у таверну. Реалістичний стиль, формат 1920х1080.” дасть зображення, яке буде сфокусовано на цих конкретних деталях.

Приклад 2: Повертаємося до нашого міста. Давайте уявимо, що нам не вистачить картинки якогось рандомного міста. Тоді можемо прописати щось на кшталт “Створи картинку сучасного міста. Це має бути Нью-Йорк. Це має бути Таймс Сквер та хмарочоси поруч. Має бути видно рекламні зображення на хмарочосах. Помісти на картинку ресторан McDonalds. На картинці має бути багато людей та машин. Денний час, літо. Реалістичний стиль, формат 1920х1080.”. В цьому випадку отримаємо потрібне нам зображення і хоч МакДаків на картинці більше, ніж треба було би, наш запит він виконав.

Основні компоненти ефективного промпту
Якщо з концептуальним промптом все зрозуміло, то зі складовими конкретного промпту краще бути розібратися. Коли створюєте промпт для зображення, подумайте про нього як про багатошаровий опис. Ось основні компоненти, які варто врахувати:
- Контекст: По суті концептуальний промпт. Те, що ми хочемо побачити в результаті: “Створи картинку персонажа для Dungeon and Dragons”.
- Об’єкт: Опишіть основний фокус зображення. Це може бути персонаж, істота або об’єкт, наприклад, “Персонаж-драконороджений” або “Зачарований меч” або “Нью Йорк”.
- Деталі: Додайте специфічні описи кольорів, текстур, особливостей та інших деталей, як-от “індигова шкіра, довгий хвіст, без крил”.
- Обставини чи сцена: Вкажіть дію або настрій, якщо це необхідно, наприклад, “сидить у розслабленій позі з сигарою в руці” або “Помісти її в середньовічну таверну” або “Сонячний літній день”.
- Технічні параметри: Щоб забезпечити відповідність зображення певному формату, вкажіть вимоги, наприклад, “Реалістичний стиль, роздільна здатність 1920×1080”.
Створення логотипів за допомогою промптів
По суті, створення логотипів дещо схоже на генерацію конкретних картинок. Ми також насичуємо промпт потрібними нам деталями, але їх зміст направлений вже не на елементи картинки, а складові логотипу. Давайте розглянемо ті чинники, що є важливими та впливають на кінцевий результат генерації.
- Кольори – фарби, що забарвлюють ваше лого. Мені от подобається поєднання помаранчевого та синього або блакитного.
- Форма – яким ви хочете бачити свій логотип? Коло? Квадрат? Чи може взагалі трикутник?
- Фон – ваше лого буде розміщене на нейтральному білому фоні, чи може фон має велике значення для вашої ідеї?
- Деталі – елементи, які має містити ваше лого.
- Додаткові елементи – може ви хочете бачити щось окрім самого візуального елемента, наприклад текст з назвою вашого бренду під логотипом.
- Стиль – що ви хочете бачити на виході? Картинку з багатьма елементами, чи щось мінімалістичне? Можливо у вас є побажання по самому сетінгу ідеї.
На картинці можете бачити візуальне відображення вищеописаних елементів. Для прикладу я розібрав логотип для власного проєкту в Instagram “more.zvukiv”. Він, до речі, також був згенерований за допомогою ШІ.

Потрібний нам промпт – це мікс з опису цих характеристик. Давайте розглянемо варіанти логотипів, які я створив, коли хотів заснувати творче обʼєднання та формував для нього айдентику. Все, що я робив – дещо змінював параметри описаних характеристик в залежності від своїх побажань.

Однак у ГПТ є деякі проблеми у генерації, на які треба звернути увагу.
- Чат, як і інші штучні інтелекти, все ще не дуже хоче дружити з текстом на картинці, тож краще буде або додати його самому в будь-якому редакторі. Хоча можете спробувати, інколи текст виглядає навіть дуже прийнятно. У випадку, коли вам треба додати лише декілька літер (абревіатуру) – сміливо просіть чат додавати їх. З невеликими надписами GPT добре впорається.
- По невідомій мені причині, ГПТ з великим небажанням розміщує логотипи на білому фоні, тому скоріш за все зробити фон білим чи прозорим вам доведеться власноруч.
Креативні виклики: Як обійти обмеження ChatGPT
А що, якщо нам потрібно згенерувати зображення, на якому ми хочемо бачити ліцензованого персонажа? Бетмена до прикладу. Чат має деякі обмеження щодо генерації контенту, на який накладено авторські права. Якщо ми попросимо створити картинку з Бетменом, то отримаємо відповідь про неможливість виконання даного запиту. Однак ми з вами креативні та використовуючи альтернативні описи можемо обійти ці обмеження. Наприклад:
- Замість “Бетмен кидає бетаранг” можна сказати “чоловік у костюмі кажана кидає сюрикен у формі кажана”. Це дозволяє залишатися в рамках правил, досягаючи подібного візуального ефекту. На картинці можете побачити приклади.

Висновок
Створення ефективних промптів для зображень з ChatGPT вимагає балансу між широкими концепціями та детальними описами. Завдяки розумінню структури промпту і включенню основних компонентів, таких як контекст, об’єкт, деталі та технічні параметри, ви можете спрямувати AI на створення зображень, що максимально точно відповідають вашому баченню. З практикою ви зможете майстерно формувати промпти, відкриваючи безмежні можливості для креативності, від детальних дизайнів персонажів до професійних логотипів.