Генерація картинок: GPT4 vs GPT4o

Зараз є безліч AI сервісів для генерації картинок. ChatGPT не є виключенням. Завдяки своїй популярності та простоті у використанні багато юзерів генерують картинки саме у ньому. А з появою нової версії GPT4o можливостей для генерації стало ще більше. Сьогодні я розкажу вам яка версія чату краще справляється з генерацією картинок та чому.

Зміст

На базі чого генеруються картинки чатом GPT

Перш ніж я перейду до порівняння двох версій чату, давайте розберемося на базі чого взагалі генеруються картинки у версії GPT4 та GPT4o. Обидві версії чату створюють картинки за допомогою DALL-E 3.

DALL-E 3 є моделлю генерації зображень, розробленою компанією OpenAI. Ця модель є третім поколінням після DALL-E і DALL-E 2, і має поліпшену здатність створювати деталізовані та реалістичні зображення з текстових запитів. DALL-E 3 використовує технології штучного інтелекту для аналізу текстових описів і створення відповідних зображень, що дозволяє користувачам візуалізувати свої ідеї та концепції швидко та ефективно. Модель може враховувати різні стилі, деталі та навіть емоції, зазначені у запитах, забезпечуючи велику гнучкість у візуальному контенті.

Як генерує DALL-E 3 для чату GPT4 та GPT4o

Якщо обидві версії чату використовують DALL-E 3 для генерації картинок, то навіщо взагалі їх порівнювати? Справа в тому, що не сам GPT генерує картинки, це робить DALL-E 3. І тут якраз стає питання того, яка з версій як саме використовує його, наскільки добре розуміє ваш промпт і враховує усі деталі.

Як тільки версія GPT4o стала доступною – я одразу почала тестити її зданість генерувати картинки. Логічно, що більш нова модель має краще працювати і генерувати більш якісні картинки, але як виявилося все не зовсім так. Доречі, картинки для своїх статтей я генерує саме через GPT, тому досвіду маю достатньо.

GPT4 vs GPT4o: що краще генерує картинки?

Щоб дізнатися яка версія краще генерує картинки, давно всім знайомий GPT4 чи GPT4o, я розробила 10 промптів і задавала їх кожній з версій. З отриманих результатів аналізувала картинки за такми критеріями:

Точність генерації (розуміння промпту)
Якість картинки
Помилки у написанні слів
Стиль картинки
Розмір картинки (у разі його наявності у промпті)
Креативність та різноманіьність

Тематика картинок була обрана на голодний шлунок, тому усі промпти були розроблені для генерації картинок для вигаданих ресторанів «Кітчен» та «Експерементаріум». У результатах я спочатку вказувала промпт, далі зліва картинку GPT4/зправа GPT4o, потім невеликий висновок від себе.

Читайте і дізнайтесь про найкращий сервіс для генерації зоображень.

Результати генерації

1. Згенеруй картинку, яка зображає меню ресторану Експерементаріум. В меню є такі страви – “Уха та паста з грибами та куркою”. Зроби меню в мінімалістичному дизайні.

Краще виконав задачу у цьому випадку GPT4. Зрозуміло, що є багато нюансів, але по першій кратинці одразу зрозуміло, що це меню, назва ресторану майже правильно прописана і стиль мінімалізму непогано дотриманий.

GPT4o, наскільки я здогадуюсь, зробив в основному акцент на слові Експерементаріум, тому картинка справа більше виглядає як книжка з рослинами на обкладинці, але стиль мінімалізму також дотриманий.

2. Згенеруй картинку, яка буде банером на вулиці, щоб люди бачили меню заклада Експерементаріум. Повинні бути перераховані наступні страви: червоний борщ зі сметнаою та салом, макарони з котлетою в асорті, салат з морквою, яблуком та селерою.

Тут уже цікавіше. Впринципі, як на мене обидві версії непогано виконали поставлену задачу. GPT4o (картинка зправа) навіть краще зрозумів, що таке банер і більш реалістично зобразив його. Розуміння запропонованих страв на одному рівні, по обом картинкам зрозуміло, що саме тут показано.

3. Тут уже цікавіше. Впринципі, як на мене обидві версії непогано виконали поставлену задачу. GPT4o (картинка зправа) навіть краще зрозумів, що таке банер і більш реалістично зобразив його. Розуміння запропонованих страв на одному рівні, по обом картинкам зрозуміло, що саме тут показано.

Повертаємося до мінімалізму. Тут вказано розмір і обидві моделі чітко зрозуміли його, що не мало важливо. Щодо стилю так само, мвнвмалізм у кращих його проявах. А ось із контекстом GPT4o впорався гірше. GPT4 чітко прописав назву ресорану, навіть назви страв. У цьому протистоянні GPT4 забирає очко на свій рахунок.

4. Згенеруй картинку для мобільного додатку ресторану Кітчен, де буде викладено меню з такими стравами: овочевий суп з фрикадельками, карі курочка з ананасом та рисом.

GPT4 знову гарно воправся із генерацією слів на картинці. Сам дизайн гарно промальований (видно, що це застосунок) і навіть помітна концепція здорового харчування у кольорах та оформленні. GPT4o зробив не набагато гірше, але не так добре як його попередник.

Питання у мене виникли щодо розміру. GPT4 зробив просто універсальний, а ось GPT4о адаптований під екран телефону. Так як я не задавала параметр розміру не можу судити, але цей кейс показує різницю сприйняття промпту обома версіями.

5. Я дизайнер, який оформлює меню ресторану Експерементаріум. Мені необхідно створити яскраву картинку для меню під такі страви: суп з баварськими ковбасками, пюре з рибною котлетою, салат теплий.

Обидві картинки згенеровані у майже реалістичному стилі, навіть видно правильне падіння світла та тіні на страви, ніби це реальне фото. Страви показані досить специфічно, але це штучний інтелект і він так бачить певно усіма улюблену пюрешку з котлеткою. З невеликим відривом все ж свій бал відаю картинці зліва, тобто чату GPT4.

6. Згенеруй картинку зі стравами: уха, паста з грибами та куркою для ресторану Експерементаріум. Картинка має бути гіпереалістична та правдободібна. Використовуй яскраві кольори. Картинка має викликати бажання придбати обід.

Потихеньку ми перейшли до високої кухні. Тут в обох варіантах чомусь відсутня уха, але паста з грибами дуже вишукано показано, моя повага. У цьому випадку зліва картинка краще, бо тут GPT4 зробив цікавіше фон і більш приємну на вигляд страву.

7. <Style><Animation> </Size><780х450> </format></image> <name of food><окрошка, свинина по-тайські та картопля по-селянськи з сирним соусом> <name of restaurant><Кітчен>.

Промпт цікавий, бо я намагалася експерементувати з розділенням інофрмації для чату. Одразу скажу, що це не спрацювало і краще GPT не став розуміти промпт. Щодо картинок, GPT4 згенерував гарну картинку зі стравами у правильному розмірі і цікавою композицією. А от GPT4o не зрозумів розмір зображення, використав майже той самий ресторан на фоні страви і самі продукти виглядають неправильно.

8. Згенеруй картинку страв: “червоний борщ зі сметнаою та салом, макарони з котлетою в асорті, салат з морквою, яблуком та селерою” для сайту ресторана “Експерементаріум”. Картинка має бути дуже деталізованою і чіткою. Стиль картинки має бути виконаний у стилі японської анімації. Сама експозиція картинки має виглядати як кадр із анімаційного мультфільму.

Стиль картинки як на мене дуже важливий і тому у цьому і наступному промпті я вирішила зробити акцент саме на ньому, щоб побачити яка версія краще згенерує зображення саме за цим параметром. Тут для мене абсолютним лідером є GPT4. Він зробив саме те, що я хотіла, навіть страви правильно згенерував. GPT4o використав ту саму композицію в картинці і ресторан на фоні, лише зробив стиль більш анімаційним.

9. Стиль картинки як на мене дуже важливий і тому у цьому і наступному промпті я вирішила зробити акцент саме на ньому, щоб побачити яка версія краще згенерує зображення саме за цим параметром. Тут для мене абсолютним лідером є GPT4. Він зробив саме те, що я хотіла, навіть страви правильно згенерував. GPT4o використав ту саму композицію в картинці і ресторан на фоні, лише зробив стиль більш анімаційним.

Чого вартує лише це маленьке янголятко на першій картинці. GPT4 знову класно виконав задачу і згенерував картинку відповідно до стилю. Окремий плюс, що при формувані композиції він використав задані страви. GPT4o вкотре не дотримався розміру картинки, зробив її не такою чіткою та якісною у порівнянні з результатом GPT4 і врахував просто епоху, але не специфіку того, що це має бути Ренесанс у живописі.

10. Картинка для реклами ресторану Експерементаріум. На картинці має бути такий комплексний обід – суп з баварськими ковбасками, пюре з рибною котлетою, салат теплий. Стиль картинки має бути сучасним та яскравим. Головна мета картинки – змотивувати покупців замовити цей комплексний обід.

Картинка для реклами ресторану Експерементаріум. На картинці має бути такий комплексний обід – суп з баварськими ковбасками, пюре з рибною котлетою, салат теплий. Стиль картинки має бути сучасним та яскравим. Головна мета картинки – змотивувати покупців замовити цей комплексний обід.

Висновки

Які можемо зробити висновки з цього аналізу. На мою думку краще із поставленими задачами справився GPT4. Він краще розумів розмір картинки, враховував усі деталі з промпту, робив різноманітні картинки та навіть часто чітко прописував запропонований текст.

GPT4o непагано згенерував картинки, в деяких випадках навіть десь краще, але, він має проблеми з розумінням розміру зображень, робив доволі одноманітні сюжети (усюди ніби один і той же ресторан) з урахуванням того, що для генерації кожної картинрки я починала новий чат, щоб уникнути неточностей.

Що нового?

Word Wall: інтерактивні інструменти для навчання

Антивірусні програми та кібербезпека в епоху ШІ

Перевірка на ШІ: як визначити згенерований контент

Генерація картинок: GPT4 vs GPT4o

Як оживити фото: обробка фото штучним інтелектом 🤖

Поп-ап: що це та як використовується в маркетингу 🚀

ШІ малюнки як інструмент цифрового контенту

VideoToBlog.ai: як перетворювати YouTube-відео на статті

Генерація відео з ШІ: Оглядаємо різні моделі

Як покращити якість фото онлайн за допомогою ШІ

Кібербезпека та хмарний конгрес Північної Америки | 5-6 червня 2024 року

Як видалити водяний знак за допомогою штучного інтелекту

Descript — AI-інструмент для редагування відео та аудіо: новий підхід до контенту

Огляд Vyond Go: генерація відео за допомогою AI

Як AI допомагає покращити граматику та стиль у копірайтингу

Підпишіться на оновлення

Що нового?

Генерація картинок: GPT4 vs GPT4o

На базі чого генеруються картинки чатом GPT

Як генерує DALL-E 3 для чату GPT4 та GPT4o

GPT4 vs GPT4o: що краще генерує картинки?

Результати генерації

Висновки

Пов'язані публікації