OpenAI презентувала «мислячий» генератор зображень ChatGPT Images 2.0
OpenAI випустила «мислячий» генератор зображень ChatGPT Images 2.0 — «передову модель, здатну розв’язувати складні візуальні завдання і створювати точні, готові до використання роботи».
Представляємо ChatGPT Images 2.0
Передова модель для зображень, яка бере на себе складні візуальні завдання і створює точні, одразу придатні до використання візуали з точнішим редагуванням, багатшими макетами та інтелектом рівня «мислення».
Відео створене за допомогою ChatGPT Images pic.twitter.com/3aWfXakrcR
— OpenAI (@OpenAI) 21 квітня 2026
У компанії відзначили «якісний стрибок» у дотриманні інструкцій, точному розміщенні та співвідношенні об’єктів, а також у візуалізації щільного тексту.
Модель впевнено працює кількома мовами та самостійно заповнює прогалини в запиті, спираючись на візуальний і загальний контекст. У підсумку користувач отримує потрібний результат із меншою кількістю уточнень.
Точність і контроль
ChatGPT Images 2.0 опановує складні концепції й точно втілює їх візуально.
Модель дотримується інструкцій, зберігає задані деталі та відтворює дрібні елементи з роздільною здатністю до 2K.
Більша точність і контроль
ChatGPT Images 2.0 може концептуалізувати складніші зображення, а потім ефективно втілювати це бачення в життя.
Вона вміє дотримуватися інструкцій, зберігати запитані деталі та рендерити дрібні елементи, які часто «ламають» зображення… pic.twitter.com/n29165pV9Q
— OpenAI (@OpenAI) 21 квітня 2026
Робота зі стилями
ChatGPT Images 2.0 точніше передає характерні риси фотографій, кінематографічних кадрів, піксельної графіки, манґи та інших візуальних стилів. LLM забезпечує високу узгодженість текстур, освітлення, композиції та дрібних деталей.
Така точність стане у пригоді під час створення ігрових прототипів, у розробленні сторібордів, підготовці маркетингових матеріалів і створенні робіт у визначеному медіаформаті чи жанрі.
Уміє думати
ChatGPT Images 2.0 — перша модель OpenAI для роботи із зображеннями, здатна розмірковувати перед генерацією.
У зв’язці з ChatGPT модель уміє шукати інформацію в інтернеті в реальному часі, створювати кілька варіантів за одним промптом, перевіряти результати й генерувати робочі QR-коди.
«Це дозволяє моделі взяти на себе більшу частину важкої роботи між ідеєю та зображенням, особливо коли точність, актуальність інформації, узгодженість і візуальна цілісність мають першорядне значення», — стверджують в OpenAI.
Модель підтримує співвідношення сторін від 3:1 по ширині до 1:3 по висоті. Вона доступна користувачам ChatGPT і Codex.
Функція Images with thinking доступна в тарифних планах ChatGPT Plus, Pro і Business.
Нагадаємо, у квітні OpenAI надала обмеженому колу користувачів доступ до нової ШІ-моделі GPT-5.4-Cyber.