OpenAI представляє вдосконалений GPT-4o

GPT-4o

З моменту запуску рік тому GPT-4o від OpenAI зазнав значних удосконалень. Однією з його особливостей є здатність генерувати зображення. Ця можливість дозволяє штучному інтелекту створювати складні зображення на основі простих текстових підказок. На відміну від попередніх версій, GPT-4o дозволяє користувачам поступово вдосконалювати свої зображення, поки вони не досягнуть бажаного результату.

GPT-4o від OpenAI: Покращені зображення, створені штучним інтелектом

Попередні моделі штучного інтелекту мали труднощі з відтворенням тексту на зображеннях. Наприклад, якщо ви запитували вивіску, то часто отримували нерозбірливі каракулі, а не зв’язні слова. GPT-4o розв’язує цю проблему шляхом всебічного розуміння інструкцій, генеруючи чіткіші та точніші зображення.

GPT-4o

У той час як більшість генераторів зображень зі штучним інтелектом створюють початкове зображення на основі підказки, а потім модифікують його за допомогою підказок, GPT-4o використовує інший підхід. Ви можете запросити зображення, а потім вдосконалити його, просто надавши нові вказівки. Наприклад, ви можете почати із заходу сонця, а потім доручити ШІ освітлити небо або додати птахів. Таке ітеративне редагування покращує користувацький досвід, роблячи його більш динамічним і цікавим.

Просте налаштування

GPT-4o чудово генерує зображення з нуля, а також редагує вже наявні. Якщо ви надішлете фотографію кота і попросите додати детективний капелюх і монокль, штучний інтелект без проблем інтегрує їх. Ви можете продовжувати коригувати зображення, змінюючи освітлення, додаючи ефекти або змінюючи його стиль.

Ще однією вражаючою можливістю є здатність АІ поєднувати елементи з декількох зображень в одну цілісну композицію. OpenAI стверджує, що може ефективно керувати 10-20 об’єктами в одній сцені, тоді як багато інших моделей ШІ не можуть впоратися з більш ніж 5-8 об’єктами.

Визнання обмежень

Попри свої досягнення, GPT-4o не є бездоганним. OpenAI визнає, що іноді він неточно обрізає зображення. У нього також виникають труднощі при створенні дуже складних сцен або обробці нелатинського тексту. Іноді штучний інтелект може створювати нереальні або безглузді атрибути, які зазвичай називають галюцинаціями.

Майбутнє штучного інтелекту у створенні мистецтва

Інструменти для створення зображень зі штучним інтелектом стрімко набирають обертів і стають все більш доступними. GPT-4o є значним досягненням у цій галузі, надаючи інтуїтивно зрозумілу платформу для створення та налаштування зображень. Незалежно від того, чи ви художник, дизайнер, чи просто експериментуєте, він слугує чудовим ресурсом для втілення ваших творчих задумів.

Щоб продемонструвати можливості GPT-4o по створенню зображень в дії, OpenAI випустила відеоролики, що демонструють його потенціал та ілюструють еволюцію ШІ у сфері творчості.

 

Джерело

What’s your Reaction?
Cool
1
Cool
Happy
2
Happy
Shaking
0
Shaking
Interesting
0
Interesting
Sad
0
Sad
Angry
0
Angry
Читайте Gizchina в Google News

Сподобалась стаття? Подякуй редакції!

Поділитися з друзями

Постійна авторка сайту gizchina.com.ua

Оцініть автора
( Поки що оцінок немає )
GizChina.net