IMG-LOGO
image

21 сент. 2023

Просмотров: 102

Новый DALL-E 3 от OpenAI: что умеет генератор изображений?

Держитесь покрепче, мир цифрового искусства снова перевернут! OpenAI только что представила DALL-E 3 — новое поколение своей нейросети-художника. Создатели обещают: этот не просто рисует, он действительно «понимает» ваши фантазии.

Чем порадует новый художник от OpenAI?

  1. Интеллект на первом месте: Главный прорыв — в понимании. Если DALL-E 2 иногда пропускал детали вашего запроса мимо ушей, то DALL-E 3 стремится уловить каждую мелочь. Просите «кота в космическом шлеме, читающего книгу»? Будьте готовы получить именно это, а не абстрактную пушистую массу на фоне звезд.
  2. Исправление главной ошибки: Помните, как нейросети мучились с рисованием рук? Кажется, этот позорный этап подходит к концу. DALL-E 3 обрабатывает такие тонкости, как пальцы и кисти, с куда большим вниманием к анатомии и реализму. Не идеально, но прогресс налицо.

Симбиоз текста и изображения

А вот самая вкусная идея: OpenAI планирует встроить DALL-E 3 прямо в ChatGPT. Представьте — вы общаетесь с ботом, просите визуализировать идею для обложки книги, а он не только советует, но и мгновенно создаёт эскиз. И если результат не идеален, можно тут же, в диалоге, его уточнить. Удобно, правда?

Когда же его можно будет попробовать?

Пока что система проходит внутреннее тестирование. Но уже в октябре доступ к ней получат подписчики платных версий ChatGPT — Plus и Enterprise. Цена вопроса? 20 долларов в месяц. Стоит ли магия таких денег — решать вам.

А есть ли альтернативы? Пока что единственный серьёзный ИИ-чат с бесплатным генератором картинок — это Bing Chat от Microsoft. Ирония в том, что он тоже работает на движке от OpenAI (GPT-4). Выходит, компания конкурирует сама с собой.

Эволюция цифрового творчества продолжается. Что придумают дальше — нейросеть-скульптор или, может, целый режиссёр? Поживём — увидим.