Як складати запити до Midjourney, Stable Diffusion та інших нейромереж?

20 декабря 2023, 15:47 |

Сучасний світ IT переживає справжній бум нейромереж. Сьогодні вже нікого не здивуєш тим, що штучний інтелект пише тексти, підсумовує відео на YouTube, шукає товари в інтернет-магазинах тощо.

Художники та дизайнери широко використовують ШІ для створення зображень – у всіх «на слуху» Midjourney, Stable Diffusion та інші нейромережі. Щоб отримати гарну картинку від штучного інтелекту, потрібно правильно сформувати запит.

Але як це правильно зробити? Це питання мучить тисячі користувачів Midjourney, Stable Diffusion та інших алгоритмів генерації зображень. Ви придумуєте ідею, вводите запит, тиснете кнопку і бачите... зовсім не те, що уявляли. Картинка у вашій голові виглядала ідеально, але ШІ вас не зрозумів. Давайте розберемося, як правильно складати запити до нейромереж, щоб не витрачати намарно свій час і ресурси серверів, які забезпечують роботу штучного інтелекту.

Помічники запитів

І насамперед – чудова новина. Якщо ви не хочете вручну створювати запити, є готові генератори. Вони самі сформують запит під обрану вами нейромережу.

Радимо використовувати сервіси:

Midjourney Prompt Helper – просто вибирайте слова з переліку, а в кінці скопіюйте готовий запит.
Prompt builder for AI art Generators – генерує промпти для 9 популярних нейромереж.
MidJourney-Styles-and-Keywords-Reference – це функціональний помічник запитів з використанням GitHub.

Stable Diffusion

Розберемо тепер короткий гайд по генерації зображень в двох сервісах, Stable Diffusion і Midjourney. Stable Diffusion – це одна з найпопулярніших нейромереж 2023 року для створення зображень. Давайте розберемо кілька факторів, що впливають на запити до неї.

Конкретика

Stable Diffusion любить максимальну точність в описі об'єктів. Що детальніше ви опишете те, що хочете отримати, то вищий шанс, що нейромережа вас правильно зрозуміє.

Комбінації

Іноді достатньо 1-2 слів, щоб отримати шедевр. Але в інших випадках доводиться додавати десятки уточнювальних слів, щоб результат влаштував вас.

Тестуйте різні комбінації, враховуючи, що деякі слова за замовчуванням сильно змінюють картинку. Додавайте потрібні вам слова, щоб нейтралізувати їхній ефект.

Стилізація

Вкажіть художній напрям, щоб надати результату естетичності. Для ще більшої точності після коми вкажіть конкретного художника або фотографа. Нейромережа скопіює його почерк. Опишіть налаштування камери та об'єктива, як для реальної фотосесії (якщо розбираєтеся в фотографії). Це допоможе зробити результат максимально реалістичним.

Midjourney

Ця нейромережа теж використовує текстові підказки. Більшість вищесказаного для Stable Diffusion справедливо і для Midjourney. Давайте розберемо основні параметри, які повпливають на результат генерації картинки.

Розміри зображення

Команда Aspect Ratio дає змогу задати потрібні пропорції. Наприклад, щоб отримати картинку 3:4, додайте після текстового промпту:

--ar 3:4

Також можна вказати висоту і ширину через параметри --h і --w.

Рання зупинка рендерингу

Щоб перервати процес генерації на півдорозі, використовуйте:

--stop 50

Це допоможе створити м'яку композицію без чіткого фокусування на об'єктах.

Параметр --no

Він дає змогу виключити з картинки небажані елементи. Просто після --no опишіть те, чого бути не повинно.

Загальні рекомендації для всіх нейромереж

Ось кілька універсальних порад, які поліпшать ваші запити в будь-якій нейромережі:

Пишіть англійською;
Будьте конкретні, не чекайте, що нейромережа "додумає" за вас;
Описуйте настрій, стиль, кольори через прикметники;
Шукайте натхнення в прикладах інших користувачів.

Як бачите, створити ідеальний запит – це ціле мистецтво. Але якщо слідувати основним принципам і експериментувати, ви обов'язково досягнете бажаних результатів від Midjourney, Stable Diffusion і будь-якої іншої нейромережі!

Tweets by iLenta_com