Сучасний світ IT переживає справжній бум нейромереж. Сьогодні вже нікого не здивуєш тим, що штучний інтелект пише тексти, підсумовує відео на YouTube, шукає товари в інтернет-магазинах тощо.
Художники та дизайнери широко використовують ШІ для створення зображень – у всіх «на слуху» Midjourney, Stable Diffusion та інші нейромережі. Щоб отримати гарну картинку від штучного інтелекту, потрібно правильно сформувати запит.
Але як це правильно зробити? Це питання мучить тисячі користувачів Midjourney, Stable Diffusion та інших алгоритмів генерації зображень. Ви придумуєте ідею, вводите запит, тиснете кнопку і бачите... зовсім не те, що уявляли. Картинка у вашій голові виглядала ідеально, але ШІ вас не зрозумів. Давайте розберемося, як правильно складати запити до нейромереж, щоб не витрачати намарно свій час і ресурси серверів, які забезпечують роботу штучного інтелекту.
І насамперед – чудова новина. Якщо ви не хочете вручну створювати запити, є готові генератори. Вони самі сформують запит під обрану вами нейромережу.
Радимо використовувати сервіси:
Розберемо тепер короткий гайд по генерації зображень в двох сервісах, Stable Diffusion і Midjourney. Stable Diffusion – це одна з найпопулярніших нейромереж 2023 року для створення зображень. Давайте розберемо кілька факторів, що впливають на запити до неї.
Stable Diffusion любить максимальну точність в описі об'єктів. Що детальніше ви опишете те, що хочете отримати, то вищий шанс, що нейромережа вас правильно зрозуміє.
Комбінації
Іноді достатньо 1-2 слів, щоб отримати шедевр. Але в інших випадках доводиться додавати десятки уточнювальних слів, щоб результат влаштував вас.
Тестуйте різні комбінації, враховуючи, що деякі слова за замовчуванням сильно змінюють картинку. Додавайте потрібні вам слова, щоб нейтралізувати їхній ефект.
Вкажіть художній напрям, щоб надати результату естетичності. Для ще більшої точності після коми вкажіть конкретного художника або фотографа. Нейромережа скопіює його почерк. Опишіть налаштування камери та об'єктива, як для реальної фотосесії (якщо розбираєтеся в фотографії). Це допоможе зробити результат максимально реалістичним.
Ця нейромережа теж використовує текстові підказки. Більшість вищесказаного для Stable Diffusion справедливо і для Midjourney. Давайте розберемо основні параметри, які повпливають на результат генерації картинки.
Команда Aspect Ratio дає змогу задати потрібні пропорції. Наприклад, щоб отримати картинку 3:4, додайте після текстового промпту:
--ar 3:4
Також можна вказати висоту і ширину через параметри --h і --w.
Щоб перервати процес генерації на півдорозі, використовуйте:
--stop 50
Це допоможе створити м'яку композицію без чіткого фокусування на об'єктах.
Він дає змогу виключити з картинки небажані елементи. Просто після --no опишіть те, чого бути не повинно.
Ось кілька універсальних порад, які поліпшать ваші запити в будь-якій нейромережі:
Як бачите, створити ідеальний запит – це ціле мистецтво. Але якщо слідувати основним принципам і експериментувати, ви обов'язково досягнете бажаних результатів від Midjourney, Stable Diffusion і будь-якої іншої нейромережі!