Unul dintre principalele obstacole întâmpinate de către cei ce generează imagini cu ajutorul instrumentelor AI este lipsa de „uniformitate” a personajelor. În termeni simpli, indiferent de promptul sugerat, nu puteai crea un personaj pe care să-l pui în diverse ipostaze și scene și să arate la fel, așa încât să poți păstra firul unei eventuale povești vizuale.
Lipsa de coerență și uniformitate a personajelor generate de AI a luat sfârșit odată cu introducerea parametrului –cref din Midjourney, Astfel, am intrat într-o nouă eră a preciziei și consecvenței în crearea personajelor AI. Midjourney promite să revoluționeze modul în care creatorii abordează replicarea personajelor, oferind un nivel de control și fiabilitate nemaiîntâlnit până acum.
Prin utilizarea tehnologiei de ultimă generație a Midjourney, versiunea 6, creatorii pot naviga prin complexitatea replicării personajelor cu ușurință și eficiență.
În cele ce urmează ne-a propus să-ți arătăm pas cu pas cum să creezi personaje uniforme cu Midjourney. (vezi aici cum să folosești Midjourney)
De ce ai nevoie de personaje generate în mod uniform?
Există multe situații în care este important ca un personaj să rămână uniform și coerent în mai multe imagini. De exemplu:
Ședințe foto: Vrei ca aceeași persoană, îmbrăcată în aceleași haine, să stea în poziții diferite în locații diferite.
Povestiri vizuale: Benzile desenate și cărțile ilustrate au nevoie de personaje care să arate la fel în diverse ipostaze.
Probe virtuale: S-ar putea să ai nevoie ca același model să prezinte diferite ținute.
Ce-i drept, și până acum era (și este) posibil să antrenezi un model precum Stable Diffusion pe un anumit personaj sau pe o anumită imagine prin Dreambooth sau alte instrumente similare. Dar acest lucru necesită mult timp, zeci de imagini de referință și un computer foarte puternic.
Alternativ, puteai obține personaje semi-consistente în Midjourney folosind sugestii de imagini. Cu toate acestea, compoziția originală a imaginii de referință s-ar fi reflectat invariabil în rezultat, așa că era dificil să se meargă pe stiluri, ținute, scene etc. diferite.
În schimb, noul parametru Midjourney numit –cref (“character reference”) îți permite să recreezi un personaj pornind doar de la o singură imagine. Să vedem cum funcționează.
Cum să generezi personaje uniforme cu Midjourney
Iată pașii ce trebuie urmați în Midjourney pentru a genera personaje uniforme:
Pasul 1 – Crearea imaginii de referință
Există două posibilități: fie creezi o imagine nouă, cu ajutorul Midjourney, fie încarci fotografia-portret, pe post de referință.
Momentan, prima variantă funcționează mult mai bine, și o vom folosi în ceea ce urmează. Cei de la Midjourney susțin, de altfel, că opțiunea cref merge mânușă cu personajele create de instrumentul de generare. Prin urmare, am ales să generăm portretul unui explorator urban, prin următorul prompt:
A high-resolution photorealistic portrait of a handsome urban explorer, capturing the essence of their adventurous spirit. This figure is equipped with exploration essentials: a high-tech backpack, durable and functional clothing for urban exploration, and a camera slung around their neck for documenting their finds. Their face shows determination, curiosity, and a readiness for the unknown.
Am primit patru variante, dintre care am ales-o pe a patra, care ni s-a părut cea mai apropiată de ceea ce ne doream.
Am apăsat pe U4, pentru a primi varianta unică.
Acum aveam nevoie de url-ul imaginii, așa că am ales să deschidem imaginea în browser (Open in Browser). După care am copiat url-ul imaginii: https://s.mj.run/Y6vUAAR2uXc
Pasul 2 – Generarea diverselor scene cu personajul creat
În continuare, totul e foarte simplu. Tot ceea ce trebuie să faci acum este să atașezi –cref la finalul promptului dorit.
L-am pus pe exploratorul nostru urban în mai multe ipostaze. De remarcat că la finalul promptului am adăugat —cref (cu două liniuțe înainte), urmat de link-ul imaginii inițiale:
A photorealistic depiction of an urban explorer perched on the edge of a high rooftop at twilight. The city stretches out below them, a maze of lights and shadows. The explorer is dressed in a weather-resistant jacket, gloves, and carries a camera on a strap over their shoulder, capturing the breathtaking view. Their face is lit by the soft glow of the setting sun, reflecting a sense of accomplishment and awe. The sky is painted with hues of orange, pink, and purple, adding a dramatic backdrop to the scene. –ar 4:3 –cref https://s.mj.run/Y6vUAAR2uXc
Sau:
A photorealistic image of an urban explorer standing in the vast, abandoned hall of an old factory. The explorer is equipped with a rugged backpack, durable clothing, and a helmet with a mounted flashlight. Around them, rusted machinery and scattered debris create an atmosphere of forgotten history. The lighting is dim, with beams of light filtering through broken windows, illuminating dust particles in the air. –ar 4:3 –stylize 400 –style raw –cref https://s.mj.run/Y6vUAAR2uXc
Sau:
A photorealistic image of an urban explorer discovering a burst of colorful, hidden graffiti art in a narrow alleyway. The explorer holds up a small, portable light, revealing the vibrant colors and intricate designs of the graffiti, which contrast starkly with the surrounding decay. They are dressed casually but with practicality in mind, wearing a backpack filled with exploration gear and a camera ready in hand to document this hidden urban gem. –ar 4:3 –stylize 400 –style raw –cref https://s.mj.run/Y6vUAAR2uXc
Sau (în variantă mai puțin sofisticată):
A handsome guy resting on a beach, storm is coming –ar 4:3 –stylize 400 –style raw –cref https://s.mj.run/Y6vUAAR2uXc
Parametrul –cw, pentru schimbarea ținutei
După cum se poate remarca, îmbrăcămintea personajului a rămas cam la fel, imaginea nerespectând promptul în privința ținutei. Este momentul să introducem parametrul –cw.
Dacă nu scrii acest parametru în finalul promptului, Midjourney îi va considera valoarea implicită, care este 100. Valoarea lui –cw se poate încadra între 0 și 100:
–cw 0 = se vor replica doar caracteristicile faciale ale personajului
–cw 100 = se vor replica toate caracteristicile inițiale ale personajului
Așadar, am revenit cu ultimul prompt, fiindcă ținuta exploratorului nostru era cam nepotrivită pentru plajă:
A handsome guy resting on a beach, in a fancy t-shirt, storm is coming –ar 4:3 –cw 0 –stylize 400 –style raw –cref https://s.mj.run/Y6vUAAR2uXc
Hop! L-am îmbrăcat în tricou, acum e mai relaxat.
Te poți juca cu valorile acestui parametru pentru a te bucura de rezultate:
A handsome guy resting on a beach, in a hawaiian shirt, storm is coming, boat on the shore –ar 4:3 –cw 45 –stylize 400 –style raw –cref https://s.mj.run/Y6vUAAR2uXc
Am adus barca și l-am îmbrăcat într-o cămașă hawaiană care păstrează unele caracteristici ale costumului inițial (având în vedere valoare –cw 45).
Limitările parametrului —cref
Deoarece –cref este o funcție nouă, deocamdată există câteva probleme care probabil se vor rezolva în viitorul apropiat:
1. Nu este precis în privința detaliilor minore. Te poți trezi cu mici diferențe în fizionomia personajului generat.
2. Funcționează cel mai bine în cazul personajelor umane
Poți încerca –cref și cu personaje non-umane, animale sau obiecte, dar rezultatele sunt mai puțin convingătoare.
3. Nu poți genera scene cu mai multe personaje. Am încercat să punem exploratorul alături de alt personaj în aceeași scenă. Nu merge. Omul nostru nu vorbea cu o fată frumoasă, ci cu o clonă de-a lui.
A handsome guy resting on a beach, chatting with a beautiful girl –ar 4:3 –stylize 400 –style raw –cref https://s.mj.run/Y6vUAAR2uXc
În concluzie
Așadar, parametrul –cref este un pas mare către generarea de imagini cu personaje care-și păstrează coerența. Testează și tu această funcție, joacă-te cu ea și cu alți parametri și vei avea parte de surprize plăcute!