Umělecké generátory mají špatný rap, protože vytvářejí nepřesné zobrazení rukou. Postavme Midjourney v5 proti Dall-E 2, abychom viděli, která je na tom lépe.

Generátory umění umělé inteligence nepřestávají dělat dojem a umožňují nám vytvořit téměř vše, co si dokážeme představit. Zdá se však, že tato technologie narazila na cihlovou zeď, pokud jde o generování realisticky vypadajících rukou.

Zde se podíváme na dvě z předních generativních uměleckých aplikací a postavíme je proti sobě – nebo mezi sebou – abychom zjistili, které mohou generovat lepší handy, Midjourney v5 nebo Dall-E 2. Ovládali jste některou z těchto aplikací? Pojďme to zjistit!

Problém AI s rukama

Od té doby, co se umění generované umělou inteligencí rozšířilo na internetu, došlo k kritice kvalita rukou nakreslených AI. Navzdory nedávným aktualizacím, jak ukazuje naše srovnání vedle sebe, nebyly výsledky uspokojivé.

Oba uchazeči s každou iterací zdokonalovali své schopnosti a kvalitu svých výstupů. nejnovější aktualizace, Verze 5 Midjourney

instagram viewer
, prokázal působivý pokrok. Problém s rukama nakresleným umělou inteligencí však zůstává nevyřešen a nelze jej ignorovat.

Porovnání 1: Použití výzev "Ruka" a "Ruce"

Naše srovnání budou obsahovat přesně stejné výzvy pro Dall-E 2 i Midjourney v5. Výzvy navrhneme tak, aby byly specifické pro ruce, místo abychom jednoduše vytvořili lidi, aby viděli, jak ruce vypadají. Každé aplikaci také dáváme pouze jednu šanci (hodit) na každou výzvu.

Ruka

Začněme tou nejzákladnější a nejrelevantnější výzvou: „rukou“.

Midjourney v5:

Dall-E 2:

Nezačínáme dobře!

Midjourney zvolil neobvyklou cestu spojování ruky s poněkud kreativními situacemi. Místo abychom se soustředili pouze na ruku, vidíme čaroděje, rukavice, kostlivce a malinkou figurku. Na obrázku rukavic také chybí prst.

Dall-E 2 má opačný přístup a nabízí nám pouze jedinou ruku na jednoduchém pozadí. Ale kupodivu tam jsou některé podivné polohy, zejména s palci, které nevypadají přirozeně nebo pohodlně. Každá ruka je také uříznuta na jedné ze stran obrázků.

Kdo vyhraje toto kolo? Pro celkovou přesnost to dáme Dall-E 2.

Ruce

Nyní udělejme výzvu v množném čísle, „ruce“, a uvidíme, na co AI přijdou.

Midjourney v5:

Dall-E 2:

Pokus Midjourney o „ruce“ tentokrát dopadne lépe. Ale všechny čtyři obrázky jsou černobílé a chybí nám nějaké prsty. Při bližším prozkoumání můžete také vidět, že některé číslice mají podivný tvar nebo přecházejí jedna do druhé.

Dall-E 2 nadále obsahuje ruce s jednoduchým pozadím. Nechybí žádné číslice, ale ručičky jsou na třetím obrázku oříznuté a ostatní verze působí poněkud neohrabaně v kompozici a zcela postrádají kreativitu.

Nazvěme toto srovnání remízou. Dall-E 2 by vyhrál pro přesnost, pokud by to byl jediný faktor, ale Midjourney dokáže nějaké vytvořit krásné snímky v černobílém provedení, i když všechny čtyři verze nejsou příliš realistický.

Vždy můžeš pomocí Photoshopu opravte své umění Midjouneyvčetně rukou.

Srovnání 2: Gesta rukou

Porovnejme několik gest rukou, která jsou téměř všeobecně uznávaná.

Zkřížené prsty

Nejprve si zkusme „překřížit prsty“.

Midjourney v5:

Dall-E 2:

Dá se s jistotou říci, že Midjourney tuto výzvu úplně zpackal. Chybí nám prsty a žádná z verzí nevypadá vůbec přirozeně.

Klobouk dolů ještě jednou před Dall-E 2, jak správně počítal počet prstů, ale to je jediná dobrá zpráva. Každá verze vypadá, jako by prsty udeřily do vlastních jógových pozic ve hře Twister.

V tomto srovnání není vítěz.

Palec nahoru

Dále postupujeme s "palcem nahoru".

Midjourney v5:

Dall-E 2:

Midjourney zjišťuje správný počet prstů a zároveň zachází s každou výzvou kreativním způsobem. Všimli jste si zavedení ilustrativního stylu?

Dall-E 2 také získává body za přesnost, aniž by se snažil rozhoupat loď něčím kreativním přidaným ke každému výsledku.

Tady není jasný vítěz.

Porovnání 3: Ruce s předměty

Nyní zvýšíme složitost tím, že vyzveme ruce k interakci s předměty.

Ruka držící křišťálovou kouli

Začněme s náhodným objektem pomocí výzvy „ruka držící křišťálovou kouli“.

Midjourney v5:

Dall-E 2:

Jak zvyšujeme složitost, Midjourney začíná zářit. Kromě toho, že pár ztvárnění vypadá nepřirozeně, ruce a křišťálové koule vypadají krásně. Midjourney dokonce zabere čas na vytvoření odrazů ve skle, které jistě přispívají k celkové kreativitě.

Ale poprvé vidíme, že Dall-E 2 postrádá číslici alespoň v jedné z hand, přičemž čtvrtá ruka vypadá prostě divně. Křišťálové koule také nevypadají tak působivě ve srovnání s Midjourney's.

Midjourney získává své první vítězství.

Ruka držící vodu

Zkusme něco ještě složitějšího s pobídkou „ruka drží vodu“.

Midjourney v5:

Dall-E 2:

Midjourney dokáže hodit pouze jeden obrázek se správným počtem číslic. I když je to krásně vykreslené, opět začínáme vidět trhliny v oddělení uvěřitelnosti.

Dall-E 2 také bojuje s dosažením přirozených rukou, ale odvádí mnohem lepší práci. Pro určitou rozmanitost také přepne barvu na pozadí.

Toto kolo dáme Dall-E 2.

Porovnání 4: Pracovní ruce

Pro toto srovnání vytvoříme výzvy, které mají ruce zapojené do činností.

Ruce formovací hlína

Pojďme se podívat, jak si AI modely vedou s „rukama formovací hmotou“.

Midjourney v5:

Dall-E 2:

Midjourney na dvou snímcích minul prst, ale vše ostatní vypadá skvěle.

Obrázky Dall-E 2 vypadají matoucí a přeplněné a v polovině verzí se uchylují k přidání rukou jiné osoby.

Hrana jde do Midjourney.

Ruce lisování těsta

Zkusme podobnou činnost, „rukama mačkat těsto“.

Midjourney v5:

Dall-E 2:

Obrázky Midjourney vypadají celkově skvěle. Ale ještě jednou, polovina z nich má chybějící číslice. Snímkům ale nelze vytknout jejich výtvarnou stylizaci.

Verzím Dall-E 2 chybí prsty i v polovině provedení a dokonce jeden přidávají do poslední ruky v sadě.

Nazvěme to remízou.

Pokud byste si tato srovnání chtěli sami vyzkoušet, ukážeme vám je jak používat Midjourney k vytvoření umění AI.

Co nám říkají výsledky?

Je zábavné jít porovnávat a určit celkového vítěze. A kdybychom si měli vybrat, nazvali bychom to ve prospěch Midjourney v5. Přestože Dall-E 2 častěji vytvářel ruce se správným počtem prstů, bylo to právě Midjourney, kdo vytvořil umělecky ztvárněné a přitažlivější obrázky.

Ale obě aplikace mají své místo na trhu pro umělce, kteří pro svou práci znovu používají obrázky Dall-E 2 a Midjourney. Oba jsou schopni vytvořit ruce, které lze použít jako výřezy nebo v kompozitech pro umělecké, redakční a komerční použití. Je to jen otázka osobních preferencí.

AI si nakonec podmaní ruce

Generativní umělecké aplikace jako Dall-E 2 a Midjourney ušly dlouhou cestu ve své schopnosti vytvářet realistické a fantastické umění. Stále bojují s generujícími rukama, ale vzhledem k akceleraci generativních technologií můžeme v blízké budoucnosti očekávat pouze zlepšení.