Umělá inteligence nás může oklamat a zaměnit vytvořené umění za skutečné fotografie. Proč jsou tedy ruce tak velkou výzvou?
Generátory AI se před našima očima vyvíjejí děsivým tempem, ale stále mají chyby. Pozorování podivných detailů na obrázcích AI je vlastně docela legrační. To je důvod, proč se ruce Midjourney staly horkým tématem, problémem běžným u mnoha motorů.
Pojďme si rozebrat, proč ruce tolik vyzývají generátory obrázků AI. Jejich programátoři již tento problém hodný meme opravují, ale je zajímavé přemýšlet o tom, jak se umělá inteligence učí, nemluvě o tom, co se jí postaví do cesty.
Proč ruce generované umělou inteligencí vzbudily rozruch
Každý, kdo používá AI motory k vytváření obrázků, si mohl všimnout, že ruce zřídkakdy vyjdou správně, ale problém se obrátil, když se na Twitteru objevila spousta „fotek“.
Při bližším zkoumání je podivné ruce lidí prozradily jako obrázky generované AI. Skutečnost, že to byl Midjourneyův pokus o ruce, dělala situaci zajímavější.
Jeden z nejlepších motorů umělé inteligence v okolí si nedokázal poradit se složitostí lidských rukou, takže schopnosti Midjourney a jeho konkurentů byly podrobeny zkoušce. Pravda, dokonce i DALL-E je náchylný k nerealistickým prstům a nehtům.
Humbuk byl nepřiměřený vzhledem k tomu, že ruce generované umělou inteligencí byly vždy problémem, ale zvláštní pozornost vyvolala vydání Midjourney v5 pro vylepšení oproti verzi 4.
Nová verze si dala záležet na vylepšení ručního designu, což je jasným znamením, že inženýři AI věnovali pozornost veselému rozruchu a rozhodli se upgradovat možnosti softwaru.
Ostatní motory jsou pomalé, aby následovaly příklad Midjourney oprava AI art pomocí Photoshopu zůstává neocenitelnou dovedností. Hlavní překážkou pro programátory je, jak složité je vycvičit umělou inteligenci, aby kreslila přesvědčivé ruce.
Proč se generátory obrázků AI potýkají s rukama?
Motory umělé inteligence využívají k vytváření obrázků generativní adversariální sítě (GAN) nebo Stable Diffusion. Obě technologie vyžadují rozsáhlé zdrojové materiály, školení a zpracovatelský výkon k vytvoření i těch nejzákladnějších uměleckých děl.
Vzhledem k tomu, že již existující obrázky jsou ústředním bodem výcviku umělé inteligence, programátoři musí do svého softwaru dodávat tisíce, ne-li miliony obrázků. vedle výzev – opakování procesu znovu a znovu, dokud motor nepochopí, co konkrétní slovo znamená a jak to znázornit objekt.
Ale zdrojové obrázky, ze kterých se AI učí, jsou hlavně 2D, kde jsou ruce vyobrazeny v různých pozicích. Ať už rovný nebo stočený, ukazuje pět nebo tři prsty.
Na konci dne stroj ve skutečnosti nerozumí konceptu rukou a obrázky, ze kterých se učí, ne vždy obsahují ruce dostatečně jasně nebo konzistentně. To je důvod, proč ruce Midjourney mohou být tak ošklivé: zmatení AI.
Stejně platný jako Obavy Elona Muska z vývoje AI může být, některé části technologie se mají ještě hodně co učit. A jejich překážky přesahují nedostatečné příklady rukou.
Další důvody, proč se generátory obrázků AI zlepšují pomalu
Při pohledu na Modely Midjourney, v5 nabízí pokročilou koherenci mezi textovými výzvami a vytvořenými obrázky, stejně jako vyšší rozlišení a další nástroje. Ale takové úspěchy nejsou levné.
Trénink umělé inteligence, aby uměl lépe pracovat s rukama, vyžaduje poskytování lepších obrázků, zejména ve 3D. To znamená, že procesy, od získávání zdrojových materiálů po vylepšování kódování a opakování školení, dokud to AI nezvládne, vynaloží spoustu času a lidské síly.
I tehdy může software dělat chyby v jinak ohromujících uměleckých dílech. Kromě toho, že je to obrovská a složitá práce, je to drahé. Takže nečekejte bezplatné generátory AI textu na obrázek aby se ještě dostal na úroveň Midjourney.
Zjednodušeně řečeno, problém s motory AI není jen o neschopnosti těchto počítačových programů zcela porozumět tomu, jak lidské rysy, jako jsou ruce a nohy, vypadají nebo fungují. Záleží také na tom, co to stojí, a na přístupu technologie k 3D snímkům a technikám strojového učení, které mohou generátorům pomoci získat realističtější pochopení světa kolem nich.
Generátory obrázků AI nebudou bojovat věčně
Ruce jsou pro umělou inteligenci složitým konceptem, jak zabalit svou binární hlavu, ale řešení tohoto problému již fungují. Midjourney, DALL-E 2 a další platformy budou nakonec schopny udržet svérázné prsty na minimu, ne-li je úplně vymýtit.
Pokrok v jiných oblastech umělé inteligence zajišťuje, že se technologie neustále vyvíjí a její vývojáři se stále učí nové způsoby, jak ji aplikovat a vylepšit.