iDNES.cz

Premium

Získejte všechny články
jen za 89 Kč/měsíc

AI Art: budou roboti malovat lépe než malíři?

7. července 2022

Když malíř Josef Čapek poradil bratru Karlovi, aby humanoidy v jeho novém dramatu pojmenoval "roboti", asi netušil, že o století později mu tato stvoření začnou fušovat do řemesla. Umělá inteligence má zjevné umělecké ambice.

(prolog)

Uměleckými kruhy obchází strašidlo - strašidlo umělé inteligence.

Výpočetní systémy, které si až donedávna lámaly hlavu pouze s regresí či numerickou klasifikací, najednou počaly strkat své zvědavé mikročipy do světa palet, pláten a stojanů. Jejich první mazanice sice připomínaly nemotorné abstrakce okresních rádoby-bohémů, ale díky překotnému rozvoji hardvérové kapacity i softvérové sofistikovanosti jsme se během pár let dostali do stadia, kdy se na jejich kreace už docela dá dívat (s lehce přimhouřeným okem). Přímo před vlastními zraky nám tak pomalu vzniká nový umělecký žánr AI Art (umění umělé inteligence).

Obavy malířů o jejich živobytí jsou ale, myslím, přehnané. Tak jako fotografie neznamenala konec malířství, ani umělá inteligence nebude znamenat konec lidských pokusů o svébytné zachycení vizuální stránky našeho světa. Pouze zde vedle sebe budou existovat tři paralelní žánry: klasické malířství, umělecká fotografie a AI Art. K jistým posunům v aplikacích těchto žánrů jistě dojde, ale nepochybuji, že každý z nich si v lidské komunitě vybojuje určitý životní prostor.

Pokrok se ale nedá zastavit. Strkat před umělou inteligencí hlavu do písku, nebo se ji dokonce pokoušet sabotovat by bylo stejně pošetilé jako když dělníci v Anglii devatenáctého století rozbíjeli první stroje.

V tomto blogu nejprve načrtnu, jak se roboti vlastně učí malovat a pak vám ukážu dvě konkretní webová pískoviště, kde si s umělou inteligencí můžete hrát sami.

Já jsem se štětcem v ruce takový malý patla, takže u mě umělé umění vyhrálo kontumačně :-)

+++++++++

Jak generovat obrázky

(tuto sekci můžete přeskočit)

Budu předpokládat, že víte něco málo o neuronových sítích (zhruba v rozsahu tohoto Matykání).

Většina lidí si programové generování obrázků představuje tak, že počítač prostě vleze do nějaké složky, kde má uloženy miliony obrázků, a z nich algoritmicky vybere ten, který dle jeho integrovaných obvodů nejlépe odpovídá zadání.

Tak to ale nefunguje. Počítač s AI softvérem ty obrázky skutečně sám vytváří (generuje). Jedna z tradičních metod využívá tzv. GAN sítě (generative adversarial network).

Jejich princip se dá popsat analogií z oboru padělání peněz.

Proti sobě stojí padělatel (padouch), který ve své dílničce padělá peníze, a znalec (klaďas), který se je snaží rozlišit od peněz skutečných. Tomu tedy přicházejí na stůl dva typy bankovek: skutečné (z banky) a padělané (z dílničky). Znalec se snaží naučit, které jsou které. Trik spočívá v tom (a tady se nám ta analogie trochu rozejde s reálným světem), že kdykoliv znalec kápne na nějaký grafický aspekt, který mu umožní padělky odlišit (např. vyobrazený president má tři oči), tak tuto skutečnost sdělí padělateli, který se z ní poučí a zdokonalí svou metodu (začne presidentům malovat pouze dvě oči).

Po čase se padělatel (na základě informací od znalce) naučí dělat padělky tak zručně, že znalcova úspěšnost rozlišení se začne přibližovat prostému hádání - tj. cca 50%. A zde hra končí. Znalec už není schopen padělky rozpoznat.

+++++++++

A teď zpátky k padělání inteligence.

Ve světě AI Art proti sobě stojí dvě neuronové sítě. Jedna z nich (padělatel čili generátor) vytváří obrázky určitých objektů a druhá (znalec čili diskriminátor) se je snaží rozlišit od skutečných obrázků těchto objektů. To je základní kostra GANu.

Představme si pro jednoduchost, že se budeme snažit naučit síť vytvářet černobílé obrázky rejnoků (řekněme 20x20 pixelů).

Každý takový obrázek je de facto 400 reálných čísel, reprezentujících hodnoty šedosti pro všech 400 pixelů. Generátor si je vytvoří tak, že náhodně vygeneruje N čísel (třeba N=5), ta pověsí na vstup s 5 neurony, prožene jejich hodnoty sítí a na výstupu, který má 400 neuronů, odečte 400 hodnot (to budou ty "šedosti" generovaného obrázku) a poskládá je po řádcích do úhledného obdélníčku 20x20 pixelů. Pokud vám vrtá hlavou proč si rovnou náhodně nevygenerujeme hodnoty těch 400 pixelů - je to proto, že potřebujeme mechanismus, jak se z určitých parametrů (zde 5 náhodných čísel) dopídit výsledných obrázků nějakým procesem, který můžeme kontrolovat - a manipulace s váhami té sítě nám takový mechanismus poskytují.

Diskriminátor dostane na svůj vstup náhodně pomíchanou sekvenci skutečných rejnočích obrázků a obrázků, generovaných generátorem. Ze začátku je diskriminátorova úspěšnost prakticky 100%, protože generátor vytváří v podstatě jen jakési náhodné čmouhy. I malé děcko, které rejnoka ještě nikdy nevidělo, dokáže po chvíli tréninku samo rozlišit obrázky rejnoků od náhodně vytvořených čmouh.

Jak se ale diskriminátor učí skutečné rejnoky odlišovat od strojově generovaných obrázků (padělků), výsledky svého zkoumání předává generátoru (tak jako je znalec předával padělateli) a to prostřednictvím určitých informací o parametrech dané neuronové architektury. Generátor tyto informace zahrne do nastavení své generativní sítě a příští generace uměle vytvořených obrázků už bude o něco chytřejší, takže diskriminátorova úspěšnost trochu sleze. Přesto ale všechny informace, které během dalších kol rozlišovacího procesu nastřádal, předává i nadále generátoru.

No a takhle si ti hoši tiše hrají, až se generátor naučí vytvářet obrázky, které diskriminátor od obrázků skutečných rejnoků už nedokáže odlišit. Jeho úspěšnost se pak rovná hádání - tj. diskriminátor si může víceméně hodit korunou, zda je obrázek generovaný a nebo skutečný. A zde hra končí. Diskriminátor se odpojí (ten už potřebovat nebudeme) a generátor se použije pro generování obrázků rejnoků.

Všimněte si, že generátor ty rejnoky z žádné složky netahá. On je skutečně generuje z těch 5 náhodně zvolených čísel prostřednictvím své neuronové sítě (kterou ve spolupráci s diskriminátorem pro tento účel vytrénoval). A protože 5 náhodných čísel se dá nasekat nekonečně mnoha způsoby, generátor je schopen vyprodukovat prakticky libovolný počet poměrně realistických rejnoků.

No a podobně se počítač naučí generovat obrázky hradů, aut, hub, syslů nebo na co si vzpomenete.

Samozřejmě trénink této dvousítě (generátor-diskriminátor) vyžaduje obrovské množství označených obrázků (řádově tisíce a víc), které diskriminátor používá pro srovnání s výstupem od generátoru. Ale s tím není problém - sociální sítě dnes generují miliony dobře popsaných fotografií denně (Facebook, Instagram, Twitter atd). Pokud jste publikovali fotografii "Jé, mami, rejnok", tak jste právě umělé inteligenci usnadnili život.

Trénink sice trvá na vysoce výkonných počítačích několik hodin, někdy i dnů, ale výsledkem je síť, která dokáže z náhodně vybrané n-tice čísel vytvořit obrázek konkretního objektu.

Lidé ale obvykle nepopisují obrázky čísly, ale slovy. Proto je dnes velice populární generovat obrázky na základě textu ("Text to Image"). Princip je stejný, jen se k náhodně generovaným číslům přidají na vstupu popisné texty a generátor si s tím nějak poradí. O "školící materiál" pro trénink sítě opět nouze není, protože sociální média poskytují spoustu obrázků doprovázených rozsáhlým komentářem.

(zajímají-li vás podrobnosti, jukněte sem a nebo sem)

Pokud vás technické detaily děsí, nevěste hlavu. Stejně jako automobilový závodník nemusí nic vědět o funkci spalovacího motoru (dokonce nemusí ani umět ten motor opravit), AI umělec nemusí nic vědět o statistických metodách, které celý softvérový komplex pohánějí. Jen se musí naučit s ním pracovat.

Podívejme se teď na dva konkrétní příklady.

+++++++++

Wombo Dream

(něco pro začátečníky)

Wombo Dream je pro svou jednoduchost vynikající startovní bod pro experimenty.

Nemusíte si nikde vytvářet účet - natož za něj platit. Prostě klikněte sem a jste na koni.

Vpravo nahoře klikněte na "Start Creating" a na další stránce vlevo naťukejte anglický text nápovědy (prompt) až do výše 100 znaků. Tedy to, co chcete nakreslit, např. "old bridge in the jungle". Hned pod tím si vyberte jeden ze stylů a klikněte "Create". A pak už jen sledujte, co systém z vašich slov vykouzlí. Je to taková pozvánka do říše fantasie.

Tady je pár ukázek. Prompt je uveden vždy na spodu. Na název dílka (v záhlaví) se vás systém zeptá po dotvoření. Nemusí být stejný jako prompt.

Někdy je nutno si trochu pohrát se stylem (z nabídnutého menu), protože ne každý styl se hodí ke každému promptu. Také nezapomeňte, že každý obrázek můžete generovat opakovaně (s jinými počátečními podmínkami sítě), kliknutím na tlačítko "generate again" na spodu obrázku. Tady je např. Archimédův zákon jako prompt ve třech různých stylových provedeních (prompt může mít maximálně 100 znaků, takže jsem ho musel lehce zkrátit a vyházet z něj členy).

A na závěr se podíváme jak podle umělé inteligence vypadá Jára Cimrman. Myslím, že to docela trefila (styl: steampunk :-)

Pokud se vám "dílo" povede, což není vždycky, můžete kliknout na "Save" a nová kreace spadne vašemu počítači do klína (obvykle do složky Downloads/Stahování). To se hodí i proto, že síť v sobě obsahuje určité nahodilé parametry, takže i ze stejného promptu už by se vám ten obrázek nemuselo podařit zrekonstruovat.

+++++++++

Night Cafe

(něco pro mírně pokročilé)

Night Cafe funguje podobně, ale pro solidnější práci vyžaduje registraci. Za každý výpočet pak platíte kredity, které si buď zaplatíte a nebo je nasbíráte podle určitých pravidel (mám pocit, že na začátku jich dostanete 5 zdarma a pak za určité aktivity).

Night Cafe provádí buď "Style Transfer" (o čemž jsem se zmínil v jednom starším blogu) a nebo "Text to Image", ale s jinými volbami než v případě Wombo. Nejenže si můžete nastavit poměr stran a velikost obrázku (za větší ale zaplatíte více kreditů, protože ty spotřebují více výpočetní síly), ale hlavně můžete ke svému vznikajícímu dílku přidávat další prompty. Night Cafe vám ukazuje celou historii daného projektu, takže se můžete libovolně vracet ke starším verzím a přidávat k nim jiné prompty a sledovat, co to s obrázkem udělá. Jinými slovy umožňuje vám obrázek generovat postupně (Wombo vám ten obrázek udělá z jedné vody načisto).

Tady je pár ukázek. Na rozdíl od Wombo Dream mi ale přijde, že mají spíš charakter fotografií než maleb.

Začnu ilustrací své předešlé básně a pak objednám jedno zátiší s kytičkami.

(prompt: octopus on matterhorn)

(prompt: flower paradise in a distant galaxy)

Pokud se vám nějaká kreace zalíbí, můžete požádat o další evoluci, kdy systém přidává nové detaily a propracovává ty staré. Tedy je příklad dvou po sobě jdoucích iterací.

(prompt: dandelion waterfall in antarctica)

Jinými slovy nenechte se odradit, pokud je první verze primitivní. Pokud vás něco zaujme, rozviňte ji tlačítkem "evolve". Ale bude vás to stát další kredity. Jak jinak.

Jak jsem naznačil, můžete přidat i sekundární prompty. Další série vznikla z nápovědy: "stars dancing on a galactic bridge", ke které jsem později přidal "vortex" a "hovering bird".

Pokud chcete vidět další příklady, můžete zkusit hashtag #wombodream nebo #nightcafe na Instagramu.

Wombo vám vytvoří obrázek za zhruba půl minuty, NightCafe za minutu, ale ta první verze je obvykle příliš hrubá, takže na solidní obrázek spotřebujete 3-5 iterací. Na mistrovské dílko deset a více :-)

Mimochodem, těch generátorů AI Art poměrně rychle přibývá. Pokud si za pár měsíců budete chtít zkusit něco nového, naťukejte do googlu "AI Art generator".

+++++++++

(epilog)

V prologu jsem odpověď na titulní otázku trochu zahrál do autu.

Pokud byste na mě ale namířili bambitku a dožadovali se jednoznačné odpovědi, asi bych řekl ANO. Roboti budou jednou malovat lépe než malíři.

Soudím hlavně dle dimenzí neuronové sítě, která dílka vytváří. Lidský mozek má k disposici relativně omezený soubor neuronů, které musí kromě malování ještě řídit pochody v lidském těle, pamatovat si cestu do práce, nabiflovat pythagorovu větu, rozpoznat obličeje přátel a příbuzných atd atd. Umělá inteligence bude mít k disposici stále výkonnější procesorové jednotky, které se budou moci plně koncentrovat na vývoj obrázků (a to ještě pominu, že za okny už burácí kvantová bouře). Taková výpočetní síla dokáže věci, o kterých se lidskému mozku ani nesnilo.

Já vím, svrchu uvedené ukázky jsou primitivní. Ale nezapomeňte, že AI Art existuje teprve pár let. Když to vztáhnu na fotografii, pohlížíme v podstatě na daguerrotypy.

Myslím, že do deseti let budeme mít systémy, které budou schopny načíst básničku či novinovou zprávu a "zareagovat" na ni uměleckým dílem (tedy vygenerovat je na základě přečtených slov). "Guernica" to ještě asi nebude, ale i té se jednou dočkáme. Autorem bude bezesporu Sand Robotticelli.

Můžete také namítnout, že výtvory AI Art nemají duši. Že nevytryskly z žádné radosti či bolesti. To je pravda. Algoritmus žádnou bolest ani radost necítí. On jen vytváří určitý styl. Ale ruku na srdce: dokážete rozpoznat, kdy něco vytvořila lidská mysl, a kdy jen AI algoritmus evokující lidskou emoci?

Dnes možná ano, ale za pár let už asi ne.

Autor: Jan Řeháček | čtvrtek 7.7.2022 9:09 | karma článku: 16,58 | přečteno: 666x

Zvyšte článku karmu!

Jan Řeháček

Jaro: das ist nur die erste Phase

Jaro má v našem parku tři fáze, které jsem výstižně pojmenoval: první, druhá a třetí. Toto je svědectví o první z nich. Můžeme s ním nesouhlasit, můžeme proti němu protestovat, ale to je asi tak vše, co s tím můžeme dělat, Járo.

9.4.2024 v 9:09 | Karma: 16,67 | Přečteno: 425x | Diskuse| Fotoblogy

Jan Řeháček

A je po Velikonocích. A nejen po nich.

Globální kotlík zavěšený nad ohněm inkluze a diversity pomalu vytlačuje národní státy, vyrůstající ze sdíleného kulturního podhoubí. Tomuto trendu se nově přizpůsobuje i řada českých svátků s jejichž novelizací vás chci seznámit.

1.4.2024 v 9:09 | Karma: 21,16 | Přečteno: 460x | Diskuse| Společnost

Jan Řeháček

Impresionisté na hladině

Když se na podzim objevily barvy na stromech, všiml jsem si, že se občas zrcadlí v našem potoce či rybníčku. Tak jsem na ně zamířil objektiv a vyšly z toho roztěkané výtvarné kreace, za které by se nemusel stydět ani Claude Monet.

9.3.2024 v 9:09 | Karma: 22,50 | Přečteno: 324x | Diskuse| Fotoblogy

Jan Řeháček

AI Art: co už umí a co ještě ne

Loni jsem trochu experimentoval s malířskými schopnostmi tehdy nastupující generativní AI Art. Letos, za dlouhých zimních večerů jsem si na to vzpomněl a napadlo mne podívat se, jak moc za ten rok AI pokročila. Nu, posuďte sami.

15.2.2024 v 9:09 | Karma: 17,91 | Přečteno: 372x | Diskuse| Ostatní

Jan Řeháček

Není větvička jako větvička

Stromy a jejich rozeklaná větvoví jsou sochařská díla. V létě to ale nepoznáte, protože přírodní majstrštyky zakrývá koruna. Jakmile ale podzim povolá svá vojska zpět do zálohy, ladná elegance dřevěných křivek vystoupí do popředí.

9.2.2024 v 9:09 | Karma: 19,45 | Přečteno: 438x | Diskuse| Fotoblogy

Další články autora

Tři roky vězení. Soud Ferimu potvrdil trest za znásilnění, odvolání zamítl

22. dubna 2024, aktualizováno 14:47

Městský soud v Praze potvrdil tříletý trest bývalému poslanci Dominiku Ferimu. Za znásilnění a...

Studentky rozrušila přednáška psycholožky, tři dívky skončily v nemocnici

25. dubna 2024 12:40, aktualizováno 14:38

Na kutnohorské střední škole zasahovali záchranáři kvůli skupině rozrušených studentek. Dívky...

Takhle se mě dotýkal jen gynekolog. Fanynky PSG si stěžují na obtěžování

21. dubna 2024 16:37

Mnoho žen si po úterním fotbalovém utkání mezi PSG a Barcelonou postěžovalo na obtěžování ze strany...

Školu neznaly, myly se v potoce. Živořící děti v Hluboké vysvobodili až strážníci

22. dubna 2024 10:27

Otřesný případ odhalili strážníci z Hluboké nad Vltavou na Českobudějovicku. Při jedné z kontrol...

Prezident Petr Pavel se zranil v obličeji při střelbě ve zbrojovce

19. dubna 2024 15:44

Prezident Petr Pavel se při střelbě na střelnici v uherskobrodské České zbrojovce, kam zavítal...

Zavolíme! Kandidáti do eurovoleb se utkají v debatě vysílané i studentům škol

26. dubna 2024 5:42

Šest kandidátů pro volby do Evropského parlamentu přijalo účast v debatě Zavolíme!, která bude...

Další případ zpožděné dodávky zbraní. Česká firma se soudí na Ukrajině

26. dubna 2024

Premium Vztahy mezi Českem a Ukrajinou nejsou vždycky idylické. Svědčí o tom soudní spor, na který narazila...

Světlušky mění válčení ve městech. Nové drony snížily počet padlých Izraelců

26. dubna 2024

Premium Jen několik decimetrů velký přístroj může znamenat revoluci městské války: minivrtulník, který...

Dva ruští vojáci se doznali k trojnásobné vraždě na Ukrajině

25. dubna 2024 23:07

V okupované části Chersonské oblasti na jihovýchodu Ukrajiny zadrželi dva ruské vojáky, kteří se...

Samoživitelka skončila v nemocnici a čtvrt roku nemohla pracovat

Téměř deset miliard korun – tolik jen za loňský rok poslaly pojišťovny lidem za úrazy, závažná onemocnění či úmrtí. Životní pojištění pomohlo za...

Jan Řeháček VIP

Počet článků 402
Celková karma 19,54
Průměrná čtenost 920x

Devátý nejhorší kuchař na světě, odpůrce politické překorektnělosti, začínající marťan, neúnavný konzument točeného kyslíku a jazykový dobrodruh ab incunabulis. Člen Analytického piva a Gustavu pro jazyk český. Správce Vojensko-českého slovníku.

Seznam rubrik

Oblíbené stránky

strana 23, 61 a 109

Komerční sdělení

MS v hokeji 2024

Zaměstnání

Střední školy

Biatlon 23/24

Vláda

Témata

Nepřehlédněte

iDNES.cz

© 1998–2024 MAFRA, a. s. a dodavatelé Profimedia, Reuters, ČTK, AP. Rozmnožování obsahu pro účely automatizované analýzy textů nebo dat dle ustanovení § 39c autorského zákona je bez souhlasu MAFRA, a. s. zakázáno. Jakékoliv užití obsahu včetně převzetí, šíření či dalšího zpřístupňování článků a fotografií je bez souhlasu MAFRA, a. s. zakázáno. Provozovatelem serveru iDNES.cz je MAFRA, a. s. IČ: 45313351.

mobilní verze

Přihlášení