Dirbtinis intelektas nebėra įstrigęs skaičiuoklėse. Jis piešia eskizus, tapo, kuria koliažus – kartais net neįtikėtinai gerai. Jei kada nors atsisėdote ir pagalvojote: „ Gerai, bet kaip man iš tikrųjų pasakyti dirbtiniam intelektui, ką piešti?“ , – štai kur prasideda „dirbtinio intelekto meno stilių“ idėja.
Toliau aptarsime, kurie stiliai geriausiai veikia su teksto į paveikslėlį sistemomis, kodėl taip yra ir kaip galite juos valdyti neprarasdami savo kibirkšties. Pateiksiu keletą praktinių pastabų iš praktinių bandymų (įskaitant tai, kas iš tikrųjų pasiteisino per kelis bandymus) ir keletą techninių detalių, kad procesas šiek tiek mažiau primintų kauliukų ridenimą [1][2][3][4][5].
Straipsniai, kuriuos galbūt norėsite perskaityti po šio:
🔗 Kaip kurti dirbtinio intelekto meną: išsamus vadovas pradedantiesiems
Žingsnis po žingsnio pradedantiesiems skirtas vadovas, kaip kurti dirbtinio intelekto generuojamus skaitmeninius meno kūrinius.
🔗 Dirbtinio intelekto sukurto meno aušra: kūrybiškumo išlaisvinimas ar ginčų kurstymas
Kūrybiškumo, etikos ir diskusijų apie dirbtinio intelekto sukurtą meną tyrinėjimas.
🔗 Geriausi dirbtinio intelekto įrankiai grafiniam dizainui: geriausia dirbtinio intelekto valdoma dizaino programinė įranga
Atraskite galingus dirbtinio intelekto įrankius, keičiančius šiuolaikinius grafinio dizaino darbo eigą.
Kas daro dirbtinio intelekto meno stilius iš tikrųjų gerais? ✨
Stilių pasirinkimas nėra vien tik madų vaikymasis. Kai kuriuos stilius modeliams tiesiog lengviau išlaikyti. Keletas priežasčių, kodėl:
-
Aiškumas – stiliai su tikrai aiškiomis „taisyklėmis“ (kubizmo laužyta geometrija; mangos linijų gausa) yra lengviau pakartojami, nes tiksliniai vaizdai taip smarkiai nekyla [3][4].
-
Lankstumas – maišymui pritaikyti stiliai (pvz., „kiberpankas + realizmas“) leidžia šiuolaikiniams difuzijos modeliams pasikliauti kryžminiu dėmesiu, kad viskas būtų sumaišyta švariai [1].
-
Atpažįstamumas – stiliai, kuriuos mokymo duomenys matė tūkstantį kartų (anime, impresionizmas, fotorealizmas), perteikiami tiksliau [2].
-
Nuotaika / atmosfera – tokie žodžiai kaip „melancholiškas“, „ramus“ arba „neoninis apšvietimas“ patikimai keičia apšvietimą, paletę ir kompoziciją taip, kad atrodo, jog tai sąmoninga [5].
Tikslas nėra kažkoks klinikinis „tikslumas“. Tai stilius kaip jūsų nuotaikos ar istorijos talpa – ir išmokti, kaip paskatinti modelį, kad jis galėtų pataikyti į tą talpą vėl ir vėl.
Kaip dirbtinis intelektas „mato“ stilių (paprasta versija, be žargono pertekliaus)
Šiuolaikiniai teksto į paveikslėlį modeliai žongliruoja trimis dalykais:
-
Teksto ir vaizdo atitikimas – tokios sistemos kaip CLIP mokosi, „kurie žodžiai dera su kokiais vaizdais“. Taigi, kai sakote „grubus rašalo plovimas“, ši frazė susiejama su vaizdiniais elementais [3].
-
Difuzija latentinėje erdvėje – latentinė difuzija palaipsniui paryškina triukšmingą vaizdą, kad atitiktų jūsų aprašymą. Taip ji pasiekia efektyvumą ir kontrolę [1].
-
Raginimų modifikatoriai – maži „bendruomenės triukai“ – kinematografinis apšvietimas, kraštų apšvietimas, didelio kontrasto juostos grūdėtumas – yra tarsi reguliuojami ratukai, kuriuos galima sudėti vieną ant kito [5].
Kodėl tai svarbu: jei stilius aiškiai egzistuoja mokymo duomenyse ir jį aprašote tinkamais priedais, greitai gausite nuoseklius rezultatus [1][2][5].
Palyginimo lentelė: populiarūs DI meno stiliai 🖌️
Gaunamas netvarkingas, bet naudingas atmintinės lapas:
| Meno stilius | Auditorija | Kaina (DI įrankiai) | Kodėl tai veikia |
|---|---|---|---|
| Realizmas | Fotografai, prekių ženklai | Nemokama – $$$ | Atrodo tvarkingai ir patikimai |
| Anime/Manga | Jaunesni gerbėjai, žaidėjai | Nemokama – vidutinė kaina | Stipri linijų struktūra; akimirksniu įskaitoma |
| Siurrealizmas | Kūrybingi žmonės, svajotojai | Laisvas | Keisti mišiniai gerai tinka difuzijai |
| Kiberpankas | Technologijų mėgėjai, futuristai | Dažnai nemokami priedai | Neonas + kontrastas = akimirksniu nustebsite ⚡ |
| Impresionizmas | Meno entuziastai | Vidutinė kaina | Šviesios ir teptuko tekstūros yra pritaikytos modeliui |
| Žemo poligono 3D | Dizaineriai, kūrėjai | Įvairūs | Paprasta geometrija užtikrina rezultatų nuoseklumą |
| Pikselių menas | Žaidėjai, nostalgijos ieškotojai | Nemokamai (dažniausiai) | Griežti apribojimai lemia kompoziciją |
Lauko piešinėjimas: Kiberpanko piešiniams „švelnaus krašto apšvietimo + tūrinio rūko“ išryškina objektus. Pikselių menui naudokite „8 bitų, 32 × 32, ribotos paletės“ , kad išvengtumėte pernelyg švarių rezultatų.
Giluminė analizė: realizmas ir siurrealizmas 🎭
Realizmas – tai proporcijos ir detalės – puikiai tinka rinkodaros medžiagoms ar gaminių dizainui, kur svarbus patikimumas. Tokios užuominos kaip fotorealus vaizdas, mažas gylis, studijinis apšvietimas, 85 mm objektyvas suteikia dirbtiniam intelektui aiškius techninius pagrindus.
Kita vertus , siurrealizmas svajinga, neįmanoma geometrija, Escherio stilius .
Anime ir manga: DI numylėtinis 🌸
Anime/manga yra beveik nesąžiningai efektyvūs. Apibrėžtas linijinis braižymas, langelių šešėliavimas ir ikoninės proporcijos suteikia modeliui fiksuotą šabloną, be to, tai juokingai dažnas reiškinys mokymo duomenyse [2]. O hibridai? Auksas. Išbandykite „cyberpunk anime samurai“ arba „steampunk manga detective“ .
Pastoliai, į kuriuos galima atsiremti:
-
„Anime vizualinis pagrindas, dinamiška poza, švari linijinė grafika, celiuliarinis šešėliavimas, išraiškingos akys, detalus fonas“
-
„mangos panelė, ekrano tonų šešėliavimas, olandiškas kampas, paryškinimas rašalu“
Pastaba sau: jei rezultatai atrodo neryškūs, naudokite „švarų linijinį, plokščią šešėliavimą“ arba apribokite spalvas naudodami „ribotą paletę“.
Kiberpankas ir futuristinis stilius ⚡
Neoninės iškabos, chromo atspindžiai, lietingos naktys – modelis visa tai sugeria. „Diffusion“ puikiai susidoroja su didelio kontrasto apšvietimu ir atspindinčiomis medžiagomis . Tokios užuominos kaip „neonu apšviesta alėja, tūrinis rūkas, balų atspindžiai“ dažnai atrodo kaip plakatas.
Pataisymo patarimas: Vaško pavidalo paviršiai? Pridėkite „popaviršinį sklaidą, plėvelės gradaciją“ ir sumažinkite „triukšmo“ svorį raginime.
Impresionizmas ir tapybiškos tekstūros 🎨
Čia detalės nėra svarbiausia. Impresionizmui klesti švelnūs kraštai, laužytos spalvos ir šviesos žaismas. Tokie teiginiai kaip matomi teptuko potėpiai, plenero apšvietimas, „auksinė valanda“ puikiai veikia. Modelis siūlo detales be perteklinio atvaizdavimo, kas – kaip bebūtų juokinga – yra ir autentiška, ir lengvai skaitoma [4].
Minimalizmas, pikselių menas ir retro 🕹️
Apribojimai supaprastina. Mažo poligoniškumo režimas pabrėžia geometrijos aiškumą; pikselių grafika fiksuojama pagal skiriamąją gebą ir paletę.
Naudingi raginimų rėmeliai:
-
„mažo poligoniškumo diorama, aštrūs kraštai, plokščias šešėliavimas, aplinkos užtemimas“
-
„Pikselių piešinys, 32 × 32 спрайtas, NES stilius, ribotas pustoniavimas“
Pastaba: jei pikselių piešinys atrodo pernelyg slidus, pridėkite „CRT skanavimo linijas, blankius šešėlius“, kad gautumėte analoginį grūdėtumą.
Hibridiniai mišiniai: kur spindi dirbtinis intelektas ✨
Laukinė kortelė: kryžminis apdulkinimas. Difuzija leidžia sujungti įtakas, kurių dauguma menininkų nepaliestų – Van Gogo kiberpankas , anime noir kubizmas , Renesanso mecha angelas. Tai panašu į neuroninių stilių perkėlimą 2.0, tik daug lengviau kontroliuojamą [1][4].
Recepto formatas:
[Tema] + [Epocha/Judėjimas] + [Apšvietimas] + [Tempa/Medžiaga] + [Kompozicija] + [Paletė/Nuotaika]
Pvz.: „smuikininkas ant stogo – impresionistinis aliejinis paveikslas – auksinė valanda su foniniu apšvietimu – ne centre – nostalgiška paletė“.
Raginimų modeliai, kurie iš tikrųjų keičia rezultatus 🛠️
Iš pakartotinių bandomųjų važiavimų:
-
Priemonės + stiliaus derinimas išryškina ribas / tekstūras: aliejinis siurrealizmas, skaitmeninė manga [5].
-
„Lighting First“ keičia realizmą labiau nei žodžių jungimą.
-
Kameros kalba (kampai, objektyvo ilgis) suteikia akimirksniu nuspėjamumą.
-
Apribojimai svarbūs – aiškiai nustatykite reikiamą skiriamąją gebą / paletę minimalizmui arba pikselių menui.
-
Maži redagavimai > Dideli perrašymai . „Neono“ pakeitimas vietomis „natrio garai“ dažnai yra efektyvesnis nei visiškas kapitalinis remontas [5].
Greitas realybės patikrinimas 🔍
-
Šališkumas – rezultatuose dominuoja internete paplitę stiliai (anime, fotorealizmas); retesniems stiliams reikia nuorodų arba tikslinimo [2].
-
Kodėl siurrealistinis metodas veikia – difuzijos laisvumas paslepia anatomines klaidas, o keistus dalykus priverčia atrodyti tyčiniais [1].
-
Raginimo pokytis – jei kiekvienas rezultatas atrodo vienodai, prieš peržiūrint temą, pakoreguokite modifikatorius [5].
-
Teisės / etika – duomenų rinkiniai renkami plačiai; rezultatus naudokite atsakingai, ypač komerciniais tikslais [2].
Mini atvejo užrašai (iš mano smėlio dėžės) 🧪
-
Kiberpanko portretas – „portretas, žalsvai rausvai rausvas neonas, lietinga alėja, apvadas ant krašto, 85 mm, kinematografinis „bokeh“.“
Suveikė, nes: objektyvas + apšvietimas, pavyko atskirti objektą / foną. -
Impresionistinis peizažas – „upės pakrantė auksine valanda, impresionistinis aliejinis paveikslas, matomi teptuko potėpiai“.
Tinko, nes: vidutinio ryškumo tekstūra, apšvietimas, perteikta šiluma. -
Pikselių meno padaras – „32 × 32 pikselių drakonas, ribotas pustoniavimas, 1 pikselio kontūras, izometrinis“
Suveikė, nes: apribojimai nustojo glotninti.
Greitosios nuorodos raginimai (kopijuoti / įklijuoti)
-
Realizmas (produktas): „studijinė produkto nuotrauka, šviesdėžės apšvietimas, 50 mm objektyvas, blizgi keramika, švarus vaizdas“
-
Anime veiksmas: „pagrindinis anime vaizdas, sutrumpinta dinaminė poza, celiuliozės šešėliavimas, greičio linijos“
-
Siurrealistinis koliažas: „sapnų peizažas, neįmanoma geometrija, plaukiojantys laiptai, švelnus rūkas, auksinės valandos šviesos grūdeliai“
-
Žemo poligono scena: „izometrinis žemo poligono miestas, plokščias šešėliavimas, aplinkos užtemimas, pastelinė paletė“
-
Impresionistinis portretas: „aliejus ant drobės, laisvi teptuko judesiai, šviesus kraštas, impasto akcentai“
Apibendrinimas 🖼️
„Dirbtinio intelekto meno stiliai“ nėra taisyklių knygos – tai žaidimų aikštelės. Realizmas veikia, kai svarbus pasitikėjimas; siurrealizmas, kai norima sugriauti realybę; anime/manga, kai reikia aiškumo ir erdvės stiliams maišyti. Laiminti strategija yra struktūrizuotas žaidimas: pasirinkite stilių, pasirinkite apšvietimą ir terpę, pridėkite keletą modifikatorių, tada kartokite. Jei tai sukelia jums kažką jausmo – net jei tai keistai netobula – esate tinkamoje vietoje.
Nuorodos
[1] Rombach, R. ir kt. (2022). Didelės skiriamosios gebos vaizdų sintezė naudojant latentinės difuzijos modelius (CVPR). PDF
[2] Schuhmann, C. ir kt. (2022). LAION-5B: atviras didelio masto duomenų rinkinys, skirtas naujos kartos vaizdų ir teksto modelių mokymui. PDF
[3] Radford, A. ir kt. (2021). Perkeliamų vaizdinių modelių mokymasis iš natūralios kalbos priežiūros (CLIP). PDF
[4] Gatys, L. ir kt. (2016). Vaizdo stiliaus perkėlimas naudojant konvoliucinius neuroninius tinklus (CVPR). PDF
[5] Oppenlaender, J. (2024). Raginimų modifikatorių taksonomija teksto ir vaizdo generavimui. Elgesys ir informacinės technologijos. Straipsnis