AI-inkludering i kunst: Forvandling af ord til billedmæssig virkelighed

-

Auto-captioning AI går så langt tilbage som 2009, hvor Google introduceret konceptet i YouTube-videoer. De bruger maskinlæring til at hjælpe processorer med at generere automatiske billedtekster efter at have læst billedmaterialet.

Nogle forskere fandt en mulighed og så en gnist af, at hvis AI kan give auto-undertekster til et billede ved at læse visuals, kan det måske også skabe billeder ved at læse billedtekstinput. Den tilgang til at omdanne ord til billeder var at udvikle romankunst baseret på den rene struktur af ens ufiltrerede fantasi.

Således har AI-inkludering udviklet sig til mere end dens effektivitet. Den har også fundet vej ind kunst mode. DALL-E debuterede sidste år for at gøre tekst til fotorealistisk kunst. For nylig afslørede OpenAI en opgraderet version med DALL-E2.

Sådan fungerer det

Konceptet har fire nøglepunkter: træningsdata, dyb læring, latent rum og outputgenerering. Træningsdata afhænger af hundredvis af millioner af billeder tilgængelige på internettet med givne billedtekster. Disse store datasæt er tilgængelige på internettet, hvilket hjælper systemet med at træne databasen i DALL-E 2.

Hvert billede kan muligvis indeholde flere objekter. For eksempel kan du have et enkelt billede med mange ting, der foregår, som en bil på vejen på en solskinsdag, der passerer en skyskraber. Det er her, deep learning hjælper DALL-E 2 med at skelne mellem flere objekter i et enkelt billede. Ved at skabe et nyt billede skal systemet placere disse objekter og samtidig forstå forskellene mellem dem for at bevare udsigten bedre. Deep learning bruger hundredvis af variabler til at skelne mellem objekter, mens man designer et nyt billede. Disse variabler kan være farve, glans, størrelse, geometri osv.

Det latente rum finder derefter en matematisk, geometrisk måde at passe alle disse variable ind i ét billede. Processen med at omdanne matematiske punkter til billeder er diffusion, som omdanner tal til pixels, og som et resultat genererer billedet.

AI skaber plads på alle mulige områder for at forbedre vores livskvalitet. Nu, med software som DALL-E 2, der bruger AI i et kreativt område, fortsætter AI-teknologien med at blive udforsket på måder, der ville udfordre og forbedre dens muligheder.


YouTube: DALL·E 2 Forklaret

Fotokredit: Funktionen billede er taget af Susann Mielke.
Kilder: Christopher Alberti og Michiel Bacchiani (Google AI-blog) / Khari Johnson (VentureBeat)

Var dette indlæg nyttigt?

Ahsan Ahmed
Ahsan Ahmed
Hej, dette er Ahsan Ahmed. Jeg er en elektroingeniør og teknologientusiast, der elsker at skrive. Du ville se mig skrive om el-relaterede historier.
- Annoncering -
- Annoncering -
- Annoncering -
- Annoncering -
- Annoncering -
- Annoncering -