Inkluzja AI w sztuce: przekształcanie słów w rzeczywistość obrazową

-

Sztuczna sztuczna inteligencja dotycząca automatycznych napisów sięga roku 2009, kiedy Google wprowadzono koncepcja w filmach na YouTube. Wykorzystują uczenie maszynowe, aby pomóc procesorom w generowaniu automatycznych podpisów po przeczytaniu wizualizacji obrazu.

Niektórzy badacze znaleźli okazję i dostrzegli iskrę, że jeśli sztuczna inteligencja może dodawać automatyczne podpisy do obrazu, czytając wizualizacje, może również tworzyć obrazy, czytając napisy. Takie podejście do przekształcania słów w obrazy miało na celu rozwój nowatorskiej sztuki opartej na czystej strukturze niefiltrowanej wyobraźni.

W ten sposób włączenie sztucznej inteligencji ewoluowało w coś więcej niż tylko jego skuteczność. Znalazł się również w sztuka i moda. DALL-E zadebiutował w zeszłym roku, aby zamienić tekst w fotorealistyczną sztukę. Niedawno OpenAI zaprezentowało ulepszoną wersję z DALL-E2.

Jak to działa?

Koncepcja obejmuje cztery kluczowe punkty: dane treningowe, uczenie głębokie, przestrzeń utajoną i generowanie wyników. Dane treningowe zależą od setek milionów obrazów dostępnych w Internecie z podanymi podpisami. Te duże zbiory danych są dostępne w Internecie, co pomaga systemowi w szkoleniu bazy danych DALL-E 2.

Każdy obraz może zawierać wiele obiektów lub nie. Na przykład możesz mieć jedno zdjęcie, na którym dzieje się wiele rzeczy, na przykład samochód na drodze w słoneczny dzień mijający drapacz chmur. W tym miejscu głębokie uczenie pomaga DALL-E 2 w rozróżnianiu wielu obiektów na jednym obrazie. Tworząc nowy obraz, system musi umieścić te obiekty, jednocześnie rozumiejąc różnice między nimi, aby zachować lepszy widok. Głębokie uczenie wykorzystuje setki zmiennych do rozróżniania obiektów podczas projektowania nowego obrazu. Tymi zmiennymi mogą być kolor, połysk, rozmiar, geometria itp.

Przestrzeń utajona znajduje następnie matematyczny, geometryczny sposób dopasowania wszystkich tych zmiennych do jednego obrazu. Proces przekształcania punktów matematycznych w obrazy to dyfuzja, która zamienia liczby w piksele iw efekcie generuje obraz.

Sztuczna inteligencja tworzy przestrzeń w każdej możliwej dziedzinie, aby poprawić jakość naszego życia. Teraz, dzięki oprogramowaniu takiemu jak DALL-E 2, które wykorzystuje sztuczną inteligencję w obszarze kreatywnym, technologia AI jest nadal badana w sposób, który podważy i poprawi jej możliwości.


YouTube: DALL·E 2 Poradnik

Zdjęcie: funkcja obraz został zajęty przez Susann Mielke.
Źródła: Christopher Alberti i Michiel Bacchiani (Blog Google AI) / Khari Johnson (VentureBeat)

Czy ten post był pomocny?

Ahsan Ahmed
Ahsan Ahmed
Witam, tu Ahsan Ahmed. Jestem inżynierem elektrykiem i entuzjastą technologii, który uwielbia pisać. Zobaczysz, jak publikuję artykuły związane z energią elektryczną.
- Reklama -
- Reklama -
- Reklama -
- Reklama -
- Reklama -
- Reklama -