E Bléck op déi nei Al Generative Art

Al Generative Art ass eng Aart vu Konscht, meeschtens visuell, déi op Zesummenaarbecht tëscht engem Mënsch an engem autonome System baséiert. En "autonome System" gëtt definéiert als en Kënschtlech Intelligenz Software, Algorithmus oder Modell kapabel komplex Operatiounen ze Leeschtunge ouni de Besoin fir Programméierer Interventioun.

Vun de bizarre Juxtapositioune vu Biller erstallt duerch Dall-E Mini bei den NFT Maart, Biller generéiert vun AI Algorithmen ginn ëmmer méi an d'Mainstream Phantasie. Tatsächlech sinn zwee wichteg Projeten zum Thema déi et verdéngen ze analyséieren: midjourney an DALL-E2.

Natierlech huet d'Nouvelle och de Wee op Twitter gemaach. Kommentéiert dozou, ënner anerem, ass de Charles Hoskinson, dee geschriwwen huet:

Al Generative Art: fréi Experimenter a Fonctiounen

Nodeems Dir verstanen hutt wat Generative Art ass, ass et wichteg ee vu senge Grondprinzipien ze ënnersträichen: Zoufall. Wat ass eng fundamental Eegeschafte vun Generative Art.

Tatsächlech, ofhängeg vun der Aart vu Software, ass den autonome System fäeg Resultater ze veraarbechten déi ëmmer anescht an eenzegaarteg sinn all Kéier wann de Generéiere Kommando ausgefouert gëtt, oder et kann eng variabel Zuel vu Resultater als Äntwert op d'Benotzerinput zréckginn.

Déi éischt Experimenter an der Generative Art ginn an den 1960er Jore mat den Experimenter vun Harold Cohen a sengem AARON Programm. Cohen huet fir d'éischt Stand-alone Software benotzt fir abstrakt Konschtwierker ze generéieren inspiréiert vu Pop Art Seidscreens. Dem Cohen seng Wierker sinn elo an der Tate Gallery zu London ausgestallt.

En aneren Attribut vun der Generativer Konscht, awer een deen ëmmer manner e Prerogativ ass, ass d'Widderhuelung vu Mustere oder abstrakte Elementer, déi vum Programméierer geliwwert ginn an am Softwarecode implementéiert ginn.

Zousätzlech huet d'Entwécklung vun ëmmer méi komplexe neuralen Netzwierker, déi op Text-Bild Associatioun operéieren, d'Entwécklung vu generativen Modeller erméiglecht, déi ëmmer méi realistesch a korrekt Biller kreéieren. Dat bekanntst Beispill vun dëser Kategorie vun Generative Art ass Plack.

Dall-E ass eng multimodal neural Reseau baséiert op der GPT-3 déif Léieren Modell aus OpenAI, déi selwecht Firma déi och viru kuerzem entwéckelt huet Chat GPT, den Chatbot gouf am November 2022 gestart an optimiséiert mat "iwwerwaacht" an Verstäerkung Léieren Techniken.

Zréck op Dall-E gesi mir, datt dëse System kapabel ass Biller vun enger textueller Beschreiwung ze generéieren, genannt eng "prompt," baséiert op engem Dataset vun Text-Bild Pairen.

Déi éischt Versioun vum Dall-E, déi am Januar 2021 dem Public presentéiert gouf an d'Prérogativ vun enger klenger Zuel vu Fachleit am Feld bliwwen ass, representéiert eng richteg Revolutioun am Sënn vun dëser Aart vu generativen Modell, iwwerschratt d'Innovatiounen vu GPT- 3 selwer.

Och vu Bedeitung ass d'Tatsaach datt d'Genauegkeet vun de Resultater, déi vum Dall-E veraarbecht goufen, de perfekte Spillraum fir eng aner OpenAI Léisung bewisen hunn: KLIP (Kontrastiv Sprooch-Bild Pre-Training).

Eng Bildklassifizéierung a Ranking neural Netzwierk trainéiert op Basis vun Text-Bild Associatiounen, wéi Ënnerschrëften um Internet fonnt. Dank der Interventioun vum CLIP, déi d'Zuel vun de Resultater, déi de Benotzer pro Ufro proposéiert, op 32 reduzéiert, gouf Dall-E an de meeschte Fäll zefriddestellend Biller fonnt.

Midjourney: Design, mënschlech Infrastruktur a kënschtlech Intelligenz

Wéi erwaart, midjourney ass e wichtege Projet deen Deel vum opkomende Al Generative Art Konzept ass. Speziell, Midjourney ass en onofhängege Fuerschungslaboratoire deen nei Mëttele fir ze denken exploréiert an d'fantastesch Kräfte vun der mënschlecher Spezies ausbaut.

Et ass einfach ze benotzen: als éischt muss e Kont erstallt ginn Schwaarz, eng Plattform déi verschidde Communautéiten organiséiert, wou Midjourney ee vun hinnen ass. Bannent der Applikatioun sinn déi verschidde Chatrooms, an deenen een aktiv oder net un Diskussiounen deelhuelen kann.

Et ass wichteg ze weisen datt fir d'éischt Kéier ze probéieren Kënschtlech Intelligenz ze benotzen, muss een op d' "Newbies" Channels, wou 25 fräi Render- sinn disponibel.

Ee Rendering entsprécht der Generatioun vu véier verschiddene Varianten, déi aus demselwechten Textinput generéiert ginn.

Also, déi 25 Rendering bezéien sech op 25 Veraarbechtungsaarbechte vum Midjourney Bot. Dofir erfuerdert d'Bild ze generéieren Interaktioun mam Midjourney Bot iwwer eng SMS genannt "Prompt", an där et Schlësselwierder gëtt, déi d'Bild beschreiwen, deen de Benotzer am Kapp huet.

Dir kënnt esou vill Detailer addéieren wéi Dir wëllt, déi wichteg Saach ass d'Schlësselwieder mat engem Komma ze deelen. Wann de Rendering fäerdeg ass, gëtt de Computer véier verschidde Biller zréck op Basis vun de Beschreiwunge fir ze wielen.

Zousätzlech, wann de Programm fäerdeg ass, kënnt Dir Är Virléiften op Basis vun de Biller kommunizéieren an, wann Dir wëllt, nach eng Kéier véier Versioune generéiert hunn.

DALL-E 2: den neien AI System fir Konschtwierker

Zousätzlech zu Midjourney ass DALL-E 2 och den neien AI System deen realistesch Biller a Konschtwierker aus enger natierlecher Sproochbeschreiwung erstellen kann. Net nëmmen dat, DALL-E 2 kann och Konzepter kombinéieren, Attributer a Stiler.

D'Kraaft vum neien AI System läit och an der Fäegkeet, Biller auszebauen iwwer dat wat am urspréngleche Canvas ass, ze kreéieren nei erweidert Kompositioune. Zousätzlech kann et realistesch Ännerunge fir existent Biller aus enger natierlecher Sprooche-Iwwerschrëft maachen a kann Elementer addéieren an ewechhuelen andeems Dir Schatten, Reflexiounen an Texturen berücksichtegt.

DALL-E 2 d'Fähegkeeten och e Bild huelen an e puer Variatiounen vun et inspiréiert vun der Original schafen. DALL-E 2 huet d'Relatioun tëscht Biller an den Text geléiert fir se ze beschreiwen.

Et benotzt e Prozess genannt "Diffusioun", dat ufänkt mat engem Muster vun zoufälleg Punkten a ännert dat Muster graduell op e Bild wann et spezifesch Aspekter vun deem Bild erkennt.

Also, nodeems OpenAI DALL-E am Januar 2021 agefouert huet, generéiert elo den neiste System, DALL-E 2, méi realistesch a korrekt Biller mat véiermol der Resolutioun.

DALL-E 2 huet als Fuerschungsprojet ugefaang an ass elo verfügbar als e beta Versioun. Sécherheetsmitigatiounen, déi de System entwéckelt huet a weider verbessert gëtt, enthalen: d'Begrenzung vum System seng Fäegkeet fir gewalteg, haassen oder erwuessene Biller ze generéieren, a Léier-baséiert Phase Deployment.

Source: https://en.cryptonomist.ch/2023/02/02/ai-generative-art/