Wat Nvidia säin neien Text-Zu-3D bedeit fir Ingenieur & Produktdesign

tl; dr: Generativ AI entwéckelt sech an engem spannenden Tempo. Dee leschten Algorithmus vun Nvidia konvertéiert Text an 3D Mesh duebel sou séier wéi Projeten, déi viru knapp 2 Méint publizéiert goufen. Dëst bedeit datt déi technesch Fäegkeeten elo schonn eis Fäegkeet iwwertreffen fir mat hinnen ze schaffen.

Lescht Woch Pabeier vun Nvidia Wëssenschaftler hunn déi exponentiell Geschwindegkeet bewisen, bei där de generativen AI Raum sech entwéckelt. Dës Explosioun vun Aktivitéit - besonnesch siichtbar an de leschten 9 Méint - wäert en Impakt op all Deel vum Liewen hunn, net zulescht op Produktdesign, Ingenieur a Produktioun. D'Ännerunge wäerten d'Industrie vun strukturellen Aschränkungen entschäerfen an der Aart a Weis wéi Iddie vermëttelt ginn, méi séier Innovatiounszyklen erméiglechen an et schlussendlech erlaben hir Nohaltegkeetsverspriechen ze liwweren.

Zënter Joere gesot ginn datt AI d'Art a Weis wéi mir schaffen grondsätzlech revolutionéiere géif, hunn wéineg erwaart datt de kreative Secteur zu hiren éischten Affer wier. D'Advent vum GPT-3's mënschlechähnlechen Textgenerator am Joer 2020 huet d'Méiglechkeeten méi schaarf konzentréiert. Et ass e wilde Ride zënter deem: DALL-E (Text-zu-Bild), Whisper (Speech Unerkennung), a viru kuerzem Stable Diffusion (Text-zu-Bild) net nëmmen erhéicht Fäegkeete vu Ried a visuellen AI Tools, awer och reduzéiert d'Ressourcen déi néideg sinn fir se ze benotzen (vu 175bn Parameteren fir GPT-3 op 900mn fir Stable Diffusion).

D'Gréisst vun der stabiler Diffusioun bedeit manner wéi 5gb Disk Space - fäeg fir op all Laptop ze lafen. Net nëmmen dat; am Géigesaz zu OpenAI (déi haaptsächlech vu Microsoft finanzéiert gëtt a GPT-3, DALL-E a Whisper publizéiert), ass Stable Diffusion Open Source, dat heescht datt anerer op seng Léiere vill méi einfach kënne bauen. Dat heescht datt mir nëmmen den Ufank vum innovativen Zyklus gesinn - et ass vill méi ze kommen, wéi dem Nvidia säi Pabeier elo weist.

D'Stable Diffusion's Backer (stability.ai) turbochargen dësen Trend weider andeems se technologesch a finanziell Stipendien un aner Teams ubidden, déi d'Exploratioun an nei Richtungen huelen. Zousätzlech mécht eng Onmass vu Projeten d'Tools fir eng ëmmer méi breet Palette vu Benotzer verfügbar. Dorënner sinn Plugins fir Blender, en Open-Source Design Tool, an Adobe's propriétaire Photoshop Äquivalent. Voll API Zougang zu den Tools gëtt mat grousse Venture Capital Dollar finanzéiert, dat heescht datt Honnerte vu Millioune Softwareentwéckler, net nëmmen e puer honnertdausend Dateningenieuren, elo hir eegen Tools op dësen Algorithmen erstellen.

Ried, Biller an Text gehéieren zu den éischte Vertikal, déi vun dësen Technologien gestéiert ginn. Awer 3D ass net wäit hannendrun. Nieft der Nischgenerativer Konscht sinn Cartoons den offensichtlechen éischte Punkt vun der Uwendung. Et gëtt schonn e Pokémon Generator baséiert op Stable Diffusion. Visuell Effekter a Filmer sinn nächst. Awer vill aner Secteuren si méiglecherweis gestéiert - dorënner Interieurdesign mat Interiorai.com déi d'Charge féiert.

An all dëser Opreegung fillt sech d'Innovatiounen op Design & Engineering anzewenden wéi en Nodenken. Wéi och ëmmer, et ass méiglecherweis de Gebitt dat schlussendlech am bedeitendsten beaflosst ass. Natierlech ginn et initial Erausfuerderungen: Fir eng, Stable Diffusion a seng Landsleit sinn nach net ganz präzis. Dat ass kee Problem fir Cartoons, awer et ass eng grouss Erausfuerderung fir all Versuch Text a voll 3D Geometrien ze transforméieren déi an industrielle Kontexter benotzt ginn. Dat ass e Gebitt dat e bëssen Interesse hat (e Projet mam Numm Bits101 gouf 2015 an Israel gestart). Dëst kann den hellege Graal vun der Industrie sinn, awer et gi vill Zwëschenfuerderungen déi vill méi einfach kënne léisen. Dëst beinhalt eng verbessert Objekterkennung (de Yolo Algorithmus gëtt scho mat groussen Effekt benotzt), wat zu enger verbesserter Zitat an Annotatioun féiert - d'Qualitéit verbesseren an d'Feeler reduzéieren. Plugins sollen et och méi einfach maachen Generative AI ze benotzen fir Basisdesignen (Primitives) z'entwéckelen, déi dann an Design Tools weider kënne geännert ginn fir Toleranz no Ufuerderung ze verbesseren. Dat ass eng Approche déi schonn am Altair's Inspire benotzt gouf, déi Finite Element Analyse benotzt huet fir datselwecht ze maachen. Dës Primitive kënnen och als synthetesch Datebank vun annotéierte Modeller déngen, vun deenen et an der 3D CAD Industrie e Mangel gëtt. Physna CEO a Grënner weist dat an engem Artikel eraus hir eege Versuche fir dës nei Methoden ze benotzen fir detailléiert 3D Designen ze kreéieren, wat och eng Zuel vu Fallen ënnersträicht bei der Benotzung vun syntheteschen Donnéeën fir dës Algorithmen ze féieren. Bibliothéik vun Tool wear fir déi bescht Bearbechtungsstrategien ze bestëmmen.

Dës Erausfuerderunge si wichteg a lukrativ fir an a fir sech selwer unzegoen. Awer hiren Haapt Impakt wäert sinn ze hëllefen den Idee-zu-Design Wee z'entwéckelen andeems se schlussendlech d'Vertrauen op 3D Designen reduzéieren fir Intent ze kommunizéieren. Designs, egal ob 2D oder 3D, hunn als primär Mëttel gedéngt fir d'Bedierfnesser vun de Clienten op d'Finale Produkter ze iwwersetzen. Dat beschränkt d'Industrie well dës Designen als eng schwaarz Këscht déngen an där all déi wäertvoll Clienten Abléck, Fabrikatiounsbeschränkungen a Firmenziler gespäichert sinn, net fäeg ze trennen, awer eleng identifizéiert. Dëst bedeit datt wann eppes ännert, et bal onméiglech ass einfach den Design unzepassen. Dëst ass de Grond firwat d'Fabrikatiounsinnovatiounen wéi 3D Dréckerei esou laang daueren fir kuerzfristeg Investisseuren z'adoptéieren an ëmmer enttäuschen. D'Komponente, déi e Fliger ausmaachen, sinn "opgestallt" vum Moment wou se entworf sinn, trotz engem 20 Joer+ produktive Liewen. Et gëtt bal keen Ëmfang vun Innovatioun - dës mussen op de Start vun der nächster Generatioun waarden.

Kënnen eng eenzeg Aschränkung z'änneren an en Algorithmus wéi Stable Diffusion z'erméiglechen fir d'Design- a Produktiounsparameter ze rekonstituéieren, wäert d'Adoptioun vun neien Innovatiounen wesentlech beschleunegen an et erlaabt eis méi liicht, besser performant Produkter ze bauen, méi séier. Wéi se an der Formel 1 oder System Design maachen, wäerten zukünfteg Ingenieuren als Zwangsmanager handelen, déi a Wierder a Referenz op Datequellen ausdrécke kënnen, wat d'Zil an d'Aschränkungen vum Produkt sinn.

Ouni den Ingenieursprozess fir nei an existent Produkter op dës Manéier ze beschleunegen hu mir bal keng Moyene fir déi ambitiéis Nohaltegkeetsziler ze erreechen, déi mir eis musse setzen. Fir dëst ze maachen, musse mir eis fir d'éischt op eng Sprooch eens ginn, déi mir kënne benotze fir iwwer Design ze kommunizéieren. Dësen neie semantesche Modell ass de offensichtleche Spalt an den Innovatiounen hei uewen beschriwwen. Eng Rei Entreprisen hu schonn ugefaang domat ze experimentéieren, wéi z nTopologie mat senge Konzepter vu Felder. An awer ass den Tempo vun der Ännerung lues, am Géigesaz zu den Algorithmen déi de semantesche Modell fiddert. Dem Nvidia säin neien Algorithmus ass gemellt iwwer duebel sou séier wéi DreamFusion, publizéiert manner wéi 2 Méint. Produkt- an Ingenieursfirmen mussen elo schaffen fir hir Iddien op nei, zukünfteg-beständeg Weeër ze erfassen fir dat Bescht aus de Méiglechkeeten ze maachen, déi dës Explosioun vu generativen AI hält. D'Vitesse vun der Ännerung vun den Algorithmen huet nach eng Kéier gewisen datt Morse Law iwwerall gëlt wou Tools digitaliséiert ginn. D'Erausfuerderung bleift eis mënschlech Onméiglechkeet dës Ännerung ëmzegoen an nei Kommunikatiounsmethoden z'installéieren, déi fäeg sinn hiert Potenzial ze spären, trotz der Dringendes vun der Aufgab.

Source: https://www.forbes.com/sites/andrewegner/2022/11/24/what-nvidias-new-text-to-3d-means-for-engineering-product-design/