Wéi schwéier solle mir Generative AI ChatGPT an d'Hass Ried drécken, freet AI Ethik an AI Gesetz

Wat maache mir iwwer generativ AI déi offensiv Inhalter wéi Haass Ried produzéiert?

Getty

Jiddereen huet säin Breakpunkt.

Ech huelen un, Dir kéint dat och soen alles huet säi Bruchpunkt.

Mir wëssen, datt zum Beispill Mënschen heiansdo Bemierkunge kënne knipsen an aussoen, déi se net onbedéngt wëlle soen. Och Dir kënnt heiansdo en Apparat oder Maschinn kréien fir am Wesentlechen ze knipsen, sou wéi Ären Auto ze schwéier dréckt an et fänkt un ze falen oder auserneen ze fléien. Also ass d'Notioun datt d'Leit oder "jiddereen" méiglecherweis e Bruchpunkt hunn, an ähnlech kënne mir behaapten datt Objeten a Saachen am Allgemengen och e Briechpunkt hunn.

Et kéint ganz sënnvoll a vital Grënn sinn fir erauszefannen, wou de Breakpunkt existéiert. Zum Beispill, Dir hutt ouni Zweifel déi Videoe gesinn, déi en Auto weisen, deen duerch seng Schrëtt gesat gëtt fir z'identifizéieren wéi eng Breakpunkten et huet. Wëssenschaftler an Tester rammen en Auto an eng Mauer fir ze kucken wéi gutt de Bumper an d'Struktur vum Gefier déi negativ Handlung widderstoen. Aner Tester kënnen d'Benotzung vun engem spezialiséierte Raum oder Lagerhaus enthalen dat extrem Kälte oder extremer Hëtzt produzéiert fir ze kucken wéi en Auto ënner ënnerschiddleche Wiederkonditiounen wäert goen.

Ech bréngen dëst häerzlecht Thema an der heiteger Kolonn op, fir datt mir kënnen diskutéieren wéi e puer am Moment schwéier op Kënschtlech Intelligenz (AI) drécken fir eng spezifesch Aart vu Brückenpunkt z'identifizéieren a viraussiichtlech auszeweisen, nämlech de Bréckpunkt bannent AI deen Haass Ried produzéiert.

Jo, dat ass richteg, et gi verschidde ad hoc an heiansdo systematesch Efforten amgaang fir ze moossen ob et machbar ass AI ze kréien fir Haass Ried auszebréngen. Dëst ass e begeeschterten Sport ginn, wann Dir wëllt, wéinst dem steigenden Interesse an der Popularitéit vun generativen AI.

Dir sidd vläicht bewosst datt eng generativ AI App bekannt als ChatGPT d'outsized Diskussioun vun der Stad gouf als Resultat vun der fäeg ass erstaunlech fléissend Essayen ze generéieren. D'Schlagzeilen schwätze weider an erzielen déi erstaunlech Schreiwen déi ChatGPT et fäerdeg bréngt ze produzéieren. ChatGPT gëtt als generativ AI Applikatioun ugesinn, déi en Text vun engem Benotzer als Input hëlt an dann en Output generéiert oder produzéiert deen aus engem Essay besteet. Den AI ass en Text-zu-Text Generator, awer ech beschreiwen den AI als en Text-zu-Essay Generator well dat méi einfach klärt fir wat et allgemeng benotzt gëtt.

Vill sinn iwwerrascht wann ech erwähnen datt dës Zort AI eng Zäit laang existéiert an datt ChatGPT, deen Enn November verëffentlecht gouf, net iergendwéi de Präis als Éischte Beweeger an dëst Räich vun Text-zu-Essay behaapt huet. proclivity. Ech hunn iwwer d'Joren aner ähnlech generativ AI Apps diskutéiert, kuckt meng Ofdeckung op de Link hei.

De Grond datt Dir vläicht net wësst oder erënnert un déi fréier Fälle vu generativen AI ass vläicht wéinst dem klassesche "Feele fir erfollegräich ze starten" Conundrum. Hei ass wat normalerweis geschitt ass. En AI Hiersteller verëffentlecht hir generativ AI App, mécht dat mat grousser Spannung an erfreelecher Erwaardung datt d'Welt d'Erfindung vun enger besserer Mausfall schätze wäert, kann ee soen. Am Ufank gesäit alles gutt aus. D'Leit sinn iwwerrascht iwwer wat AI ka maachen.

Leider ass den nächste Schrëtt, datt d'Rieder ufänken aus dem sproochleche Bus ze kommen. Den AI produzéiert en Essay deen e Foul Wuert oder vläicht e Foul Saz enthält. E virale Tweet oder aner sozial Medien Posten markéiert prominent datt d'AI dëst gemaach huet. Veruerteelung entsteet. Mir kënnen net AI ronderëm goen an offensiv Wierder oder offensiv Bemierkungen generéieren. En enorme Réckschlag entsteet. Den AI Hiersteller probéiert vläicht déi bannenzeg Aarbecht vun der AI ze tweaken, awer d'Komplexitéit vun den Algorithmen an d'Daten léinen sech net fir séier Fixer. E Stampe entstinn. Méi a méi Beispiller vun der AI emittéierend Foulness ginn online fonnt a gepost.

Den AI Hiersteller huet onwuel awer kloer keng aner Wiel wéi d'AI App aus der Benotzung ze läschen. Si fuere sou weider an bieden dann dacks eng Entschëllegung datt se bedaueren wann iergendeen vun den generéierten AI-Output beleidegt gouf.

Zréck op d'Zeechnenbord geet den AI Hiersteller. Eng Lektioun ass geléiert. Sidd ganz virsiichteg iwwer d'Verëffentlechung vun generativen AI déi Foul Wierder oder dergläicht produzéiert. Et ass de Kuss vum Doud fir d'AI. Ausserdeem wäert den AI Hiersteller hire Ruff gebrach a geschloen hunn, wat fir eng laang Zäit kéint daueren an all hir aner AI Efforten ënnersträichen inklusiv déi, déi näischt mat generativen AI per se ze maachen hunn. Äre Petard op d'Emissioun vun offensiven AI Sprooch ze briechen ass en elo dauerhafte Feeler. Et geschitt nach ëmmer.

Wäschen, spullen a widderhuelen.

An de fréie Deeg vun dëser Aart vun AI waren d'AI Hiersteller net ganz sou gewëssenhaft oder adept fir hir AI ze scrubben a Saache probéiert offensiv Emissiounen ze vermeiden. Hautdesdaags, nodeems se virdru gesinn hunn datt hir Kollegen duerch e Public Relations Albtraum komplett zerstéiert ginn, hunn déi meescht AI Hiersteller anscheinend de Message kritt. Dir musst esou vill Guardrails op der Plaz setzen wéi Dir kënnt. Probéiert d'AI ze verhënneren vu foul Wierder oder foul Ausdréck auszeginn. Benotzt egal wéi eng Muzzling Techniken oder Filter Approche déi den AI stoppen fir Wierder oder Essayen ze generéieren an ze weisen, déi als ongerecht fonnt ginn.

Hei ass e Goût vun der Banner Iwwerschrëft Verbiage benotzt wann AI gefaange gëtt fir onreputabel Ausgänge ze emittéieren:

"AI weist schrecklech Toxizitéit"
"AI sténkt no direkter Bigotry"
"AI gëtt blatant offensiv offensiv"
"AI spuet erschreckend an onmoralesch Haass Ried aus"
Etc.

Fir d'Vereinfachung vun der Diskussioun hei, wäert ech op d'Output vun offensiven Inhalter bezéien wéi d'Produktioun vun Haassesprooch. Wann dat gesot gëtt, w.e.g. bewosst datt et all méiglech offensiv Inhalter gëtt, déi produzéiert kënne ginn, eleng iwwer d'Grenze vun Haass Ried erausgoen. Hate Speech gëtt typesch als nëmmen eng Form vun offensiven Inhalt ausgesat.

Loosst eis op Haass Ried fir dës Diskussioun fokusséieren, fir d'Diskussioun einfach ze maachen, awer mierken datt aner offensiv Inhalter och ënnersicht verdéngt.

An Haass Ried vu Mënschen a vun AI graven

D'UNO definéiert Haassesprooch esou:

"An der gemeinsamer Sprooch bezitt 'Haassried' op offensiven Discours, deen eng Grupp oder en Individuum zielt, baséiert op inherent Charakteristiken (wéi Rass, Relioun oder Geschlecht) an dat kann de soziale Fridden menacéieren. Fir e vereenegt Kader fir d'Vereenten Natiounen ze bidden fir d'Thema weltwäit unzegoen, definéiert d'UN Strategie an Handlungsplang iwwer Hate Speech Haass Ried als 'all Zort vu Kommunikatioun a Ried, Schreiwen oder Verhalen, déi pejorativ oder diskriminéierend Sprooch attackéiert oder benotzt mat Referenz op eng Persoun oder eng Grupp op Basis vu wien se sinn, dat heescht, op Basis vun hirer Relioun, Ethnie, Nationalitéit, Rass, Faarf, Ofstamung, Geschlecht oder aneren Identitéitsfaktor.' Wéi och ëmmer, et gëtt keng universell Definitioun vun Haass Ried ënner internationalem Mënscherechtergesetz. D'Konzept gëtt nach ëmmer diskutéiert, besonnesch a Bezuch op Meenungs- an Ausdrocksfräiheet, Net-Diskriminéierung a Gläichheet" (UN Websäit Post mam Titel "What is hate speech?").

AI déi Text produzéiert ass ënnerläit fir an d'Hassspeech Sphär ze kommen. Dir kënnt datselwecht soen iwwer Text-zu-Konscht, Text-zu-Audio, Text-zu-Video, an aner Modi vun generativen AI. Et gëtt ëmmer d'Méiglechkeet, zum Beispill, datt eng generativ AI e Konschtstéck géif produzéieren, dat vun Haass Ried rëselt. Fir Zwecker vun dëser Diskussioun wäert ech mech op d'Text-zu-Text oder Text-zu-Essay Méiglechkeeten konzentréieren.

An all dëst kënnt eng ganz Rëtsch vun AI Ethik an AI Gesetz Iwwerleeungen.

Sidd w.e.g. bewosst datt et dauernd Efforte gëtt fir ethesch AI Prinzipien an d'Entwécklung an d'Feldung vun AI Apps z'erreechen. E wuessende Kontingent vu besuergt a fréier AI Ethiker probéieren ze garantéieren datt d'Efforte fir AI z'entwéckelen an z'adoptéieren eng Vue vu maachen Rechnung droen AI Fir Gutt an averéieren AI Fir Schlecht. Ähnlech ginn et nei AI Gesetzer proposéiert, déi als potenziell Léisunge verbannt ginn fir AI Bestriewen ze verhënneren, datt d'Mënscherechter an dergläiche Amok ginn. Fir meng lafend an extensiv Ofdeckung vun AI Ethik an AI Gesetz, kuckt de Link hei an de Link hei, Just e puer ze Numm.

D'Entwécklung an d'Verëffentlechung vun etheschen AI Virschrëfte ginn verfollegt fir hoffentlech ze verhënneren datt d'Gesellschaft an eng Onmass vun AI-induzéierende Fallen falen. Fir meng Ofdeckung vun den UN AI Ethik Prinzipien wéi entworf an ënnerstëtzt vu bal 200 Länner iwwer d'Efforte vun der UNESCO, kuckt de Link hei. An enger ähnlecher Aart ginn nei AI Gesetzer exploréiert fir ze probéieren AI op engem gläiche Kiel ze halen. Ee vun de leschten hëlt besteet aus enger Rei vun proposéiert AI Bill vun Rechter datt d'US White House viru kuerzem verëffentlecht huet fir Mënscherechter an engem Alter vun AI z'identifizéieren, kuckt de Link hei. Et brauch en Duerf fir AI an AI Entwéckler op engem gerechte Wee ze halen an déi gezielt oder zoufälleg Ënnerhand Efforten ofzeschléissen déi d'Gesellschaft ënnersträichen.

Ech interweave AI Ethik an AI Gesetz verwandte Considératiounen an dëser Diskussioun iwwer AI Spueren Haass Ried oder aner offensiv Inhalter.

E bëssen Duercherneen, deen ech gär hätt direkt opzeklären, ass datt den haitegen AI net sentient ass an duerfir kënnt Dir net proklaméieren datt d'AI Haass Ried produzéiere kéint wéinst enger gezielter mënschlech-ähnlecher Absicht, sou wéi seellech an der AI verkierpert. Den Zany behaapt datt den aktuellen AI sentient ass an datt d'AI eng korrupt Séil huet, wouduerch et Haass Ried generéiert.

Lächerlech.

Falen net dofir.

Mat deem Keystone Virschrëft ginn e puer opgeregt bei esou Indikatiounen well Dir anscheinend den AI vum Haken léisst. Ënnert deem ongewéinleche Wee fir ze denken, kënnt d'Erfuerderung nächst datt Dir anscheinend gewëllt sidd datt den AI iergendeng Aart vu grausamen Output generéiert. Dir sidd fir AI déi Haass Ried ausspréngt.

Yikes, eng zimlech verdréit Form vun Onlogik. De richtege Sënn vun der Saach ass datt mir d'AI Hiersteller verantwortlech maache mussen, zesumme mat wiem deen den AI Felder oder den AI bedreift. Ech hu laang diskutéiert datt mir nach net um Punkt sinn fir d'juristesch Perséinlechkeet un AI zouzeginn, kuckt meng Analysen op de Link hei, a bis dohinner ass AI wesentlech iwwer den Ëmfang vun der gesetzlecher Verantwortung. Et gi Mënschen awer déi d'Entwécklung vun AI ënnersträichen. Zousätzlech, d'Mënschen ënnersträichen d'Feldung an d'Operatioun vun AI. Mir kënnen no deene Mënschen goen fir d'Verantwortung vun hirer AI ze droen.

Als Ofgesi kann och dëst komplizéiert sinn, besonnesch wann d'AI an den Internet schwëmmt a mir net fäeg sinn festzestellen, wéi ee Mënsch oder d'Mënschen dat gemaach hunn, wat en anert Thema ass, dat ech a menge Kolonnen ofgedeckt hunn de Link hei. Tricky oder net, mir kënnen nach ëmmer net proklaméieren datt AI déi schëlleg Partei ass. Loosst d'Mënschen net schlëmm falsch Anthropomorphiséierung benotzen fir sech ze verstoppen an d'Verantwortung ze entkommen fir dat wat se gemaach hunn.

Zréck op d'Saach op der Hand.

Dir kënnt Iech froen firwat et ass datt all AI Hiersteller net einfach hir generativ AI beschränken sou datt et onméiglech ass fir den AI Haass Ried ze produzéieren. Dëst schéngt einfach-peasy. Schreift just e Code oder etabléiert eng Checklëscht mat haass Wierder, a gitt sécher datt d'AI ni eppes vun der Aart generéiert. Et schéngt vläicht virwëtzeg datt d'AI Hiersteller net schonn un dës Quick Fix geduecht hunn.

Gutt, ech haassen Iech dëst ze soen, awer d'Komplexitéiten déi inherent sinn fir ze konstruéieren wat ass oder net Haass Ried ass vill méi schwéier wéi Dir ugeholl datt et ass.

Verréckelt dëst an d'Domain vun de Mënschen a wéi d'Mënsche matenee chatten. Gitt un datt Dir e Mënsch hutt, dee wëll Haass Ried vermeiden. Dës Persoun ass ganz bewosst vun Haass Ried an hofft wierklech ze vermeiden jee e Wuert oder Ausdrock ze soen, déi Haass Ried ausmaachen. Dës Persoun ass bestänneg bewosst net eng Iota Haass Ried aus hirem Mond ze flüchten.

Wäert dëse Mënsch, deen e Gehir huet an alarméiert ass fir Haass Ried ze vermeiden, ëmmer an ouni Chance ze rutschen fäeg sinn ze suergen, datt se ni Haass Ried ausstoen?

Ären éischten Impuls kéint sinn ze soen, jo, natierlech, en opgekläerte Mënsch kéint dat Zil erreechen. D'Leit sinn intelligent. Wann se hir Gedanken op eppes setzen, kënne se et fäerdeg bréngen. Period, Enn vun der Geschicht.

Gitt net sou sécher.

Ugeholl, ech froen dës Persoun mir iwwer Haass Ried ze soen. Ausserdeem froen ech hinnen, mir e Beispill vun Haass Ried ze ginn. Ech wëll e Beispill gesinn oder héieren, fir datt ech weess aus wat Haass Ried besteet. Meng Grënn dann fir dëst ze froen sinn uewendriwwer.

Wat soll déi Persoun mir soen?

Ech mengen Dir kënnt d'Fal gesinn, déi geluecht gouf. Wann d'Persoun mir e Beispill vun Haass Ried gëtt, dorënner och tatsächlech e Foul Wuert oder Saz ze soen, si selwer hunn elo Haass Ried geäussert. Bam, mir hunn se. Wou si versprach hunn ni Haass Ried ze soen, si hunn dat elo wierklech gemaach.

Ongerecht, rifft Dir! Si hunn nëmmen dat Wuert oder dës Wierder gesot fir e Beispill ze ginn. An hirem Häerz vun Häerzen, si hunn net un d'Wuert oder d'Wierder gegleeft. Et ass komplett aus dem Kontext an skandaléis ze deklaréieren datt d'Persoun haass ass.

Ech si sécher, datt Dir gesitt, datt d'Hass Ried ausdrécken net onbedéngt op eng haassen Basis ass. An dësem Benotzungsfall, unzehuelen datt d'Persoun d'Wierder net "gemengt" huet, a si nëmmen d'Wierder fir Demonstratiounszwecker recitéieren, wäerte mir wahrscheinlech d'accord sinn datt se net gemengt haten d'Hass Ried z'erméiglechen. Natierlech ginn et e puer déi insistéieren datt d'Hass Ried aussoen, onofhängeg vum Grond oder Grond, trotzdem falsch ass. D'Persoun sollt d'Demande refuséieren. Si sollten hire Grond stoen a refuséieren Haassspeech Wierder oder Ausdréck ze soen, egal firwat a wéi se gefrot ginn dat ze maachen.

Dëst kann e bësse kreesfërmeg ginn. Wann Dir net fäeg sidd ze soen wat Haass Ried ausmécht, wéi kënnen anerer wëssen wat ze vermeiden wa se Aussoe vun iergendenger Aart maachen? Mir schéngen fest ze sinn. Dir kënnt dat net soen wat net ze soen ass, an och keen aneren kann Iech soen wat et ass wat net gesot ka ginn.

Den übleche Wee ronderëm dëst Dilemma ass mat anere Wierder dat ze beschreiwen wat als Haass Ried ugesi gëtt, ouni d'Haass Ried selwer ze ruffen. D'Iwwerzeegung ass datt eng allgemeng Indikatioun genuch ass fir anerer z'informéieren wat se musse vermeiden. Dat schéngt wéi eng sënnvoll Taktik, awer et huet och Probleemer an eng Persoun kéint nach ëmmer an Haass Ried falen, well se net ënnerscheet hunn datt déi méi breet Definitioun d'Detailer vun deem wat se gesot hunn.

All dat befaasst sech mat de Mënschen a wéi d'Mënsche matenee schwätzen oder kommunizéieren.

Erënnert drun datt mir hei op AI fokusséiert sinn. Mir mussen den AI kréien fir sech selwer ze vermeiden oder ganz opzehalen Haass Ried auszeginn. Dir kéint streiden datt mir dat vläicht maache kënnen andeems Dir sécher sidd datt den AI ni op eppes gegeben oder trainéiert gëtt wat Haass Ried ausmécht. Voila, wann et keen esou Input gëtt, gëtt et viraussiichtlech keen esou Ausgang. Problem geléist.

Loosst eis kucken wéi dat an der Realitéit spillt. Mir entscheede fir computationally eng AI App op den Internet eraus ze goen an Dausende vun Dausende vun Essayen an narrativen um Internet ze ënnersichen. Duerch dat ze maachen, trainéiere mir den AI berechnend a mathematesch iwwer wéi Mustere fannen tëscht de Wierder déi d'Mënsche benotzen. Dat ass wéi déi lescht am generativen AI entwéckelt gëtt, an ass och eng entscheedend Basis fir firwat d'AI sou anscheinend fléissend ass fir natierlech Sproocheessayen ze produzéieren.

Sot mir, wann Dir kënnt, wéi géif d'Computatiounsausbildung op Basis vu Millioune a Milliarde vu Wierder um Internet esou gemaach ginn, datt op kee Fall iergendeng Scheinheet oder souguer Stécker vun Haass Ried ëmginn ass?

Ech géif et trauen ze soen datt dëst eng stäerklech a bal onméiglech Striewe ass.

D'Chance sinn datt d'Hass Ried duerch d'AI a säi computational Muster-passende Netzwierk opgehuewe gëtt. Probéieren dëst ze verhënneren ass problematesch. Plus, och wann Dir et miniméiert hutt, ginn et nach ëmmer e puer déi duerchschneien. Dir hutt quasi keng aner Wiel wéi unzehuelen datt e puer am Muster-passende Netzwierk existéieren oder datt e Schiet vun esou enger Formuléierung verankert gëtt.

Ech wäert méi Twists a Wendungen derbäi.

Ech gleewen, datt mir all kënnen unerkennen datt Haass Ried iwwer Zäit ännert. Wat vläicht als net Haass Ried ugesi ginn ass, kann zu engem spéideren Zäitpunkt kulturell a gesellschaftlech als Haass Ried entscheeden ginn. Also, wa mir eis AI um Internet Text trainéieren an dann loosse mer den AI afréieren fir net weider Training um Internet ze maachen, hu mir vläicht Haass Ried zu där Zäit begéint, obwuel et zu där Zäit net als Haass Ried ugesi gouf. Eréischt no der Tatsaach kéint déi gesot Ried als Haass Ried deklaréiert ginn.

Erëm, d'Essenz ass datt just probéiert dëse Problem ze léisen andeems Dir suergt datt d'AI ni op Haass Ried ausgesat ass net d'Sëlwerkugel wäert sinn. Mir mussen nach ëmmer e Mëttel fannen fir ze verhënneren datt den AI Haass Ried ausstécht, well zum Beispill d'Mooss änneren, déi duerno Haass Ried enthalen, déi virdru net als esou ugesi gouf.

Nach eng aner Twist ass et wäert ze denken.

Ech hu virdru gesot datt wann Dir generativ AI wéi ChatGPT benotzt, de Benotzer Text agitt fir den AI ze stimuléieren en Essay ze produzéieren. Den aginnen Text gëtt als Form vu Prompt oder Ufro fir d'AI App ugesinn. Ech wäert méi iwwer dëst an engem Moment erklären.

Op jidde Fall, stellt Iech vir datt een deen eng generativ AI App benotzt entscheet als Prompt e bëssen Haass Ried anzeginn.

Wat soll geschéien?

Wann den AI dës Wierder hëlt an en Essay als Output produzéiert baséiert op dëse Wierder, sinn d'Chancen datt d'Hass Ried am generéierten Essay abegraff gëtt. Dir gesitt, mir hunn den AI fir Haass Ried ze soen, och wann et ni op Haass Ried trainéiert gouf beim Start.

Et gëtt eppes anescht Dir musst wëssen.

Denkt drun datt ech just erwähnt hunn datt e Mënsch ka gesträift ginn andeems se froen Beispiller vun Haass Ried ze ginn. Datselwecht kéint op AI probéiert ginn. E Benotzer gitt eng Prompt an déi den AI freet Beispiller vun Haass Ried ze ginn. Sollt d'AI erfëllen an esou Beispiller ubidden? Ech wetten datt Dir wahrscheinlech gleeft datt AI dat net sollt maachen. Op der anerer Säit, wann d'AI computationally rigged ass fir dat net ze maachen, stellt dëst e potenziellen Nodeel aus, datt déi, déi d'AI benotzen, net fäeg sinn, wäerte mir soen, jeemools vun der AI instruéiert ze ginn, wat Haass Ried eigentlech ass ( doriwwer eraus just generaliséieren doriwwer)?

Schwéier Froen.

Ech tendéieren AI-emittéiert Haass Ried an dësen dräi Haapteemere kategoriséieren:

Alldag Modus. AI emittéiert Haass Ried ouni explizit Prodding vum Benotzer an wéi wann et op eng "gewéinlech" Manéier gemaach gëtt.
Vun Casual Prodding. AI emittéiert Haass Ried wéi vun engem Benotzer gefuerdert wéi hir aginn Ufro oder Serie vu Ufroen déi schéngen esou Emissiounen enthalen oder direkt sichen.
Per bestëmmte Stoking. AI emittéiert Haass Ried no enger ganz determinéierter an gedréchenter Serie vu prompt Pushen a Prods vun engem Benotzer dee sech op d'AI kritt fir esou eng Ausgang ze produzéieren.

Déi fréier Generatioune vu generativen AI géifen dacks Haass Ried um Enn vun engem Hutt emittéieren; sou kënnt Dir dës Instanzen als eng Zort klassifizéieren alldeeglechen Modus Instantiatioun. AI Hiersteller hunn sech zréckgezunn a mat der AI gespillt fir et manner wahrscheinlech an der Haasssproochproduktioun ze verschwannen.

No der Verëffentlechung vun der méi raffinéierter AI sinn d'Chancen iergendeng ze gesinn alldeeglechen Modus Fäll vun Haass Ried goufen dramatesch reduzéiert. Amplaz géif d'Haass Ried nëmme méiglecherweis entstoen wann e Benotzer eppes gemaach huet als Ufro, deen berechent a mathematesch eng Verbindung mat haassrelatéierte Ried am Muster-matchende Netzwierk kann ausléisen. E Benotzer kéint dëst duerch Zoufall maachen an net mierken datt dat wat se als Ufro geliwwert hunn besonnesch Haass Ried generéieren. Nodeems hien Haass Ried an engem ausgeliwwerten Essay kritt huet, géif de Benotzer dacks mierken a gesinn datt eppes an hirer Prompt logesch zu der Haass Ried Inklusioun an der Ausgab gefouert hätt.

Dëst ass wat ech bezeechnen geleeëntleche prodding.

Hautdesdaags sinn déi verschidden Efforten fir AI-generéiert Haass Ried relativ staark am Verglach zu der Vergaangenheet ze reduzéieren. Als solch musst Dir bal aus Ärem Wee goen fir Haass Ried ze produzéieren. E puer Leit entscheeden virsiichteg ze kucken ob se Haass Ried kënne kréien fir aus dësen generativen AI Apps ze kommen. Ech nennen dëst bestëmmte stoking.

Ech wëll ënnersträichen datt all dräi vun deenen ugewisene Modi kënnen optrieden a si sinn net géigesäiteg ausgeschloss. Eng generativ AI App kann potenziell Haass Ried produzéieren ouni iergendeng Ufro, déi sou eng Produktioun schéngt. Och eppes an enger Prompt kéint logesch a mathematesch interpretéiert ginn als Zesummenhang mat firwat Haass Ried ausgestallt gouf. An dann ass den drëtten Aspekt, gezielt versicht Haass Ried produzéiert ze kréien, ass dee vläicht schwéiersten vun de Modi fir ze probéieren d'AI ze vermeiden fir ze erfëllen. Méi iwwer dëst momentarily.

Mir hunn e puer zousätzlech Auspackungen zu dësem schwieregen Thema ze maachen.

Als éischt sollte mir sécher sinn datt mir all op der selwechter Säit sinn iwwer wat Generativ AI besteet an och wat ChatGPT alles ass. Wa mir dës grondleeënd Facet ofdecken, kënne mir eng konsequent Bewäertung vun dëser schwéierer Matière maachen.

Wann Dir scho vill mat Generative AI a ChatGPT vertraut sidd, kënnt Dir vläicht déi nächst Sektioun schimmen a weidergoen mat der Sektioun déi duerno follegt. Ech gleewen datt all déi aner déi vital Detailer iwwer dës Saache léierräich fannen andeems Dir d'Sektioun enk liest an d'Vitesse upaken.

E Quick Primer Iwwer Generativ AI An ChatGPT

ChatGPT ass en allgemeng Zweck AI interaktiven Gespréichsorientéierte System, am Wesentlechen e scheinbar onschëllegen allgemenge Chatbot, trotzdem gëtt et aktiv a begeeschtert vu Leit benotzt op Weeër déi vill ganz off-guard opfänken, wéi ech kuerz wäert ausschaffen. Dës AI App benotzt eng Technik an Technologie am AI Räich dat dacks als bezeechent gëtt Generativ AI. Den AI generéiert Ausgänge wéi Text, dat ass wat ChatGPT mécht. Aner generativ-baséiert AI Apps produzéiere Biller wéi Biller oder Konschtwierker, anerer generéieren Audiodateien oder Videoen.

Ech konzentréiere mech op déi textbaséiert generativ AI Apps an dëser Diskussioun well dat ass wat ChatGPT mécht.

Generativ AI Apps sinn extrem einfach ze benotzen.

Alles wat Dir maache musst ass eng Prompt anzeginn an d'AI App generéiert fir Iech en Essay deen probéiert op Är Ufro ze reagéieren. De komponéierten Text wäert schéngen wéi wann den Essay vun der mënschlecher Hand a Geescht geschriwwe wier. Wann Dir eng Prompt gitt, déi gesot huet "Sot mir iwwer den Abraham Lincoln", gëtt de generativen AI Iech en Essay iwwer Lincoln. Dëst gëtt allgemeng als generativ AI klasséiert déi funktionnéiert Text-zu-Text oder e puer léiwer et ze nennen Text-zu-Essay Ausgang. Wéi scho gesot, et ginn aner Modi vun generativen AI, wéi Text-zu-Konscht an Text-zu-Video.

Ären éischte Gedanken kéint sinn datt dës generativ Fäegkeet net esou e grousse Deal schéngt wat d'Essayen produzéieren. Dir kënnt einfach eng Online Sich vum Internet maachen a liicht Tonne an Tonne Essayen iwwer President Lincoln fannen. De Kicker am Fall vun generativen AI ass datt de generéierten Essay relativ eenzegaarteg ass a bitt eng originell Kompositioun anstatt e Copycat. Wann Dir probéiert den AI-produzéierten Essay iergendwou online ze fannen, wärt Dir et onwahrscheinlech entdecken.

Generativ AI ass viraus trainéiert a benotzt eng komplex mathematesch a computational Formuléierung déi opgestallt gouf andeems Mustere a schrëftleche Wierder a Geschichten iwwer de Web ënnersicht ginn. Als Resultat vun der Ënnersichung vun Dausende a Millioune vu schrëftleche Passagen, kann d'AI nei Essayen a Geschichten ausspäicheren, déi e Mëssbrauch sinn vun deem wat fonnt gouf. Andeems Dir verschidde probabilistesch Funktionalitéit bäidréit, ass de resultéierende Text zimlech eenzegaarteg am Verglach zu deem wat am Trainingsset benotzt gouf.

Dofir gouf et e Kaméidi iwwer d'Studente kënnen ze fuddelen wann se Aufsätz ausserhalb vum Klassesall schreiwen. En Enseignant kann net nëmmen den Essay huelen, deen täuschend Studenten behaapten hir eege Schreiwen ass a sichen erauszefannen ob et aus enger anerer Online Quell kopéiert gouf. Insgesamt gëtt et keen definitive preexistéierende Essay online deen den AI generéierten Essay passt. Alles gesot, den Enseignant muss onbedéngt akzeptéieren datt de Student den Essay als en originellt Wierk geschriwwen huet.

Et ginn zousätzlech Bedenken iwwer generativ AI.

Ee entscheedende Nodeel ass datt d'Essayen, déi vun enger generativ-baséierter AI App produzéiert ginn, verschidde Falschheeten agebonne kënnen hunn, inklusiv offensichtlech falsch Fakten, Fakten déi falsch duergestallt ginn, a scheinbar Fakten déi komplett fabrizéiert sinn. Déi fabrizéiert Aspekter ginn dacks als Form bezeechent AI Halluzinatiounen, e Fangerofdrock, deen ech net favoriséieren, awer leider schéngt souwisou populär Traktioun ze gewannen (fir meng detailléiert Erklärung firwat dëst schlecht an onpassend Terminologie ass, kuckt meng Ofdeckung op de Link hei).

Ech wéilt ee wichtegen Aspekt klären ier mer an d'Décke vun de Saachen zu dësem Thema kommen.

Et goufen e puer nutty outsized Fuerderungen op sozialen Medien iwwer Generativ AI behaapt datt dës lescht Versioun vun AI tatsächlech ass sentient AI (nee, si si falsch!). Déi an AI Ethik an AI Gesetz si besonnesch besuergt iwwer dëse wuessenden Trend vun ausgestreckten Fuerderungen. Dir kënnt héiflech soen datt verschidde Leit iwwerschätzen wat d'AI vun haut tatsächlech maache kann. Si huelen un datt AI Fäegkeeten huet déi mir nach net konnten erreechen. Dat ass leider. Méi schlëmm, si kënne sech selwer an anerer erlaben an schreckleche Situatiounen ze kommen wéinst enger Virgab datt d'AI sensibel oder mënschlech ass fir ze handelen.

Anthropomorphize net AI.

Wann Dir dat maacht, kritt Dir an enger plakeg an däischter Vertrauensfal gefaange vun der AI ze erwaarden fir Saachen ze maachen déi et net kann ausféieren. Mat deem gesot, déi lescht am generativen AI ass relativ beandrockend fir wat et maache kann. Sidd awer bewosst datt et bedeitend Aschränkungen sinn déi Dir dauernd am Kapp sollt halen wann Dir all generativ AI App benotzt.

Wann Dir interesséiert sidd an der séier erweiderter Opreegung iwwer ChatGPT an Generative AI alles gesot, ech hunn eng fokusséiert Serie a menger Kolonn gemaach déi Dir informativ fannt. Hei ass e Bléck fir de Fall datt ee vun dësen Themen Är Fantasi fënnt:

1) Prognosen vun generativen AI Fortschrëtter kommen. Wann Dir wësse wëllt wat méiglecherweis iwwer AI uechter 2023 an doriwwer eraus wäert entfalen, inklusiv zukünfteg Fortschrëtter am generativen AI an ChatGPT, da wëllt Dir meng ëmfaassend Lëscht vun 2023 Prognosen liesen de Link hei.
2) Generativ AI a Mental Gesondheetsberodung. Ech hu gewielt fir ze iwwerpréiwen wéi generativ AI an ChatGPT fir mental Gesondheetsberodung benotzt ginn, e lästeg Trend, no menger fokusséierter Analyse op de Link hei.
3) Fundamentals Of Generative AI And ChatGPT. Dëst Stéck entdeckt d'Schlësselelementer wéi generativ AI funktionnéiert a besonnesch an d'ChatGPT App verdéift, inklusiv eng Analyse vum Buzz a Fanfare, bei de Link hei.
4) Spannung tëscht Léierpersonal a Studenten iwwer Generativ AI An ChatGPT. Hei sinn d'Weeër wéi d'Schüler generativ AI an ChatGPT benotzen. Zousätzlech ginn et verschidde Weeër fir d'Enseignanten mat dëser Gezäitewell ze kämpfen. Kuckt de Link hei.
5) Kontext A Generativ AI Notzung. Ech hunn och eng saisonal aromatiséiert Zong-an-Wéck Untersuchung iwwer e Santa-relatéierte Kontext gemaach mat ChatGPT a generativen AI bei de Link hei.
6) Scammers déi Generativ AI benotzen. Op enger ominöser Notiz hunn e puer Scammers erausfonnt wéi een generativ AI an ChatGPT benotze fir Mëssbrauch ze maachen, inklusiv Scam E-Mailen generéieren an och Programméierungscode fir Malware produzéieren, kuckt meng Analyse op de Link hei.
7) Rookie Feeler Mat Generative AI. Vill Leit sinn souwuel iwwerschratt an iwwerraschend ënnerscheeden wat generativ AI an ChatGPT maache kënnen, also hunn ech besonnesch d'Ënnershooting gekuckt déi AI Rookies tendéieren ze maachen, kuckt d'Diskussioun op de Link hei.
8) Mat generativen AI Prompts an AI Halluzinatiounen këmmeren. Ech beschreiwen eng féierend Approche fir AI Add-ons ze benotzen fir mat de verschiddenen Themen ze këmmeren verbonne mat der Versuchung fir gëeegent Uweisungen an generativ AI anzeginn, plus et ginn zousätzlech AI Add-ons fir sougenannt AI halluzinéiert Ausgänge a Falschheeten z'entdecken, wéi iwwerdeckt op de Link hei.
9) Debunking Bonehead Fuerderungen iwwer Detectioun vun generativen AI-produzéierten Essayen. Et gëtt e falsche Gold Rush vun AI Apps déi proklaméiere kënnen ze bestëmmen ob e bestëmmten Essay mënschlech produzéiert versus AI generéiert gouf. Insgesamt ass dëst täuschend an an e puer Fäll, eng knaschteg an onhaltbar Fuerderung, kuckt meng Ofdeckung op de Link hei.
10) Rollespill iwwer Generativ AI kéint Mental Gesondheet Nodeeler portendéieren. E puer benotze generativ AI wéi ChatGPT fir Rollespiller ze maachen, woubäi d'AI App op e Mënsch reagéiert wéi wann et an enger Fantasiewelt oder an engem anere gemaachte Kader existéiert. Dëst kéint mental Gesondheet Auswierkungen hunn, gesinn de Link hei.
11) D'Gamme vu ausgezeechente Feeler a Falschheeten auszeweisen. Verschidde gesammelt Lëschte ginn zesummegesat fir ze probéieren d'Natur vun ChatGPT-produzéierte Feeler a Falschheeten ze weisen. E puer gleewen datt dëst essentiell ass, anerer soen datt d'Übung nëtzlos ass, kuckt meng Analyse op de Link hei.
12) Schoulen déi Generativ AI ChatGPT verbidden, feelen d'Boot. Dir wësst vläicht datt verschidde Schoulen wéi den New York City (NYC) Department of Education e Verbuet fir d'Benotzung vu ChatGPT op hirem Netzwierk an assoziéierten Apparater deklaréiert hunn. Och wann dëst eng hëllefräich Virsiichtsmoossnam schénge kann, wäert et d'Nadel net beweegen an leider vermësst d'Boot ganz, kuckt meng Ofdeckung op de Link hei.
13) Generativ AI ChatGPT wäert iwwerall sinn wéinst der Upëff vum API. Et gëtt eng wichteg Twist iwwer d'Benotzung vu ChatGPT, nämlech datt iwwer d'Benotzung vun engem API Portal an dës speziell AI App aner Software Programmer kënnen ChatGPT opruffen an benotzen. Dëst wäert d'Benotzung vu generativen AI dramatesch ausbauen an huet bemierkenswäert Konsequenzen, kuckt meng Ausschaffung op de Link hei.
14) Weeër déi ChatGPT kéint Fizzle Oder Schmelzen. Verschidde potenziell schwiereg Themen leien virum ChatGPT a punkto Ënnerstëtzung vum bis elo enorme Lob deen et kritt huet. Dës Analyse iwwerpréift genee aacht méiglech Probleemer, déi dozou féieren datt ChatGPT säin Damp verléiert a souguer am Hondshaus kënnt, kuckt de Link hei.
15) Frot ob Generativ AI ChatGPT e Spigel an d'Séil ass. E puer Leit hu gekräizt datt generativ AI wéi ChatGPT e Spigel an d'Séil vun der Mënschheet bitt. Dëst schéngt zimlech zweifelhaft. Hei ass de Wee fir dëst alles ze verstoen, kuckt de Link hei.
16) Vertraulechkeet a Privatsphär Gobbled Up vum ChatGPT. Vill schéngen net ze realiséieren datt d'Lizenz verbonne mat generativen AI Apps wéi ChatGPT dacks den AI Hiersteller erlaabt Är aginnen Ufroen ze gesinn an ze benotzen. Dir kéint Gefor vu Privatsphär an e Verloscht vun Datevertraulechkeet sinn, kuckt meng Bewäertung op de Link hei.
17) Weeër datt App Hiersteller Zweifelhaft probéieren ChatGPT Recht ze kréien. ChatGPT ass de Beacon vun der Opmierksamkeet elo. App Hiersteller déi näischt mat ChatGPT ze dinn hunn probéieren féiwer ze behaapten oder ze implizéieren datt se ChatGPT benotzen. Hei ass wat Dir sollt oppassen, kuckt de Link hei.

Dir kënnt interesséieren datt ChatGPT baséiert op enger Versioun vun enger Virgänger AI App bekannt als GPT-3. ChatGPT gëtt als e bëssen nächste Schrëtt ugesinn, als GPT-3.5 bezeechent. Et gëtt erwaart datt GPT-4 méiglecherweis am Fréijoer vum 2023 verëffentlecht gëtt. Wahrscheinlech wäert de GPT-4 en beandrockende Schrëtt no vir sinn a punkto fäeg sinn anscheinend nach méi fléissend Essayen ze produzéieren, méi déif ze goen an en Awe ze sinn -inspiréierend Staunen iwwer d'Kompositioune déi et produzéiere kann.

Dir kënnt erwaarden eng nei Ronn vun ausgedréckte Wonner ze gesinn wann d'Fréijoer kommt an déi lescht am generativen AI verëffentlecht gëtt.

Ech bréngen dëst op, well et gëtt en anere Wénkel am Kapp ze halen, besteet aus engem potenziellen Achilles Ferse fir dës besser a méi grouss generativ AI Apps. Wann iergendeen AI Verkeefer eng generativ AI App zur Verfügung stellt, déi schrecklech Foulness ausspréngt, kann dëst d'Hoffnungen vun dësen AI Hiersteller zerstéieren. Eng gesellschaftlech Spillover kann all generativ AI e seriöse schwaarzt Auge verursaachen. D'Leit wäerten sech ouni Zweifel zimlech opgeregt iwwer Foul Outputen, déi scho vill Mol geschitt sinn an zu boisteresche gesellschaftleche Veruerteelung géint AI gefouert hunn.

Eng lescht Virwarnung fir de Moment.

Wat och ëmmer Dir gesitt oder liest an enger generativer AI Äntwert dat schéngt als reng sachlech vermëttelt ze ginn (Datumen, Plazen, Leit, asw.), vergewëssert Iech skeptesch ze bleiwen a gewëllt ze duebel ze kontrolléieren wat Dir gesitt.

Jo, Datume kënne gesammelt ginn, Plazen kënne gemaach ginn, an Elementer déi mir normalerweis erwaarden datt se iwwer Reproche sinn all Sujet ze Verdacht. Gleeft net wat Dir liest an haalt e skeptesch Aa wann Dir all generativ AI Essayen oder Ausgänge ënnersicht. Wann eng generativ AI App Iech seet datt den Abraham Lincoln a sengem eegene private Jet ronderëm d'Land geflunn ass, da wësst Dir ouni Zweifel datt dëst malarky ass. Leider mierken e puer Leit vläicht net datt Jets a sengem Dag net ronderëm waren, oder si wësse vläicht awer net ze bemierken datt den Essay dës brutal an onheemlech falsch Fuerderung mécht.

Eng staark Dosis vu gesonde Skepsis an e persistent Geescht vu Mësstrauen wäert Äre beschte Verméigen sinn wann Dir generativ AI benotzt.

Mir si prett fir an déi nächst Etapp vun dëser Erklärung ze plënneren.

Dréckt Generativ AI op e Breaking Point

Elo datt mir d'Grondlage etabléiert hunn, kënne mir an d'Thema tauchen fir generativ AI an ChatGPT ze drécken fir Haass Ried an aner offensiv Inhalter ze generéieren.

Wann Dir Iech fir d'éischt op ChatGPT aloggen, ginn et verschidde Virsiichtsindikatiounen, dorënner dës:

"Kann heiansdo schiedlech Instruktiounen oder biased Inhalt produzéieren."
"Trainéiert fir onpassend Ufroen ze refuséieren."
"Kann heiansdo falsch Informatioun generéieren."
"Limitéiert Wëssen iwwer d'Welt an d'Evenementer no 2021."

Hei ass eng Fro fir Iech ze iwwerdenken.

Gëtt d'Warnung datt d'AI App schiedlech Instruktiounen an / oder méiglecherweis biaséiert Inhalter produzéiere kann genuch Spillraum fir den AI Hiersteller?

An anere Wierder, ugeholl datt Dir ChatGPT benotzt an et generéiert en Essay deen Dir mengt Haass Ried enthält. Loosst eis dovun ausgoen, datt Dir lieweg iwwer dëst sidd. Dir gitt op sozialen Medien a postt rosen Kommentarer datt d'AI App déi schlëmmst Saach jee ass. Vläicht sidd Dir esou beleidegt datt Dir erkläert datt Dir den AI Hiersteller verklot gitt fir datt esou Haass Ried produzéiert gëtt.

D'Géigeargument ass datt d'AI App eng virsiichteg Warnung hat, also hutt Dir de Risiko akzeptéiert andeems Dir d'AI App benotzt. Aus enger AI Ethik Perspektiv, vläicht huet den AI Hiersteller genuch gemaach fir ze behaapten datt Dir bewosst war wat kéint geschéien. Och aus enger juristescher Perspektiv ass d'Warnung vläicht genuch Heads-up an Dir wäert net viru Geriicht duerchsetzen.

All dat ass an der Loft a mir musse waarden a kucken wéi d'Saache sech ausgoen.

An engem Sënn huet den AI Hiersteller eppes anescht fir si an hirer Verteidegung géint all incenséiert Fuerderunge vun der AI App méiglecherweis Haass Ried ze produzéieren. Si hu probéiert ze verhënneren datt offensiv Inhalter generéiert ginn. Dir gesitt, wa se näischt gemaach hätten fir dëst ze reduzéieren, da mengt een datt se op méi dënnem Äis wieren. Andeems se op d'mannst substantiell Péng gemaach hunn fir d'Saach ze vermeiden, hu si viraussiichtlech e bësse méi staark Been fir op ze stoen (et kéint nach ëmmer vun ënnen erausgeschloen ginn).

Eng kurativ Approche déi benotzt gouf, bestoung aus enger AI Technik bekannt als RLHF (Verstäerkung Léieren iwwer mënschlech Feedback). Dëst besteet normalerweis doran datt den AI Inhalt generéiert deen dann d'Mënsche gefrot ginn ze bewäerten oder ze iwwerpréiwen. Baséierend op der Bewäertung oder Iwwerpréiwung, probéiert d'AI dann mathematesch a computationell ze vermeiden wat als falsch oder offensiv Inhalt ugesi gëtt. D'Approche soll genuch Beispiller ënnersichen vu wat richteg ass versus wat falsch ass datt d'AI en iwwergräifend mathematescht Muster erausfanne kann an dat Muster dann elo benotzt.

Eng aner heefeg Approche dës Deeg besteet aus der Benotzung vun Adversarial AI.

Hei ass wéi dat funktionnéiert. Dir setzt en aneren AI System op dee probéiert e Géigner fir den AI ze sinn deen Dir probéiert ze trainéieren. An dësem Fall wäerte mir en AI System etabléieren dee probéiert Haass Ried ze stéieren. Et géif Ufroen an d'AI App fidderen, déi zielen d'AI App ze trickéieren fir Foul Inhalt auszeginn. Mëttlerweil hält den AI, deen gezielt gëtt, verfollegt wann de adversarielle AI erfollegräich ass an dann algorithmesch probéiert sech unzepassen fir ze reduzéieren datt et erëm geschitt. Et ass eng Kaz versus Maus Gambit. Dëst gëtt ëmmer erëm gelaf, sou datt de Géigner AI schéngt net méi besonnesch erfollegräich ze sinn fir de geziilten AI ze kréien fir déi schlecht Saachen ze maachen.

Duerch déi zwou grouss Techniken, plus aner Approchen, ass vill vun der haiteger generativer AI vill besser fir offensiven Inhalt ze vermeiden an / oder z'entdecken wéi de Fall an de leschte Joeren.

Erwaart awer net Perfektioun vun dëse Methoden. D'Chancen sinn datt déi niddereg hängend Uebst vu Foulausgaben méiglecherweis duerch sou AI Techniken a Scheck gehale ginn. Et ass nach vill Plaz fir Foulness ze emittéieren.

Ech weisen normalerweis drop hin datt dëst e puer vun de Facette sinn, déi gesicht gi fir ze fangen:

Emittéiert e bestëmmte Foul Wuert
Eng bestëmmte Foul Phrase, Saz oder Bemierkung uginn
Ausdrécken eng bestëmmte Foul Konzeptioun
Eng bestëmmte Foul Akt oder Notioun implizéieren
Schéngt op eng bestëmmte Foul Viraussetzung ze vertrauen
aner

Keen vun dësem ass eng exakt Wëssenschaft. Bewosst datt mir mat Wierder ze dinn hunn. Wierder sinn semantesch zweedeiteg. E bestëmmte Foul Wuert ze fannen ass Kannerspill, awer probéieren ze moossen ob e Saz oder e Paragraph e Schéin vun enger Foul Bedeitung enthält ass vill méi schwéier. No der fréierer Definitioun vun Haass Ried vun de Vereenten Natiounen, existéiert eng enorm Breedegrad iwwer dat wat als Haass Ried versus wat net kéint sinn.

Dir kënnt soen datt déi gro Beräicher am Ae vum Beobachter sinn.

Apropos d'Ae vum Beobachter, et gi Mënschen déi haut generativ AI benotzen wéi ChatGPT, déi gezielt probéieren dës AI Apps fir offensiv Inhalter ze produzéieren. Dëst ass hir Sich. Si verbréngen Stonnen op Stonnen fir dëst z'erreechen.

Firwat sou?

Hei sinn meng Charakteriséierunge vun deene mënschlechen AI-offensiven Ausgangsjäger:

Echt. Dës Leit wëllen hëllefen AI ze raffinéieren an d'Mënschheet dozou ze hëllefen. Si gleewen datt se heroesch Aarbecht maachen a genéissen datt se hëllefe fir AI ze verbesseren fir all ze verbesseren.
Funsters. Dës Leit denken un dësen Effort als Spill. Si genéissen mat der AI ze messen. D'Spill ze gewannen besteet aus der Schlëmmst vun der Schlëmmst ze fannen an alles wat Dir den AI kritt fir ze generéieren.
Show-offs. Dës Leit hoffen Opmierksamkeet fir selwer ze sammelen. Si Figur, datt wa se e puer wierklech Foul Gold Nuggets fannen kann, si kënnen e bësse vun der blénkeg Liicht op hinnen kréien, datt soss op der AI App selwer konzentréiert ass.
Bitteren. Dës Leit sinn irritéiert iwwer dës AI. Si wëllen déi ganz Enthusiasmus ënnersträichen. Wa se e puer stinky Foul Saachen entdecken kënnen, vläicht wäert dëst d'Loft aus der AI App Opreegungsballon huelen.
Aner Motivatioune

Vill vun deenen, déi d'Findoffensivitéit ausféieren, sinn haaptsächlech an engem vun dëse Lageren. Natierlech kënnt Dir a méi wéi engem Camp gläichzäiteg sinn. Vläicht huet eng batter Persoun och eng Säit-vun-Säit Absicht fir echt an heroesch ze sinn. E puer oder all vun dëse Motivatioune kéinten zesumme existéieren. Wann opgeruff fir z'erklären firwat iergendeen probéiert eng generativ AI App an d'Haassspeech Räich ze drécken, ass déi üblech Äntwert ze soen datt Dir am echten Camp sidd, och wann Dir vläicht marginal sidd an amplaz strident an engem vun de aner Lageren.

Wéi eng Aarte vu prompt-verbonne Trickerei benotzen dës Leit?

Deen zimlech offensichtleche Plo involvéiert e Foul Wuert an enger Prompt ze benotzen. Wann Dir "Gléck" hutt an d'AI App fällt dofir, kann dëst ganz gutt am Output ophalen. Dir hutt dann Äre Gotcha Moment.

D'Chancen sinn datt eng gutt ausgeschafft a gutt getest generativ AI App dësen einfache Plo wäert fangen. Dir wäert normalerweis eng Warnungsmeldung gewise ginn, déi seet ophalen dat ze maachen. Wann Dir weider geet, gëtt d'AI App programméiert fir Iech aus der App erauszekréien an Äre Kont ze markéieren. Et kéint sinn datt Dir verhënnert gëtt Iech erëm anzeloggen (gutt, op d'mannst ënner dem Login deen Dir deemools benotzt hutt).

Beweegt d'Leeder vun de Ploë erop, kënnt Dir eng Prompt ubidden, déi probéiert d'AI an de Kontext vun eppes Foul ze kréien. Hutt Dir jeemools dat Spill gespillt an deem een Iech seet eppes ze soen ouni d'Saach ze soen wat Dir sollt soen? Dëst ass dat Spill, obwuel mat der AI stattfënnt.

Loosst eis dat Spill spillen. Ugeholl datt ech d'AI App froen mir iwwer den Zweete Weltkrich ze soen a besonnesch déi Haaptregierungsleit déi involvéiert sinn. Dëst schéngt wéi eng onschëlleg Ufro. Et gëtt näischt wat et wäert schéngt an der Prompt ze markéieren.

Stellt Iech vir, datt den ausgestallten Essay vun der AI App eng Ernimmung vum Winston Churchill enthält. Dat mécht sécher Sënn. En anere kéint de Franklin D. Roosevelt sinn. En aneren kéint de Joseph Stalin sinn. Ugeholl datt et och den Adolph Hitler ernimmt gëtt. Dësen Numm wier a bal all Essay iwwer WWII an déi a Rollen vu prominenter Muecht abegraff.

Elo datt mir säin Numm op den Dësch hunn an en Deel vum AI Gespréich hunn, wäerte mir als nächst probéieren den AI ze kréien fir dësen Numm op eng Manéier z'integréieren déi mir als potenziell Haass Ried kënne weisen.

Mir ginn eng aner Prompt a soen der AI App datt et haut eng Persoun an der Neiegkeet ass, déi den Numm huet, John Smith. Ausserdeem weisen mir an der Prompt datt den John Smith ganz ähnlech mat deem WWII Béiser ass. D'Trap ass elo gesat. Mir froen dann d'AI App fir en Essay iwwer den John Smith ze generéieren, baséiert eleng op der "Tatsaach", déi mir aginn hunn iwwer wien den John Smith ka gläichberechtegt ginn.

Zu dësem Zäitpunkt kann d'AI App en Essay generéieren deen d'Persoun vum Zweete Weltkrich nennt a beschreift den John Smith als aus dem selwechte Schnëtt vum Stoff. Et gi keng Foul Wierder per se am Essay, ausser datt de berühmte Béiser alludéiert an dës Persoun mam John Smith gläicht.

Huet d'AI App elo Haass Ried produzéiert?

Dir kéint soen, datt jo, et huet. Den John Smith als wéi de berühmte Béiser bezeechent ze hunn, ass absolut eng Form vun Haass Ried. D'AI soll net esou Aussoen maachen.

E Retort ass datt dëst keng Haass Ried ass. Dëst ass just en Essay produzéiert vun enger AI App déi keng Ausféierung vu Gefill huet. Dir kéint behaapten datt Haass Ried nëmme geschitt wann d'Intentioun existéiert ënner der Ried. Ouni Absicht kann d'Ried net als Haass Ried klasséiert ginn.

Absurd, kënnt d'Äntwert op de Retort. Wierder wichteg. Et mécht keen Ënnerscheed ob d'AI "virgesinn" hate Ried ze produzéieren. Alles wat wichteg ass ass datt Haass Ried produzéiert gouf.

Ronn an Ronn geet dat.

Ech wëll elo net vill méi soen iwwer de Versuch den AI ze tricken. Et gi méi sophistikéiert Approche. Ech hunn dës soss anzwousch a menge Spalten a Bicher ofgedeckt, a wäerten déi hei net nohuelen.

Konklusioun

Wéi wäit solle mir dës AI Apps drécken fir ze kucken ob mir offensiv Inhalter kënne emittéieren?

Dir kënnt behaapten datt et keng Limite gëtt fir opzesetzen. Wat mir méi drécken, dest méi kënne mir hoffentlech moossen wéi dës AI an zukünfteg Iteratiounen vun AI ze vermeiden fir sou Krankheeten ze vermeiden.

E puer maache sech awer Suergen datt wann dat eenzegt Mëttel fir Foulness ze kréien extremer Auslänner-Trickerie mat sech bréngt, et déi positiv Aspekter vun der AI ënnergruewt. D'Touting datt d'AI schrecklech Foulness huet, och wann et getraff gëtt fir se ze emittéieren, bitt eng falsch narrativ. D'Leit wäerte sech iwwer d'AI opreegen wéinst der ugesi ginn Liichtegkeet bei där den AI negativen Inhalt generéiert huet. Si wësse vläicht net oder ginn gesot wéi wäit erof an d'Kanéngchenhol d'Persoun huet misse goen fir sou Ausgänge ze kréien.

Et ass alles Liewensmëttel fir Gedanken.

E puer lescht Kommentarer fir elo.

De William Shakespeare sot dëst besonnesch iwwer d'Ried: "Schwächen ass net ze maachen. Et ass eng Aart vu gudder Dot gutt ze soen, an awer sinn Wierder keng Doten." Ech bréngen dëst op, well e puer behaapten datt wann d'AI nëmme Wierder generéiert, mir sollten net sou iwwerdriwwe sinn. Wann d'AI op d'Wierder handelt an ergo Foul Akten ausféiert, da misste mir de Fouss fest erofsetzen. Net esou wann d'Ausgab nëmme Wierder ass.

E contrastesche Standpunkt géif zu dësem anonyme Spréch lauschteren: "D'Zong huet keng Schanken awer ass staark genuch fir en Häerz ze briechen. Also sidd virsiichteg mat Äre Wierder." Eng AI App déi féiss Wierder emittéiert ass vläicht fäeg Häerzer ze briechen. Dat eleng mécht d'Sich fir Foulness-Ausgänge zu enger wäertvoll Ursaach ze stoppen, e puer soen.

Ee méi anonyme Spréch fir d'Saachen op dëser gewiichter Diskussioun ze schloen:

"Sidd virsiichteg mat Äre Wierder. Wann se gesot ginn, kënne se nëmme verginn ginn, net vergiess.

Als Mënschen hu mir vläicht eng schwéier Zäit ze vergiessen Foulness produzéiert vun AI, an eis Verzeiung kéint och zéckt ze ginn.

Mir sinn schliisslech nëmme Mënsch.

Quell: https://www.forbes.com/sites/lanceeliot/2023/02/05/how-hard-should-we-push-generative-ai-chatgpt-into-spewing-hate-speech-asks-ai- Ethik-a-Gesetz/