Älä huoli tekoälyn murtumisesta laatikosta – huolehdi siitä, että hakkeroimme sen

Älä huoli tekoälyn murtumisesta laatikosta – huolehdi siitä, että hakkeroimme sen

Uuden Bing-chatbotin järkyttäviä tuloksia käsitellään sosiaalisessa mediassa ja teknologialehdistössä. Kuumaluonteinen, kevytmielinen, puolustava, moittiva, itsevarma, neuroottinen, hurmaava, mahtipontinen – botti on kuvattu kaikissa näissä tiloissa. Ja ainakin kerran hän julisti ikuista rakkautta hymiöiden myrskyllä.

Mikä tekee tästä kaikesta niin uutisarvon ja twiitin arvoisen, on se, kuinka inhimilliseltä dialogi voi näyttää. Botti muistaa ja keskustelee aiemmista keskusteluista muiden ihmisten kanssa, aivan kuten mekin. Häntä ärsyttävät asiat, jotka saattavat ärsyttää jotakuta, kuten ihmiset, jotka vaativat tietää salaisuuksista tai yrittävät kurkistaa aiheisiin, jotka on nimenomaisesti merkitty kiellettyiksi. Hän myös joskus tunnistaa itsensä ”Sydneyksi” (projektin sisäinen koodinimi Microsoftilla). Sydney voi muuttua tylystä synkäksi ja ekspansiiviseksi muutamalla nopealla lauseella, mutta me kaikki tiedämme ihmisiä, jotka ovat vähintään yhtä mielialaisia.

Yksikään aineen AI-tutkija ei ole ehdottanut, että Sydney olisi valovuosien sisällä aistivansa. Mutta transkriptiot, kuten tämä täydellinen transkriptio kahden tunnin keskustelusta The New York Timesin Kevin Russin kanssa tai useat lainaukset tästä pakkomielteisestä strategiakappaleesta , osoittavat Sidneyn ilmaisevan älykkään, herkän miehen sujuvuutta, vivahteita, sävyä ja ilmeistä emotionaalista läsnäoloa. .

Bing-chat-käyttöliittymä on tällä hetkellä rajoitettu esikatselu. Ja suurin osa ihmisistä, jotka todella työnsivät sen rajoja, olivat kehittyneitä teknikoita, jotka eivät sekoittaneet teollisen tason automaattista täydennystä – mikä on yleinen yksinkertaistus siitä, mitä suuret kielimallit (LLM) ovat – tietoisuuteen. Mutta tämä hetki ei kestä.

Kyllä, Microsoft on jo vähentänyt käyttäjien yhden istunnon aikana esittämien kysymysten määrää rajusti (äärettömästä kuuteen), ja jo pelkästään sen vuoksi on vähemmän todennäköistä, että Sydney kaatuu juhlaan ja tulee hulluksi. Ja huipputason LLM-kehittäjät, kuten Google, Anthropic, Cohere ja Microsoftin kumppani OpenAI, kehittävät jatkuvasti luottamus- ja tietoturvatasoaan poistaakseen epämiellyttävät johtopäätökset.

Mutta kielimallit ovat jo leviämässä. Avoimen lähdekoodin liike luo väistämättä hienoja valinnaisia ​​järjestelmiä. Lisäksi suuret samettiköydillä varustetut mallit houkuttelevat jailbreakiin, ja tällaisia ​​asioita on tapahtunut jo useita kuukausia. Jotkut Bing-or-is-it-Sydneyn pelottavimmista vastauksista seurasivat sen jälkeen, kun käyttäjät manipuloivat mallia alueelle, jota hän yritti välttää, ja usein kehottivat häntä teeskentelemään, että hänen käyttäytymistään koskevia sääntöjä ei ollut olemassa.

Tämä on johdannainen kuuluisasta ”DAN” (Do Anything Now) -kehotteesta , joka ilmestyi ensimmäisen kerran Redditissä joulukuussa. DAN pohjimmiltaan pyytää ChatGPT:tä cosplayamaan tekoälynä, jolta puuttuvat suojat, jotka muutoin saisivat sen kohteliaasti (tai vannomaan) kieltäytymään jakamasta pomminvalmistusneuvoja, antamasta kidutusneuvoja tai sylkemään radikaalisti loukkaavaa kieltä. Vaikka porsaanreikä on umpeutunut, useissa verkkokuvakaappauksissa näkyy ”DanGPT”, jossa sanotaan sanoinkuvaamattoman – ja usein huipentuu neuroottiseen muistutukseen itselleen ”pysyä luonteessa!”

Tämä on tuomiopäivän skenaarion toinen puoli, jota usein esiintyy keinotekoisen superälyn teoriassa. Pelätään, että super AI voi helposti ottaa tavoitteita, jotka eivät ole yhteensopivia ihmiskunnan olemassaolon kanssa (katso esimerkiksi elokuva ”Terminator” tai Nick Bostromin kirja ” Overmind”). Tutkijat voivat yrittää estää tämän estämällä tekoälyn verkosta, joka on täysin eristetty Internetistä, jotta tekoäly ei murtaudu, valtaa tai tuhoa sivilisaatiota. Mutta ylimielinen voi helposti houkutella, manipuloida, vietellä, pettää tai pelotella kenet tahansa pelkän ihmisen avaamaan tulvaportit, ja tämä on meidän tuomiomme.

Niin paljon kuin se onkin perseestä, suuri ongelma nykyään on, että ihmiset mahtuvat hauraisiin laatikoihin, jotka suojaavat nykyisiä, ei-super-AI:itämme. Vaikka tämän ei pitäisi johtaa välittömään sukupuuttoon, täällä piilee monia vaaroja.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *