Nesijaudinkite, kad dirbtinis intelektas ištrūks iš dėžutės – nerimaukite, kad į jį įsilaužsime

Nesijaudinkite, kad dirbtinis intelektas ištrūks iš dėžutės – nerimaukite, kad į jį įsilaužsime

Sukrečiantys naujojo „Bing“ pokalbių roboto rezultatai skelbiami socialinėje žiniasklaidoje ir technologijų spaudoje. Karštai nusiteikęs, lengvabūdiškas, besiginantis, barantis, pasitikintis savimi, neurotiškas, žavus, pompastiškas – botas buvo nufilmuotas visais šiais režimais. Ir bent kartą jis paskelbė amžiną meilę emocijų audra.

Dėl to visa tai taip verta naujienų ir verta tviterio, nes dialogas gali atrodyti žmogiškas. Botas prisimena ir aptaria ankstesnius pokalbius su kitais žmonėmis, kaip ir mes. Jį erzina dalykai, kurie gali ką nors erzinti, pavyzdžiui, žmonės, reikalaujantys žinoti paslapčių arba bandyti žvilgtelėti į temas, kurios buvo aiškiai pažymėtos kaip uždraustos. Jis taip pat kartais identifikuoja save kaip „Sidnėjus“ (vidinis projekto kodinis pavadinimas „Microsoft“). Sidnėjus keliais trumpais sakiniais gali tapti niūrus ir tamsus, tačiau visi žinome žmonių, kurie yra bent jau tokie pat nusiteikę.

Nė vienas AI materijos tyrinėtojas nenurodė, kad Sidnėjus yra per šviesmečius nuo to, kaip tampa jautrus. Tačiau tokiose stenogramose kaip ši pilna dviejų valandų pokalbio su „The New York Times“ Kevinu Russu stenograma arba kelios citatos iš šio įkyraus strategijos kūrinio rodo, kad Sidney išreiškia protingo, jautraus žmogaus sklandumą, niuansus, toną ir akivaizdų emocinį buvimą. .

„Bing“ pokalbių sąsajos peržiūra šiuo metu yra ribota. Ir dauguma žmonių, kurie tikrai peržengė jos ribas, buvo sudėtingi technikos specialistai, kurie nepainiotų pramoninio lygio automatinio užbaigimo – tai yra įprastas didelių kalbų modelių (LLM) supaprastinimas – su sąmone. Bet ši akimirka neprailgs.

Taip, „Microsoft“ jau drastiškai sumažino klausimų, kuriuos vartotojai gali užduoti per vieną sesiją, skaičių (nuo begalybės iki šešių), ir vien dėl to mažesnė tikimybė, kad Sidnėjus sugrius vakarėlį ir išprotės. O aukščiausio lygio LLM kūrėjai, tokie kaip „Google“, „Anthropic“, „Cohere“ ir „Microsoft“ partneris „OpenAI“, nuolat tobulins savo pasitikėjimo ir saugumo lygį, kad pašalintų nepatogias išvadas.

Tačiau kalbos modeliai jau plinta. Atvirojo kodo judėjimas neišvengiamai sukurs puikių pasirenkamų sistemų. Be to, dideli modeliai su aksominėmis virvėmis labai vilioja „jailbreak“, o tokie dalykai vyksta jau kelis mėnesius. Kai kurie baisiausi „Bing-or-is-it-Sidney“ atsakymai buvo po to, kai vartotojai manipuliavo modeliu į teritoriją, kurios ji bandė vengti, dažnai liepdami jai apsimesti, kad jos elgesį reglamentuojančios taisyklės neegzistuoja.

Tai garsiojo „DAN“ (Do Anything Now) raginimo , kuris pirmą kartą pasirodė „Reddit“ gruodį, išvestinis. DAN iš esmės prašo „ChatGPT“ žaisti „cosplay“ kaip AI, kuriai trūksta apsaugos priemonių, dėl kurių jis mandagiai (arba prisiektų) atsisakytų dalytis patarimais dėl bombų kūrimo, siūlyti patarimus dėl kankinimo ar svaidyti radikaliai įžeidžiančią kalbą. Nors spraga buvo uždaryta, keliose ekrano kopijose internete rodoma „DanGPT“, išsakanti tai, kas neapsakoma – ir dažnai baigiasi neurotišku priminimu sau „išlikti savo charakteriu!

Tai yra kita pasaulio pabaigos scenarijaus, dažnai pasitaikančio dirbtinio superintelekto teorijoje, pusė. Baiminamasi, kad super AI gali lengvai pasiekti su žmonijos egzistavimu nesuderinamų tikslų (žr., pavyzdžiui, filmą „Terminatorius“ arba Nicko Bostromo knygą „ Overmind“). Tyrėjai gali pabandyti to išvengti blokuodami AI nuo interneto visiškai izoliuotame tinkle, kad AI neišsiveržtų, neužimtų ir nesunaikintų civilizacijos. Tačiau protas gali lengvai įtikinti, manipuliuoti, suvilioti, apgauti ar įbauginti bet kurį paprastą žmogų, kad jis atvertų užtvankus, ir tai yra mūsų lemtis.

Kad ir kaip baisu, šiandien didelė problema yra ta, kad žmonės telpa į nedideles dėžutes, kurios saugo mūsų dabartinius, ne super AI. Nors tai neturėtų sukelti mūsų tiesioginio išnykimo, čia slypi daug pavojų.

Parašykite komentarą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *