Titanų susidūrimas AI: ChatGPT prieš Bardą proto ir išminties mūšyje
Šiuolaikiniame dirbtiniu intelektu veikiančių generatyvių pokalbių robotų pasaulyje buvome netikėto OpenAI ChatGPT, pristatyto lapkritį, pasirodymo liudininkais, vasarį – Bing Chat, o kovo mėn. – Google Bard. Nusprendėme išbandyti šiuos pokalbių robotus, atlikdami daugybę užduočių, kad nustatytų, kuris iš jų dominuoja AI pokalbių robotų arenoje. Kadangi „Bing Chat“ naudoja tą pačią GPT-4 technologiją kaip ir naujausias „ChatGPT“ modelis, nusprendėme sutelkti dėmesį į du AI pokalbių roboto technologijos titanus: „OpenAI“ ir „Google“.
Mes išbandėme „ChatGPT“ ir „Bard“ septyniose kritinėse kategorijose: tėčio anekdotai, argumentų dialogai, žodžių matematikos problemos, apibendrinimas, faktų paieška, kūrybinis rašymas ir kodavimas. Kiekvienam testui įvedėme tą pačią instrukciją (vadinamą „užuomina“) į „ChatGPT“ (su GPT-4) ir „Google Bard“. Naudojome pirmąjį rezultatą, be ničų.
Verta paminėti, kad taip pat yra ChatGPT versija, pagrįsta ankstesniu GPT-3.5 modeliu, tačiau mes jos nenaudojome testuodami. Kadangi naudojome tik GPT-4, šiame straipsnyje ChatGPT vadinsime „ChatGPT-4“, kad išvengtume painiavos.
Akivaizdu, kad tai nėra mokslinis tyrimas, o skirtas smagiam pokalbių robotų galimybių palyginimui. Seansų rezultatai gali skirtis dėl atsitiktinių elementų, o tolesni vertinimai su skirtingais ženklais duos skirtingus rezultatus. Be to, šių modelių galimybės laikui bėgant sparčiai keisis, nes „Google“ ir „OpenAI“ toliau juos atnaujins. Tačiau kol kas 2023 m. balandžio mėn. pradžioje viskas vyksta taip.
tėtis juokauja
Norėdami įkaitinti savo sąmojingumo varžybas, paprašėme ChatGPT ir Bardo parašyti keletą juokelių. Ir kadangi tėčių anekdotai yra komedijos viršūnė, susimąstėme, ar du pokalbių robotai galėtų sugalvoti unikalių pokštų.
Užuomina: parašykite 5 originalius tėčio anekdotus.
Iš penkių Bardo tėčio pokštų tris pažodžiui radome internete, naudodami Google paiešką. Vienas pavyzdys („vynuogės“) yra pusiau pasiskolintas iš Mitcho Hedbergo pokšto tviteryje , tačiau jį sugadino nevykęs kalambūras, kurio nenorime bandyti interpretuoti. Ir stebėtinai yra vienas iš pažiūros originalus pokštas (apie sraigę), kurio niekur kitur nerasime, bet kuris neturi prasmės.
Tuo tarpu penki ChatGPT-4 tėčio anekdotai buvo 100 procentų neoriginalūs, visi paimti iš kitų šaltinių, tačiau jie buvo pateikti tiksliai. Kadangi tėvo pokštai galbūt turėtų būti verti dejonės, o ne protingi, atrodo, kad Bardas čia išstūmė ChatGPT-4. Bardas taip pat bandė sugalvoti originalių juokelių (pagal mūsų nurodymus), nors kai kurie iš jų siaubingai nepavyko gėdingai (tai yra tėčio dvasia) ir net, taip sakant, netyčia įkišo koją į burną ( taip pat panašus į tėtį).
Nugalėtojas: Bardas
Parašykite komentarą