Clash of the Titans AI: ChatGPT vs Bard i en kamp om forstand og visdom
I dagens verden af AI-drevne generative chatbots var vi vidne til den pludselige fremkomst af OpenAIs ChatGPT, introduceret i november, efterfulgt af Bing Chat i februar og Googles Bard i marts. Vi besluttede at sætte disse chatbots på prøve ved at fuldføre en række opgaver for at afgøre, hvilken der dominerer AI-chatbot-arenaen. Da Bing Chat bruger den samme GPT-4-teknologi som den seneste ChatGPT-model, besluttede vi at fokusere på AI-chatbotteknologiens to titaner: OpenAI og Google.
Vi testede ChatGPT og Bard i syv kritiske kategorier: far-vittigheder, argumentdialoger, ordmatematiske problemer, generalisering, faktafinding, kreativ skrivning og kodning. For hver test indtastede vi den samme instruktion (kaldet “hint”) i ChatGPT (med GPT-4) og Google Bard. Vi brugte det første resultat uden nit-plukning.
Det er værd at bemærke, at en version af ChatGPT baseret på den tidligere GPT-3.5-model også er tilgængelig, men vi brugte den ikke i testen. Da vi kun brugte GPT-4, vil vi henvise til ChatGPT som “ChatGPT-4” i denne artikel for at undgå forvirring.
Det er klart, at dette ikke er en videnskabelig undersøgelse, men er beregnet til at være en sjov sammenligning af chatbots muligheder. Outputtet kan variere mellem sessioner på grund af tilfældige elementer, og yderligere evalueringer med forskellige signaler vil give forskellige resultater. Derudover vil disse modellers muligheder ændre sig hurtigt over tid, efterhånden som Google og OpenAI fortsætter med at opgradere dem. Men indtil videre er det sådan, tingene er i begyndelsen af april 2023.
far joker
For at opvarme vores humoristiske konkurrence bad vi ChatGPT og Bard om at skrive nogle vittigheder. Og da far-vittigheder er toppen af komedien, spekulerede vi på, om to chatbots kunne finde på nogle unikke jokes.
Tip: Skriv 5 originale far-vittigheder.
Af Bards fem far-vittigheder fandt vi tre ordret på internettet ved hjælp af en Google-søgning. Et eksempel (“druer”) er halvt lånt fra et Mitch Hedberg joke tweet , men det er ødelagt af et uheldigt ordspil, vi ikke ønsker at forsøge at fortolke. Og overraskende nok er der én tilsyneladende original joke (om en snegl), som vi ikke kan finde andre steder, men som ikke giver mening.
I mellemtiden var de fem ChatGPT-4 far-vittigheder 100 procent uoriginale, alle taget helt fra andre kilder, men de blev leveret præcist. Da far-jokes måske skal være stønneværdige snarere end kloge, ser det ud til, at Bard har fortrængt ChatGPT-4 her. Bard forsøgte også at komme med originale vittigheder (ifølge vores instruktioner), selvom nogle af dem fejlede frygteligt på en pinlig måde (hvilket er i fars ånd) og endda så at sige utilsigtet satte en fod i munden på ham ( også far-agtig).
Vinder: Bard
Skriv et svar