OpenAI medger att AI-skrivdetektorer inte fungerar
I ett avsnitt av FAQ med titeln ”Fungerar AI-detektorer?”, skriver OpenAI , ”Kort sagt, nej. Även om vissa (inklusive OpenAI) har släppt verktyg som utger sig för att upptäcka AI-genererat innehåll, har ingen av dessa visat sig på ett tillförlitligt sätt skilja mellan AI-genererat och mänskligt genererat innehåll.”
I juli diskuterade vi på djupet varför AI-skrivdetektorer som GPTZero inte fungerar, med experter som kallar dem ”för det mesta ormolja.” Dessa detektorer ger ofta falska positiva resultat på grund av att de förlitar sig på obevisade detektionsmått. I slutändan finns det inget speciellt med AI-skriven text som alltid skiljer den från mänsklig skriven, och detektorer kan besegras genom omformulering. Samma månad avbröt OpenAI sin AI Classifier, som var ett experimentellt verktyg designat för att upptäcka AI-skriven text. Den hade en urusla 26 procents noggrannhetsgrad.
OpenAI:s nya FAQ tar också upp en annan stor missuppfattning, som är att ChatGPT själv kan veta om text är AI-skriven eller inte. OpenAI skriver, ”Dessutom har ChatGPT ingen ”kunskap” om vilket innehåll som kan genereras av AI. Det kommer ibland att utgöra svar på frågor som ”skrev du den här [uppsatsen]?” eller ”kan det här ha skrivits av AI?” Dessa svar är slumpmässiga och har ingen grund i fakta.”
På det sättet tar OpenAI också upp sina AI-modellers benägenhet att konfabulera falsk information, vilket vi också har täckt i detalj på Ars. ”Ibland låter ChatGPT övertygande, men det kan ge dig felaktig eller vilseledande information (ofta kallad en ’hallucination’ i litteraturen),” skriver företaget. ”Det kan till och med utgöra saker som citat eller citat, så använd det inte som din enda källa för forskning.”
(I maj fick en advokat problem för att göra just det — med hänvisning till sex icke-existerande fall som han drog från ChatGPT.)
Även om automatiserade AI-detektorer inte fungerar, betyder det inte att en människa aldrig kan upptäcka AI-skrivning. Till exempel kan en lärare som är bekant med en elevs typiska skrivstil berätta när deras stil eller förmåga plötsligt förändras. Dessutom kan vissa slarviga försök att låta AI-genererat arbete lämnas som mänskligt skrivet, som kan lämna kontrollamper, som frasen ” som en AI-språkmodell ”, vilket betyder att någon kopierade och klistrade in ChatGPT-utdata utan att vara försiktig. Och nyligen visade en artikel i den vetenskapliga tidskriften Nature hur människor märkte frasen ”Regenerate response” i en vetenskaplig artikel, som är etiketten på en knapp i ChatGPT.
Som tekniken ser ut idag är det säkrast att helt undvika automatiserade verktyg för AI-detektion. ”Från och med nu är AI-skrivning omöjlig att upptäcka och kommer sannolikt att förbli så,” sa den frekvente AI-analytikern och Wharton-professorn Ethan Mollick till Ars i juli. ”AI-detektorer har höga falska positiva frekvenser, och de bör inte användas som ett resultat.”
Lämna ett svar