Reddit vil begynde at debitere dig for at træne AI-modeller fra dets ekstremt menneskelige arkiver

Reddit vil begynde at debitere dig for at træne AI-modeller fra dets ekstremt menneskelige arkiver

Hvis du er i gang med at lære en stor sprogmodel (LLM) til en AI og vil have den til at lære af u/420NarutoConspiracy subreddit, skal du snart betale for det.

Steve Huffman, grundlægger og administrerende direktør for sociale nyheds- og diskussionsaggregator Reddit, fortalte for nylig til The New York Times , at han planlægger at opkræve virksomheder, der får adgang til hans API, for at udtrække 18 års hovedsagelig menneskeskabt indhold. Detaljer om de nye vilkår og betingelser er tilgængelige i den følgende meddelelse på Reddit .

API’et vil fortsat være gratis for udviklere, der arbejder med bots og andre Reddit-værktøjer, og for forskere, der arbejder på akademiske eller non-profit projekter. Men blot at bruge Reddit-diskussioner til AI-træningsformål vil have en pris, hvis nøjagtige mængde bør dukke op i de kommende uger.

“Reddit-datasættet er virkelig værdifuldt,” sagde Huffman i et interview med Times. “Men vi behøver ikke give al den værdi væk til nogle af de største virksomheder i verden gratis.

“At crawle Reddit, skabe værdi og ikke returnere den værdi til vores brugere er noget, vi har problemer med. Nu er tiden inde til, at vi gør tingene rigtigt.”

Kommentarerne og samtalerne på Reddit er blevet en rig ressource til at lære AI LLM’er. ChatGPT og Google Bard citerer Reddit-dataene som en af ​​deres kilder. I deres analyse af kun én delmængde (12 millioner) af stabil diffusionsdatasættet (2,3 milliarder) bemærkede Andy Baio og Simon Willison, at “brugergenererede indholdsplatforme har været en enorm kilde til billeddata.” En undersøgelse af fælles datakilder for mange AI’er offentliggjort i dag af The Washington Post fandt, at “kompilering af tekst fra links højt vurderet af Reddit-brugere” er inkluderet i GPT-3.

Mens Reddit har til hensigt at begrænse adgangen til AI, har det til hensigt at give udviklere og moderatorer bedre værktøjer til at arbejde i deres fællesskaber. Reddit-apps til iOS og Android vil tilbyde måder til hurtigt at se en brugers historie, opdatere fællesskabsregler og bedre håndtere flere mod-køer.

Reddits ændring til API-adgang kommer, da virksomheden er indstillet til at blive offentlig i anden halvdel af 2023, ifølge The Information. Selskabet har fortroligt ansøgt om et børsnoteret udbud i december 2021 . Ifølge Reuters havde man håbet på en værdiansættelse på 15 milliarder dollars, men forsinkede indgivelsen, indtil markedsforholdene, især omkring teknologivirksomheder, blev forbedret.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *