Reddit inizierà a farti pagare per addestrare modelli di intelligenza artificiale dai suoi archivi estremamente umani

Reddit inizierà a farti pagare per addestrare modelli di intelligenza artificiale dai suoi archivi estremamente umani

Se ti occupi di insegnare un modello di linguaggio di grandi dimensioni (LLM) a un’intelligenza artificiale e vuoi che impari dal subreddit u/420NarutoConspiracy, presto dovrai pagare per questo.

Steve Huffman, fondatore e CEO dell’aggregatore di social news e discussioni Reddit, ha recentemente dichiarato al New York Times che intende addebitare alle aziende che accedono alla sua API l’estrazione di 18 anni di contenuti per lo più creati dall’uomo. I dettagli dei nuovi termini e condizioni sono disponibili nel seguente annuncio su Reddit .

L’API continuerà a essere gratuita per gli sviluppatori che lavorano su bot e altri strumenti Reddit e per i ricercatori che lavorano su progetti accademici o senza scopo di lucro. Ma il semplice utilizzo delle discussioni di Reddit per scopi di formazione sull’IA avrà un costo, il cui importo esatto dovrebbe emergere nelle prossime settimane.

“Il set di dati di Reddit è davvero prezioso”, ha detto Huffman in un’intervista al Times. “Ma non dobbiamo dare tutto quel valore gratuitamente ad alcune delle più grandi aziende del mondo.

“Scansionare Reddit, creare valore e non restituirlo ai nostri utenti è qualcosa con cui abbiamo problemi. Ora è il momento per noi di sistemare le cose”.

I commenti e le conversazioni su Reddit sono diventati una ricca risorsa per l’apprendimento di AI LLM. ChatGPT e Google Bard citano i dati di Reddit come una delle loro fonti. Nella loro analisi di un solo sottoinsieme (12 milioni) del set di dati di generazione di immagini di Stable Diffusion (2,3 miliardi), Andy Baio e Simon Willison hanno osservato che “le piattaforme di contenuti generati dagli utenti sono state un’enorme fonte di dati di immagini” . fonti di dati per molte IA pubblicate oggi dal Washington Post hanno rilevato che “la compilazione di testo da collegamenti molto apprezzati dagli utenti di Reddit” è inclusa in GPT-3.

Sebbene Reddit intenda limitare l’accesso all’intelligenza artificiale, intende fornire a sviluppatori e moderatori strumenti migliori per lavorare all’interno delle loro comunità. Le app Reddit per iOS e Android offriranno modi per visualizzare rapidamente la storia di un utente, aggiornare le regole della community e gestire meglio più code di mod.

La modifica di Reddit all’accesso alle API arriva quando la società dovrebbe diventare pubblica nella seconda metà del 2023, secondo The Information. La società ha depositato in via confidenziale un’offerta pubblica iniziale nel dicembre 2021 . Secondo Reuters , aveva sperato in una valutazione di 15 miliardi di dollari, ma ha ritardato il deposito fino a quando le condizioni del mercato, specialmente intorno alle società tecnologiche, non sono migliorate.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *