Reddit alkaa veloittaa sinua AI-mallien kouluttamisesta äärimmäisen inhimillisistä arkistoistaan

Reddit alkaa veloittaa sinua AI-mallien kouluttamisesta äärimmäisen inhimillisistä arkistoistaan

Jos opetat suuren kielimallin (LLM) tekoälylle ja haluat sen oppivan u/420NarutoConspiracy-aliredditistä, joudut pian maksamaan siitä.

Steve Huffman, sosiaalisten uutisten ja keskustelujen kokoojan Redditin perustaja ja toimitusjohtaja, kertoi äskettäin The New York Timesille, että hän aikoo veloittaa hänen API-liittymäänsä käyttäviltä yrityksiltä 18 vuoden ajalta enimmäkseen ihmisten luomaa sisältöä. Yksityiskohdat uusista ehdoista ovat saatavilla seuraavassa Redditin tiedotteessa .

API on jatkossakin ilmainen kehittäjille, jotka työskentelevät bottien ja muiden Reddit-työkalujen parissa, sekä tutkijoille, jotka työskentelevät akateemisissa tai voittoa tavoittelemattomissa projekteissa. Mutta pelkkä Reddit-keskustelujen käyttäminen tekoälyharjoittelutarkoituksiin tulee maksamaan, jonka tarkka määrä selviää lähiviikkoina.

”Reddit-tietojoukko on todella arvokas”, Huffman sanoi Timesin haastattelussa. ”Mutta meidän ei tarvitse antaa kaikkea tätä arvoa joillekin maailman suurimmista yrityksistä ilmaiseksi.

”Meillä on ongelmia Redditin indeksoinnin, arvon luomisen ja sen arvon palauttamatta jättämisen käyttäjillemme. Nyt on meidän aika saada asiat kuntoon.”

Redditin kommenteista ja keskusteluista on tullut rikas resurssi tekoälyn LLM:ien oppimiseen. ChatGPT ja Google Bard mainitsevat Reddit-tiedot yhtenä lähteistään. Analysoidessaan vain yhtä osajoukkoa (12 miljoonaa) Stable Diffusion (2,3 miljardia) kuvien luontitietojoukosta Andy Baio ja Simon Willison totesivat, että ”käyttäjien luomat sisältöalustat ovat olleet valtava kuvadatan lähde.” Washington Postin tänään julkaisemassa tutkimuksessa useiden tekoälyjen yleisistä tietolähteistä havaittiin, että ”tekstin kokoaminen linkeistä, jotka GPT-käyttäjät ovat arvostaneet”3 sisältyvät Reddit- 3 .

Vaikka Reddit aikoo rajoittaa tekoälyn käyttöä, se aikoo tarjota kehittäjille ja moderaattoreille parempia työkaluja työskennelläkseen yhteisöissään. Reddit-sovellukset iOS:lle ja Androidille tarjoavat tapoja tarkastella nopeasti käyttäjän tarinaa, päivittää yhteisön sääntöjä ja käsitellä paremmin useita mod-jonoja.

The Informationin mukaan Redditin muutos API-käyttöön tulee, kun yrityksen on määrä tulla julkiseksi vuoden 2023 toisella puoliskolla . Yhtiö on luottamuksellisesti jättänyt listautumisannin joulukuussa 2021 . Reutersin mukaan se oli toivonut 15 miljardin dollarin arvostusta, mutta viivästytti hakemuksen jättämistä, kunnes markkinaolosuhteet, erityisesti teknologiayritysten, paranivat.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *