Reddit vám začne účtovat poplatky za trénování modelů umělé inteligence ze svých extrémně lidských archivů
Pokud se zabýváte výukou velkého jazykového modelu (LLM) pro AI a chcete, aby se učila ze subredditu u/420NarutoConspiracy, budete za to brzy muset zaplatit.
Steve Huffman, zakladatel a generální ředitel sociálního agregátoru zpráv a diskuzí Reddit, nedávno pro The New York Times řekl, že plánuje účtovat společnostem přístup k jeho API, aby extrahovaly 18 let převážně lidmi vytvořeného obsahu. Podrobnosti o nových podmínkách jsou k dispozici v následujícím oznámení na Redditu .
API bude i nadále zdarma pro vývojáře pracující na botech a dalších nástrojích Reddit a pro výzkumníky pracující na akademických nebo neziskových projektech. Pouhé používání diskusí na Redditu pro účely školení AI však bude něco stát, jehož přesná částka by se měla objevit v následujících týdnech.
„Datový soubor Reddit je opravdu cenný,“ řekl Huffman v rozhovoru pro Times. „Některým z největších společností na světě však tuto hodnotu nemusíme dávat zadarmo.
„Procházení Redditu, vytváření hodnoty a nevracení této hodnoty našim uživatelům je něco, s čím máme problémy. Nyní je čas, abychom věci napravili.“
Komentáře a konverzace na Redditu se staly bohatým zdrojem pro výuku AI LLM. ChatGPT a Google Bard uvádějí data Reddit jako jeden ze svých zdrojů. Andy Baio a Simon Willison ve své analýze pouze jedné podmnožiny (12 milionů) datové sady pro generování obrázků Stable Diffusion (2,3 miliardy) poznamenali, že „uživatelsky generované obsahové platformy byly obrovským zdrojem obrazových dat.“ Studie společných zdrojů dat pro mnoho AI, kterou dnes zveřejnil The Washington Post, zjistila, že v GPT-3 je zahrnuto „kompilování textu z odkazů vysoce hodnocených uživateli Reddit-3 “ .
Zatímco Reddit hodlá omezit přístup k AI, má v úmyslu poskytnout vývojářům a moderátorům lepší nástroje pro práci v rámci jejich komunit. Aplikace Reddit pro iOS a Android nabídnou způsoby, jak rychle zobrazit příběh uživatele, aktualizovat pravidla komunity a lépe zvládat fronty na různé mody.
Změna Redditu na přístup k API přichází, protože společnost má vstoupit na veřejnost v druhé polovině roku 2023, podle The Information. Společnost důvěrně požádala o primární veřejnou nabídku v prosinci 2021 . Podle agentury Reuters doufal v ocenění 15 miliard dolarů, ale odložil podání, dokud se podmínky na trhu, zejména kolem technologických společností, nezlepší.
Napsat komentář