Reddit zacznie pobierać opłaty za trenowanie modeli AI ze swoich niezwykle ludzkich archiwów

Reddit zacznie pobierać opłaty za trenowanie modeli AI ze swoich niezwykle ludzkich archiwów

Jeśli zajmujesz się nauczaniem sztucznej inteligencji dużego modelu językowego (LLM) i chcesz, aby uczyła się z subreddita u/420NarutoConspiracy, wkrótce będziesz musiał za to zapłacić.

Steve Huffman, założyciel i dyrektor generalny agregatora wiadomości społecznościowych i dyskusji Reddit, powiedział niedawno The New York Times , że planuje pobierać opłaty od firm uzyskujących dostęp do jego interfejsu API w celu wyodrębnienia 18 lat treści tworzonych głównie przez ludzi. Szczegóły nowych warunków są dostępne w poniższym ogłoszeniu na Reddit .

Interfejs API będzie nadal bezpłatny dla programistów pracujących nad botami i innymi narzędziami Reddit oraz dla badaczy pracujących nad projektami akademickimi lub non-profit. Ale samo wykorzystanie dyskusji na Reddicie do celów szkoleniowych w zakresie sztucznej inteligencji będzie wiązało się z kosztami, których dokładna kwota powinna pojawić się w nadchodzących tygodniach.

„Zestaw danych Reddit jest naprawdę cenny” – powiedział Huffman w wywiadzie dla „Timesa”. „Ale nie musimy oddawać całej tej wartości niektórym z największych firm na świecie za darmo.

„Przeszukiwanie Reddit, tworzenie wartości i nie zwracanie tej wartości naszym użytkownikom to coś, z czym mamy problemy. Nadszedł czas, abyśmy wszystko naprawili”.

Komentarze i rozmowy na Reddit stały się bogatym źródłem informacji do nauki AI LLM. ChatGPT i Google Bard cytują dane Reddit jako jedno ze swoich źródeł. W swojej analizie tylko jednego podzbioru (12 milionów) zbioru danych generowania obrazu Stable Diffusion (2,3 miliarda) Andy Baio i Simon Willison zauważyli, że „platformy treści generowanych przez użytkowników są ogromnym źródłem danych o obrazach” . źródła danych dla wielu AI opublikowane dzisiaj przez The Washington Post odkryły, że „kompilowanie tekstu z linków wysoko ocenianych przez użytkowników Reddit” jest zawarte w GPT-3.

Chociaż Reddit zamierza ograniczyć dostęp do sztucznej inteligencji, zamierza zapewnić programistom i moderatorom lepsze narzędzia do pracy w ich społecznościach. Aplikacje Reddit na iOS i Androida będą oferować sposoby szybkiego przeglądania historii użytkownika, aktualizowania reguł społeczności i lepszej obsługi wielu kolejek modów.

Według The Information zmiana Reddita na dostęp do API następuje, gdy firma ma wejść na giełdę w drugiej połowie 2023 roku . Firma poufnie złożyła wniosek o pierwszą ofertę publiczną w grudniu 2021 r . Według Reutersa , miał nadzieję na wycenę w wysokości 15 miliardów dolarów, ale opóźnił złożenie wniosku do czasu poprawy warunków rynkowych, zwłaszcza wokół firm technologicznych.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *