Reddit zacznie pobierać opłaty za trenowanie modeli AI ze swoich niezwykle ludzkich archiwów
Jeśli zajmujesz się nauczaniem sztucznej inteligencji dużego modelu językowego (LLM) i chcesz, aby uczyła się z subreddita u/420NarutoConspiracy, wkrótce będziesz musiał za to zapłacić.
Steve Huffman, założyciel i dyrektor generalny agregatora wiadomości społecznościowych i dyskusji Reddit, powiedział niedawno The New York Times , że planuje pobierać opłaty od firm uzyskujących dostęp do jego interfejsu API w celu wyodrębnienia 18 lat treści tworzonych głównie przez ludzi. Szczegóły nowych warunków są dostępne w poniższym ogłoszeniu na Reddit .
Interfejs API będzie nadal bezpłatny dla programistów pracujących nad botami i innymi narzędziami Reddit oraz dla badaczy pracujących nad projektami akademickimi lub non-profit. Ale samo wykorzystanie dyskusji na Reddicie do celów szkoleniowych w zakresie sztucznej inteligencji będzie wiązało się z kosztami, których dokładna kwota powinna pojawić się w nadchodzących tygodniach.
„Zestaw danych Reddit jest naprawdę cenny” – powiedział Huffman w wywiadzie dla „Timesa”. „Ale nie musimy oddawać całej tej wartości niektórym z największych firm na świecie za darmo.
„Przeszukiwanie Reddit, tworzenie wartości i nie zwracanie tej wartości naszym użytkownikom to coś, z czym mamy problemy. Nadszedł czas, abyśmy wszystko naprawili”.
Komentarze i rozmowy na Reddit stały się bogatym źródłem informacji do nauki AI LLM. ChatGPT i Google Bard cytują dane Reddit jako jedno ze swoich źródeł. W swojej analizie tylko jednego podzbioru (12 milionów) zbioru danych generowania obrazu Stable Diffusion (2,3 miliarda) Andy Baio i Simon Willison zauważyli, że „platformy treści generowanych przez użytkowników są ogromnym źródłem danych o obrazach” . źródła danych dla wielu AI opublikowane dzisiaj przez The Washington Post odkryły, że „kompilowanie tekstu z linków wysoko ocenianych przez użytkowników Reddit” jest zawarte w GPT-3.
Chociaż Reddit zamierza ograniczyć dostęp do sztucznej inteligencji, zamierza zapewnić programistom i moderatorom lepsze narzędzia do pracy w ich społecznościach. Aplikacje Reddit na iOS i Androida będą oferować sposoby szybkiego przeglądania historii użytkownika, aktualizowania reguł społeczności i lepszej obsługi wielu kolejek modów.
Według The Information zmiana Reddita na dostęp do API następuje, gdy firma ma wejść na giełdę w drugiej połowie 2023 roku . Firma poufnie złożyła wniosek o pierwszą ofertę publiczną w grudniu 2021 r . Według Reutersa , miał nadzieję na wycenę w wysokości 15 miliardów dolarów, ale opóźnił złożenie wniosku do czasu poprawy warunków rynkowych, zwłaszcza wokół firm technologicznych.
Dodaj komentarz