Reddit wird Ihnen für das Training von KI-Modellen aus seinen äußerst menschlichen Archiven Gebühren in Rechnung stellen

Reddit wird Ihnen für das Training von KI-Modellen aus seinen äußerst menschlichen Archiven Gebühren in Rechnung stellen

Wenn Sie einer KI ein großes Sprachmodell (LLM) beibringen und möchten, dass diese vom Subreddit u/420NarutoConspiracy lernt, müssen Sie bald dafür bezahlen.

Steve Huffman, Gründer und CEO des Social-News- und Diskussionsaggregators Reddit, sagte kürzlich gegenüber der New York Times , dass er plant, Unternehmen, die auf seine API zugreifen, eine Gebühr für die Extraktion von 18 Jahren überwiegend von Menschen erstellter Inhalte zu berechnen. Einzelheiten zu den neuen Geschäftsbedingungen finden Sie in der folgenden Ankündigung auf Reddit .

Die API wird für Entwickler, die an Bots und anderen Reddit-Tools arbeiten, sowie für Forscher, die an akademischen oder gemeinnützigen Projekten arbeiten, weiterhin kostenlos sein. Aber allein die Nutzung von Reddit-Diskussionen für KI-Trainingszwecke wird mit Kosten verbunden sein, deren genaue Höhe in den kommenden Wochen bekannt gegeben werden dürfte.

„Der Reddit-Datensatz ist wirklich wertvoll“, sagte Huffman in einem Interview mit der Times. „Aber wir müssen diesen ganzen Wert nicht umsonst an einige der größten Unternehmen der Welt verschenken.

„Wir haben Probleme damit, Reddit zu crawlen, Werte zu schaffen und diesen Wert nicht an unsere Benutzer zurückzugeben. Jetzt ist es für uns an der Zeit, die Dinge richtig zu machen.“

Die Kommentare und Gespräche auf Reddit sind zu einer reichhaltigen Ressource für das Erlernen von KI-LLMs geworden. ChatGPT und Google Bard nennen die Reddit-Daten als eine ihrer Quellen. In ihrer Analyse von nur einer Teilmenge (12 Millionen) des Bildgenerierungsdatensatzes Stable Diffusion (2,3 Milliarden) stellten Andy Baio und Simon Willison fest, dass „Plattformen für benutzergenerierte Inhalte eine riesige Quelle für Bilddaten waren“. Eine heute von der Washington Post veröffentlichte Studie über gemeinsame Datenquellen für viele KIs ergab, dass „das Zusammenstellen von Text aus von Reddit-Benutzern hoch bewerteten Links“ in GPT-3 enthalten ist .

Während Reddit beabsichtigt, den Zugriff auf KI einzuschränken, möchte es Entwicklern und Moderatoren bessere Tools für die Arbeit in ihren Communities zur Verfügung stellen. Die Reddit-Apps für iOS und Android bieten Möglichkeiten, die Story eines Benutzers schnell anzuzeigen, Community-Regeln zu aktualisieren und mehrere Mod-Warteschlangen besser zu verwalten.

Reddits Änderung des API-Zugriffs erfolgt, da das Unternehmen laut The Information in der zweiten Hälfte des Jahres 2023 an die Börse gehen soll. Das Unternehmen hat im Dezember 2021 vertraulich einen Börsengang beantragt . Laut Reuters hatte das Unternehmen auf eine Bewertung von 15 Milliarden US-Dollar gehofft, die Einreichung jedoch verschoben, bis sich die Marktbedingungen, insbesondere bei Technologieunternehmen, verbessert hatten.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert