Redditは、非常に人間的なアーカイブからAIモデルをトレーニングするために課金を開始します
AI に大規模言語モデル (LLM) を教える仕事をしていて、u/420NarutoConspiracy サブレディットから AI に学習させたい場合は、すぐに料金を支払わなければなりません。
ソーシャルニュースとディスカッションのアグリゲーターRedditの創設者兼最高経営責任者(CEO)であるスティーブ・ハフマン氏は最近ニューヨーク・タイムズに対し、18年分の主に人間が作成したコンテンツを抽出するために彼のAPIにアクセスする企業に料金を請求する予定であると語った。新しい利用規約の詳細は、Reddit 上の次の発表でご覧いただけます。
この API は、ボットやその他の Reddit ツールに取り組む開発者、および学術プロジェクトや非営利プロジェクトに取り組む研究者にとっては引き続き無料です。しかし、AI トレーニングの目的で Reddit のディスカッションを使用するだけでもコストがかかり、その正確な金額は今後数週間以内に判明するはずです。
「レディットのデータセットは本当に貴重です」とハフマン氏はタイムズ紙のインタビューで語った。「しかし、そのすべての価値を世界最大手の企業に無料で提供する必要はありません。
「Redditをクロールして価値を生み出し、その価値をユーザーに返さないことは、私たちが問題を抱えていることです。今こそ私たちが物事を正しくするときです。」
Reddit 上のコメントや会話は、AI LLM を学習するための豊富なリソースとなっています。ChatGPTとGoogle Bard は、情報源の 1 つとして Reddit データを挙げています。Andy Baio 氏と Simon Willison 氏は、Stable Diffusion (23 億) 画像生成データセットの 1 つのサブセット (1,200 万) の分析で、「ユーザー生成のコンテンツ プラットフォームが画像データの巨大なソースとなっている」と指摘しました。ワシントン・ポストが本日公開した多くの AI のデータ ソースでは、「Reddit ユーザーによって高く評価されたリンクからのテキストのコンパイル」が GPT-3 に含まれていることがわかりました。
Reddit は AI へのアクセスを制限するつもりですが、開発者とモデレーターがコミュニティ内で作業するためのより良いツールを提供するつもりです。iOS および Android 用の Reddit アプリは、ユーザーのストーリーをすばやく表示し、コミュニティ ルールを更新し、複数の MOD キューをより適切に処理する方法を提供します。
The Information によると、 Reddit の API アクセスへの変更は、同社が 2023 年後半に株式公開を予定していることを受けて行われたという。同社は極秘に2021年12月の新規株式公開を申請した。ロイター通信によると、同社は150億ドルの評価額を期待していたが、特にハイテク企業を中心とした市場状況が改善するまで申請を延期したという。
コメントを残す