Reddit 將開始向你收取從其極其人性化的檔案中訓練人工智能模型的費用
![Reddit 將開始向你收取從其極其人性化的檔案中訓練人工智能模型的費用](https://cdn.4pmtech.com/wp-content/uploads/2023/07/reddit_alient-760x380-1-640x375.webp)
如果你從事向 AI 教授大型語言模型 (LLM) 的業務,並希望它從 Reddit 的 u/420NarutoConspiracy subreddit 中學習,那麼你很快就必須為此付費。
社交新聞和討論聚合器 Reddit 的創始人兼首席執行官 Steve Huffman最近告訴《紐約時報》,他計劃向訪問他的 API 的公司收費,以提取 18 年來大部分由人類創建的內容。有關新條款和條件的詳細信息,請參閱以下 Reddit 公告。
該 API 將繼續免費向開發機器人和其他 Reddit 工具的開發人員以及從事學術或非營利項目的研究人員開放。但僅僅將 Reddit 討論用於人工智能培訓目的是要付出代價的,具體數額應該在未來幾週內公佈。
“Reddit 數據集確實很有價值,”霍夫曼在接受《泰晤士報》採訪時表示。“但我們不必將所有這些價值免費提供給世界上一些最大的公司。
“爬行 Reddit,創造價值,卻沒有將價值返回給我們的用戶,這是我們遇到的問題。現在是我們糾正錯誤的時候了。”
Reddit 上的評論和對話已成為學習 AI LLM 的豐富資源。ChatGPT和Google Bard引用 Reddit 數據作為其來源之一。Andy Baio 和 Simon Willison 在對 Stable Diffusion(23 億)圖像生成數據集的一個子集(1200 萬)進行分析時指出,“用戶生成的內容平台一直是圖像數據的巨大來源。 ” 《華盛頓郵報》今天發布的許多人工智能的數據源發現,GPT-3 中包含“從 Reddit 用戶高度評價的鏈接編譯文本”。
雖然 Reddit 打算限制對人工智能的訪問,但它打算為開發人員和版主提供更好的工具來在其社區內工作。適用於 iOS 和 Android 的 Reddit 應用程序將提供快速查看用戶故事、更新社區規則以及更好地處理多個 Mod 隊列的方法。
據 The Information 報導, Reddit 對 API 訪問權限的改變正值該公司計劃於 2023 年下半年上市之際。該公司已於 2021 年 12 月秘密申請首次公開募股。據路透社報導,該公司原本希望估值達到 150 億美元,但推遲了提交申請,直到市場狀況(尤其是科技公司周圍的狀況)改善。
發佈留言