Reddit почне стягувати з вас плату за навчання моделей штучного інтелекту зі своїх надзвичайно людських архівів
Якщо ви займаєтеся навчанням великої мовної моделі (LLM) для штучного інтелекту і хочете, щоб він навчався з субредіту u/420NarutoConspiracy, вам скоро доведеться за це заплатити.
Стів Хаффман, засновник і генеральний директор агрегатора соціальних новин і дискусій Reddit, нещодавно сказав The New York Times, що він планує стягувати з компаній, які отримують доступ до його API, одержання 18 років контенту, переважно створеного людьми. Детальна інформація про нові положення та умови доступна в наступному оголошенні на Reddit .
API залишатиметься безкоштовним для розробників, які працюють над ботами та іншими інструментами Reddit, а також для дослідників, які працюють над академічними чи некомерційними проектами. Але просте використання дискусій Reddit для навчання штучному інтелекту коштуватиме певних витрат, точна сума яких має бути відома найближчими тижнями.
«Набір даних Reddit справді цінний», — сказав Хаффман в інтерв’ю Times. «Але ми не повинні віддавати всю цю цінність деяким із найбільших компаній у світі безкоштовно.
«Сканувати Reddit, створювати цінність і не повертати цю цінність нашим користувачам – це те, з чим у нас є проблеми. Настав час для нас виправити ситуацію».
Коментарі та розмови на Reddit стали багатим ресурсом для вивчення AI LLM. ChatGPT і Google Bard посилаються на дані Reddit як одне зі своїх джерел. У своєму аналізі лише однієї підмножини (12 мільйонів) набору даних для створення зображень Stable Diffusion (2,3 мільярда) Енді Байо та Саймон Віллісон відзначили, що «платформи контенту, створеного користувачами, були величезним джерелом даних зображень». Дослідження загальних джерел даних для багатьох ШІ, опубліковане сьогодні The Washington Post, виявило, що «компіляція тексту з посилань, високо оцінених користувачами Reddit» включена в GPT- 3 .
Хоча Reddit має намір обмежити доступ до ШІ, він має намір надати розробникам і модераторам кращі інструменти для роботи в їхніх спільнотах. Програми Reddit для iOS та Android запропонують способи швидкого перегляду історії користувача, оновлення правил спільноти та кращої обробки кількох черг модів.
Згідно з The Information, Reddit змінив доступ до API, оскільки компанія збирається вийти на біржу в другій половині 2023 року . Компанія конфіденційно подала заявку на первинне розміщення акцій у грудні 2021 року . За даними Reuters , компанія сподівалася на оцінку в 15 мільярдів доларів, але відклала подання, поки ринкові умови, особливо навколо технологічних компаній, не покращаться.
Залишити відповідь