Reddit почне стягувати з вас плату за навчання моделей штучного інтелекту зі своїх надзвичайно людських архівів
Якщо ви займаєтеся навчанням великої мовної моделі (LLM) для штучного інтелекту і хочете, щоб він навчався з субредіту u/420NarutoConspiracy, вам скоро доведеться за це заплатити.
Стів Хаффман, засновник і генеральний директор агрегатора соціальних новин і дискусій Reddit, нещодавно сказав The New York Times, що він планує стягувати з компаній, які отримують доступ до його API, вилучення контенту, переважно створеного людьми, протягом 18 років. Детальна інформація про нові положення та умови доступна в наступному оголошенні на Reddit .
API залишатиметься безкоштовним для розробників, які працюють над ботами та іншими інструментами Reddit, а також для дослідників, які працюють над академічними чи некомерційними проектами. Але просте використання обговорень Reddit для цілей навчання штучному інтелекту буде коштувати кошти, точна сума яких має бути відома найближчими тижнями.
«Набір даних Reddit справді цінний», — сказав Хаффман в інтерв’ю Times. «Але ми не повинні віддавати всю цю цінність деяким із найбільших компаній у світі безкоштовно.
«Сканувати Reddit, створювати цінність і не повертати цю цінність нашим користувачам – це те, з чим у нас є проблеми. Настав час для нас виправити ситуацію».
Коментарі та розмови на Reddit стали багатим ресурсом для вивчення AI LLM. ChatGPT і Google Bard посилаються на дані Reddit як одне зі своїх джерел. У своєму аналізі лише однієї підмножини (12 мільйонів) набору даних створення зображень Stable Diffusion (2,3 мільярда) Енді Байо та Саймон Віллісон відзначили, що «платформи контенту, створювані користувачами, були величезним джерелом даних зображень» . Джерела даних для багатьох штучних інтелектів , опубліковані сьогодні The Washington Post, виявили, що «компіляція тексту з посилань, високо оцінених користувачами Reddit», включена в GPT-3.
Хоча Reddit має намір обмежити доступ до ШІ, він має намір надати розробникам і модераторам кращі інструменти для роботи в їхніх спільнотах. Програми Reddit для iOS та Android запропонують способи швидкого перегляду історії користувача, оновлення правил спільноти та кращої обробки кількох черг модів.
Згідно з The Information, Reddit змінив доступ до API, оскільки компанія збирається вийти на біржу в другій половині 2023 року . Компанія конфіденційно подала заявку на первинне розміщення акцій у грудні 2021 року . За даними Reuters , компанія сподівалася на оцінку в 15 мільярдів доларів, але відклала подачу заявки, поки ринкові умови, особливо навколо технологічних компаній, не покращаться.
Залишити відповідь