O Reddit começará a cobrar para treinar modelos de IA a partir de seus arquivos extremamente humanos
Se você está no negócio de ensinar um modelo de linguagem grande (LLM) para um AI e quer aprender com o subreddit u/420NarutoConspiracy, você logo terá que pagar por isso.
Steve Huffman, fundador e CEO do Reddit, agregador de notícias e discussões sociais, disse recentemente ao The New York Times que planeja cobrar das empresas que acessam sua API a extração de 18 anos de conteúdo criado principalmente por humanos. Detalhes dos novos termos e condições estão disponíveis no seguinte anúncio no Reddit .
A API continuará gratuita para desenvolvedores que trabalham com bots e outras ferramentas do Reddit e para pesquisadores que trabalham em projetos acadêmicos ou sem fins lucrativos. Mas simplesmente usar as discussões do Reddit para fins de treinamento em IA terá um custo, cujo valor exato deve surgir nas próximas semanas.
“O conjunto de dados do Reddit é realmente valioso”, disse Huffman em entrevista ao Times. “Mas não precisamos dar todo esse valor gratuitamente para algumas das maiores empresas do mundo.
“Rastrear o Reddit, criar valor e não retornar esse valor para nossos usuários é algo com o qual temos problemas. Agora é a hora de consertarmos as coisas.”
Os comentários e conversas no Reddit se tornaram um rico recurso para aprender LLMs de IA. ChatGPT e Google Bard citam os dados do Reddit como uma de suas fontes. Em sua análise de apenas um subconjunto (12 milhões) do conjunto de dados de geração de imagem Stable Diffusion (2,3 bilhões), Andy Baio e Simon Willison observaram que “plataformas de conteúdo gerado pelo usuário têm sido uma enorme fonte de dados de imagem” . fontes de dados para muitos AIs publicadas hoje pelo The Washington Post descobriram que “compilar texto de links altamente avaliados por usuários do Reddit” está incluído no GPT-3.
Embora o Reddit pretenda restringir o acesso à IA, ele pretende fornecer aos desenvolvedores e moderadores melhores ferramentas para trabalhar em suas comunidades. Os aplicativos Reddit para iOS e Android oferecerão maneiras de visualizar rapidamente a história de um usuário, atualizar as regras da comunidade e lidar melhor com várias filas de mods.
A mudança do Reddit para o acesso à API ocorre quando a empresa deve abrir o capital no segundo semestre de 2023, de acordo com o The Information. A empresa entrou com pedido confidencial de uma oferta pública inicial em dezembro de 2021 . De acordo com a Reuters , esperava uma avaliação de US$ 15 bilhões, mas adiou o pedido até que as condições do mercado, especialmente em torno de empresas de tecnologia, melhorassem.
Deixe um comentário