New York Times는 AI 벤더가 허가 없이 콘텐츠를 스크랩하는 것을 금지합니다.

New York Times는 AI 벤더가 허가 없이 콘텐츠를 스크랩하는 것을 금지합니다.

8월 초 The New York Times는 AI 교육을 위해 기사와 이미지를 스크랩하는 것을 금지하기 위해 서비스 약관(TOS)을 업데이트했다고 Adweek가 보도했습니다 . 이러한 움직임은 기술 회사가 ChatGPTGoogle Bard 와 같은 AI 언어 앱에서 계속해서 수익을 창출하고 있는 시점에 이루어졌습니다 .

약관은 기사, 비디오, 이미지 및 메타데이터를 포함하는 타임즈 콘텐츠를 명시적인 서면 허가 없이 AI 모델 교육에 사용하는 것을 금지합니다. TOS의 섹션 2.1에서 NYT는 콘텐츠가 독자의 “개인적이고 비상업적인 사용”을 위한 것이며 비상업적인 사용에는 “교육을 포함하되 이에 국한되지 않는 소프트웨어 프로그램의 개발”이 포함되지 않는다고 말합니다. 기계 학습 또는 인공 지능(AI) 시스템입니다.”

더 아래 섹션 4.1에는 NYT의 사전 서면 동의 없이는 누구도 “기계 학습 또는 인공 지능(AI) 시스템 교육을 포함하되 이에 국한되지 않는 모든 소프트웨어 프로그램 개발을 위해 콘텐츠를 사용할 수 없다고 명시되어 있습니다. .”

NYT는 또한 제한을 무시한 결과에 대해 다음과 같이 설명합니다.

위협적으로 들리겠지만 제한적인 사용 약관은 이전에 인터넷이 머신 러닝 데이터 세트에 대거 몰려드는 것을 막지 못했습니다. OpenAI의 GPT-4 , Anthropic의 Claude 2 , Meta의 Llama 2 및 Google의 PaLM 2 를 포함하여 오늘날 사용 가능한 모든 대규모 언어 모델은 인터넷에서 스크랩한 자료의 대규모 데이터 세트에 대해 학습되었습니다. 비지도 학습 이라는 프로세스를 사용하여 웹 데이터를 신경망에 입력하여 AI 모델이 단어 간의 관계를 분석하여 개념적 언어 감각을 얻을 수 있도록 했습니다.

미국 법원에서 완전히 해결되지 않은 스크랩한 데이터를 사용하여 AI 모델을 훈련시키는 논란의 여지가 있는 성격으로 인해 OpenAI가 이러한 관행으로 인해 표절했다고 비난하는 소송이 최소 한 건 이상 발생했습니다 . 지난주 AP통신과 몇몇 다른 언론사는 “AI 애플리케이션을 지원하는 콘텐츠를 보호하기 위한 법적 프레임워크를 개발해야 한다”는 공개 서한을 발표했습니다 .

OpenAI는 앞으로도 계속되는 법적 문제를 예상하고 이러한 비판을 앞지르기 위해 고안된 조치를 취하기 시작했을 것입니다. 예를 들어 OpenAI는 최근 웹사이트에서 robots.txt를 사용하여 AI 교육 웹 크롤러를 차단하는 데 사용할 수 있는 방법을 자세히 설명했습니다 . 이로 인해 여러 사이트와 작성자가 공개적으로 크롤러를 차단하겠다고 밝혔습니다.

현재로서는 New York Times 콘텐츠를 포함하여 이미 스크랩된 내용이 GPT-4에 구워집니다. OpenAI 또는 다른 AI 공급업체가 콘텐츠 소유자의 제외를 원하는지 여부를 확인하려면 GPT-5까지 기다려야 할 수도 있습니다. 그렇지 않다면 새로운 AI 소송 또는 규정이 곧 등장할 수 있습니다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다