„The New York Times“ draudžia dirbtinio intelekto pardavėjams iškrapštyti jo turinį be leidimo

„The New York Times“ draudžia dirbtinio intelekto pardavėjams iškrapštyti jo turinį be leidimo

Rugpjūčio pradžioje „The New York Times“ atnaujino paslaugų teikimo sąlygas (TOS), kad uždraustų straipsnių ir vaizdų rinkimą dirbtinio intelekto mokymui, praneša „Adweek“. Šis žingsnis žengtas tuo metu, kai technologijų įmonės ir toliau užsiėmė AI kalbos programomis, tokiomis kaip „ ChatGPT “ ir „Google Bard“ , kurios savo galimybes įgijo dėl didžiulio neteisėto interneto duomenų išgryninimo.

Naujosios sąlygos draudžia naudoti „Times“ turinį (įskaitant straipsnius, vaizdo įrašus, vaizdus ir metaduomenis) lavinant bet kokį AI modelį be aiškaus raštiško leidimo. TOS 2.1 skirsnyje NYT sako, kad jo turinys skirtas skaitytojo „asmeniniam, nekomerciniam naudojimui“ ir kad nekomercinis naudojimas neapima „bet kokios programinės įrangos kūrimo, įskaitant mokymą, bet tuo neapsiribojant. mašininio mokymosi arba dirbtinio intelekto (AI) sistema“.

Toliau, 4.1 skirsnyje, sąlygose sakoma, kad be išankstinio raštiško NYT sutikimo niekas negali „naudoti Turinio kuriant bet kokią programinę įrangą, įskaitant, bet tuo neapsiribojant, mašininio mokymosi ar dirbtinio intelekto (AI) sistemos mokymą. .

NYT taip pat nurodo apribojimų nepaisymo pasekmes: „Už draudžiamą naudojimąsi Paslaugomis vartotojui ir vartotojui padedantiems asmenims gali būti taikomos civilinės, baudžiamosios ir (arba) administracinės nuobaudos, baudos ar sankcijos.

Kad ir kaip grėsmingai tai skambėtų, ribojančios naudojimo sąlygos anksčiau nesustabdė interneto didmeninės plitimo į mašininio mokymosi duomenų rinkinius. Kiekvienas šiandien prieinamas didelis kalbų modelis, įskaitant OpenAI GPT-4 , Anthropic’s Claude 2 , Meta’s Llama 2 ir Google PaLM 2 , buvo apmokytas naudojant didelius duomenų rinkinius, išgautus iš interneto. Naudojant procesą, vadinamą neprižiūrimu mokymusi , žiniatinklio duomenys buvo tiekiami į neuroninius tinklus, todėl AI modeliai galėjo įgyti konceptualų kalbos pojūtį, analizuojant žodžių ryšius.

Dėl prieštaringo nuskaitytų duomenų naudojimo AI modeliams mokyti, kuris nebuvo iki galo išspręstas JAV teismuose, buvo iškelta bent viena byla , kurioje OpenAI apkaltinta plagijavimu dėl šios praktikos. Praėjusią savaitę „Associated Press“ ir kelios kitos naujienų organizacijos paskelbė atvirą laišką , kuriame teigiama, kad, be kitų rūpesčių, „turi būti sukurta teisinė sistema, kuri apsaugotų turinį, kuris veikia dirbtinio intelekto programomis“.

Tikėtina, kad „OpenAI“ numato tolesnius teisinius iššūkius ir pradėjo imtis veiksmų, kurie gali būti skirti tam, kad išvengtų šios kritikos. Pavyzdžiui, „OpenAI“ neseniai išsamiai išdėstė metodą , kurį svetainės galėtų naudoti, kad blokuotų AI mokymo žiniatinklio tikrintuvą naudodami robots.txt. Dėl to kelios svetainės ir autoriai viešai pareiškė, kad blokuos tikrintuvą.

Kol kas tai, kas jau buvo iškrapštyta, įdedama į GPT-4, įskaitant „New York Times“ turinį. Gali tekti palaukti iki GPT-5, kad pamatytume, ar „OpenAI“ ar kiti dirbtinio intelekto pardavėjai gerbia turinio savininkų pageidavimus, kad jie liktų nuošalyje. Jei ne, gali atsirasti naujų AI ieškinių arba taisyklių.

Parašykite komentarą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *