The New York Times aizliedz AI pārdevējiem bez atļaujas nokasīt tā saturu

Augusta sākumā The New York Times atjaunināja savus pakalpojumu sniegšanas noteikumus (TOS), lai aizliegtu skrāpēt savus rakstus un attēlus AI apmācībai, ziņo Adweek. Šis solis notiek laikā, kad tehnoloģiju uzņēmumi ir turpinājuši gūt peļņu no AI valodas lietotnēm, piemēram, ChatGPT un Google Bard , kuras ieguva savas iespējas, masveidā nesankcionēti izkopjot interneta datus.

Jaunie noteikumi aizliedz izmantot Times saturu, kas ietver rakstus, videoklipus, attēlus un metadatus, lai apmācītu jebkuru AI modeli bez īpašas rakstiskas atļaujas. TOS 2.1. sadaļā NYT teikts, ka tā saturs ir paredzēts lasītāja “personīgai, nekomerciālai lietošanai” un ka nekomerciāla izmantošana neietver “jebkuras programmatūras programmas izstrādi, tostarp, bet ne tikai, apmācību. mašīnmācības vai mākslīgā intelekta (AI) sistēma.

Tālāk, 4.1. sadaļā, noteikumi saka, ka bez NYT iepriekšējas rakstiskas piekrišanas neviens nedrīkst “izmantot Saturu jebkuras programmatūras programmas izstrādei, tostarp, bet ne tikai, mašīnmācības vai mākslīgā intelekta (AI) sistēmas apmācībai. ”.

NYT arī izklāsta ierobežojumu ignorēšanas sekas: “Iesaistīšanās aizliegtā Pakalpojumu lietošanā var izraisīt civiltiesiskus, kriminālsodus un/vai administratīvus sodus, naudas sodus vai sankcijas lietotājam un tiem, kas palīdz lietotājam.”

Lai arī cik draudīgi tas izklausītos, ierobežojošie lietošanas noteikumi iepriekš nav apturējuši interneta vairumtirdzniecību mašīnmācīšanās datu kopās. Katrs mūsdienās pieejamais lielais valodu modelis, tostarp OpenAI GPT-4 , Anthropic’s Claude 2 , Meta’s Llama 2 un Google PaLM 2 , ir apmācīts, izmantojot lielas datu kopas ar materiāliem, kas iegūti no interneta. Izmantojot procesu, ko sauc par neuzraudzītu mācīšanos , tīmekļa dati tika ievadīti neironu tīklos, ļaujot AI modeļiem iegūt konceptuālu valodas izjūtu, analizējot attiecības starp vārdiem.

Pretrunīgi vērtētā būtība, kas saistīta ar nokasītu datu izmantošanu mākslīgā intelekta modeļu apmācībā, kas nav pilnībā atrisināta ASV tiesās, ir novedusi pie vismaz vienas tiesas prāvas , kurā OpenAI tiek apsūdzēts plaģiātismā šīs prakses dēļ. Pagājušajā nedēļā Associated Press un vairākas citas ziņu organizācijas publicēja atklātu vēstuli, kurā teikts, ka cita starpā ir jāizstrādā tiesiskais regulējums, lai aizsargātu saturu, kas nodrošina AI lietojumprogrammas.

OpenAI, visticamāk, paredz turpmākus juridiskus izaicinājumus un ir sācis veikt pasākumus, kas varētu būt paredzēti, lai pārvarētu daļu no šīs kritikas. Piemēram, OpenAI nesen detalizēti aprakstīja metodi , ko vietnes varētu izmantot, lai bloķētu tās AI apmācības tīmekļa rāpuļprogrammu, izmantojot robots.txt. Tā rezultātā vairākas vietnes un autori publiski paziņoja, ka bloķēs rāpuļprogrammu.

Pagaidām tas, kas jau ir nokasīts, tiek iecepts GPT-4, ieskaitot New York Times saturu. Mums, iespējams, būs jāgaida līdz GPT-5, lai redzētu, vai OpenAI vai citi mākslīgā intelekta pārdevēji ievēro satura īpašnieku vēlmes tikt izlaistiem. Ja nē, pie apvāršņa var būt jaunas AI tiesas prāvas vai noteikumi.

Posted on 18 augusts, 2023

News

admin

The New York Times aizliedz AI pārdevējiem bez atļaujas nokasīt tā saturu

Atbildēt Atcelt atbildi

Kā koplietot atrašanās vietu pakalpojumā Google Maps iPhone tālrunī

Zuka/Muska būra spēle atcelta; tehnoloģiju miljardieri vaino viens otru