OpenAI ar fi distrus cărțile și concediat oamenii care au antrenat ChatGPT. Ce informații a încercat compania să ascundă

OpenAI ar fi distrus cărțile cu ajutorul cărora ar fi antrenat ChatGPT și ar fi dat afară și cei 2 angajați care s-au ocupat de această etapă. 

Publicat: 8 mai 2024, 15:18 / Actualizat: 8 mai 2024, 16:18
Reclamă

Authors Guild, din SUA, a dat în judecată OpenAI din cauza modului în care ar fi fost antrenat ChatGPT. Compania e acuzată că a folosit zeci de mii de cărți pentru ChatGPT, fără să plătească drepturi de autor. 

Potrivit noilor documente depuse în proces, OpenAI a dezvăluit că a șters 2 baze de date imense, numite books1 și books2, în care erau introduse cărțile folosite pentru antrenarea modelului GPT-3, scrie Business Insider.

Authors Guild susține că acele baze de date conțineau „peste 100.000 de cărți publicate”. Acestea se află la baza procesului legat de drepturile de autor în contextul AI.

ARTICOLUL CONTINUĂ DUPĂ RECLAMĂ

OpenAI ar fi distrus cărțile și concediat oamenii care au antrenat ChatGPT

Timp de mai multe luni, Authors Guild a încercat să obțină informații de pe OpenAi despre aceste baze de date. Inițial, compania a refuzat să dezvăluie aceste informații. Avocații OpenAI au susținut că acest pas ar încălca drepturile de confidențialitate. 

Într-un final, însă, OpenAI a recunoscut că ar fi distrus cărțile folosite pentru antrenarea modelului AI. Compania susține că au fost distruse toate copiile bazelor de date. 

Reclamă
Reclamă

Datele de înaltă calitate sunt extrem de importante pentru antrenarea modelelor AI puternice, ce au început să acapereze domeniul tech. OpenAI și alte companii similare au folosit date de pe Internet pentru acest lucru. Inclusiv cărți care se găsesc online. 

Multe dintre companiile care au creat aceste informații vor să fie plătite pentru datele folosite de noile produse AI. Companiile tech nu vor să fie forțate să plătească. În acest moment, există mai multe procese intentate în acest sector. 

În 2020, OpenAI a descris bazele de date books1 și books2 drept „culegeri de cărți de pe Internet”. Se pare că aceste cărți au reprezentat 16% din datele de antrenare pentru GPT-3. 

În plus, documentul susține că book1 și book2 conțineau 67 de miliarde de unități de date. Echivalentul a 50 de miliarde de cuvinte. Prin comparație, Biblia are 783.137 de cuvinte. 

În ciuda faptul că OpenAI s-a îmbogățit de pe urma muncii autorilor, compania susține că ar fi distrus cărțile folosite pentru modelul AI. Potrivit documentelor, bazele de date nu au mai fost folosite pentru model din 2021. În 2022, ar fi fost șterse, alături de toate copiile. În același timp, OpenAI nu a distrus niciuna dintre celelalte baze de date, care nu au drepturi de autor legate de ele. 

Angajații care s-au ocupat de aceste baze de date nu mai lucrează la OpenAI

Dincolo de faptul că OpenAI a refuzat să ofere Authors Guild bazele de date, compania nu a vrut să dezvăluie nici identitățile celor 2 angajați care s-au ocupat de ele.

Se pare că aceștia nu mai lucrează în cadrul OpenAI. Compania a fost forțată să dezvăluie identitățile lor către avocații Authors Guild. ChatGpt e acuzat și că nu își poate corecta propriile greșeli.

OpenAI, ce ar fi distrus cărțile, a cerut judecătorilor ca informațiile despre bazele de date să nu fie făcute publice. Authors Guild se opune vehement, pentru că publicul are dreptul să știe cum sunt folosite datele. 

„Modelele din spatele ChatGPT și API-ului nostru de azi nu sunt dezvoltate folosind aceste baze de date,” susține OpenAI. Dar doar pentru că nu mai sunt folosite acum, nu înseamnă că nu au fost folosite fără drepturi de autor în trecut. „Aceste baze de date, create de foști angajați care nu se mai află în OpenAI, au fost folosite ultima dată în 2021. Și au fost șterse în 2022 din cauză că nu mai erau folosite.”

Reclamă
Te-ar mai putea interesa și
Utilizator care are un telefon cu WhatsApp pe ecran. Experții au emis avertismente urgente pentru utilizatorii WhatsApp
Cercul albastru pe WhatsApp: ce înseamnă și de ce nu poți dezactiva noul simbol
Cercul albastru pe WhatsApp: ce înseamnă și de ce nu poți dezactiva noul simbol
Un robot alb care vorbește cu un adolescent care își face temele, amândoi pe canapea, pentru a ilustra ce e efectul Eliza
Un model AI a trecut de testul Turing, în premieră mondială. Cum a reușit
Un model AI a trecut de testul Turing, în premieră mondială. Cum a reușit
Laptop deschis cu OpenAI pe ecran și un telefon cu ChatGPT pe ecran, pentru a ilustra industria pe care ChatGPT o poate schimba
Funcția ChatGPT care a atras 1 milion de utilizatori într-o singură oră. Pentru ce opțiune există o „cerere biblică”
Funcția ChatGPT care a atras 1 milion de utilizatori într-o singură oră. Pentru ce opțiune există o „cerere biblică”
RECOMANDĂRI USEIT.RO
1
Doi astronauți, lângă Stația Spațială Internațională, în spațiu, cu Pământul pe fundal. Acolo vor ajunge și astronauții amatori care au plătit câte 55 de milioane de dolari pentru misiune
Riscul la care se expun astronauții care zboară spre Marte. Corpul lor nu va mai fi la fel niciodată
Puțini știu riscul la care se expun astronauții care zboară spre Marte, un drum care are efecte semnificative asupra corpului lor. Călătoriile mai lungi în spațiu vor avea loc în următoarele decenii. Pentru a...
Riscul la care se expun astronauții care zboară spre Marte. Corpul lor nu va mai fi la fel niciodată
2
Utilizator care are un telefon cu WhatsApp pe ecran. Experții au dezvăluit cum poți verifica dacă ți-a fost citit mesajul pe Android
Îți place să trimiți mesaje vocale pe WhatsApp? Ce spun psihologii despre tine
Dacă îți place să trimiți mesaje vocale pe WhatsApp, s-ar putea să ai o trăsătură pe care psihologii au scos-o în evidență.  Mesajele vocale tind să dividă utilizatorii. Unii dintre ei adoră să le...
Îți place să trimiți mesaje vocale pe WhatsApp? Ce spun psihologii despre tine
3
Femeie care a adus un laptop pe avion și îl folosește
Ce nu trebuie să faci cu un laptop pe avion. Greșeala care îți poate strica dispozitivul
Experții au dezvăluit ce nu trebuie să faci cu un laptop pe avion, o greșeală mult mai comună decât își dau seama cei mai mulți pasageri.  Pentru mulți pasageri, timpul petrecut în zbor reprezintă...
Ce nu trebuie să faci cu un laptop pe avion. Greșeala care îți poate strica dispozitivul
4
Planeta Pământ, împărțită în două. Într-o parte e verde și sănătoasă, în cealaltă e uscată, pe moarte. Planeta e ținută de o mână
Încălzirea globală ar putea distruge 40% din economia globală. Cum e posibil
Experții au estimat că încălzirea globală ar putea distruge 40% din economia globală, o scădere care va avea loc în timpul vieții noastre. Distrugerea cauzată de schimbarea climei se va resimți și la nivelul...
Încălzirea globală ar putea distruge 40% din economia globală. Cum e posibil
5
Logoul Google Chrome, înainte să fie schimbat, pe ecranul unui telefon mobil, lângă o tastatură
Google a pierdut un proces antitrust important în SUA. Ce nu mai poate face gigantul tech de acum
Google a pierdut un proces antitrust împotriva Departamentului de Justiție din SUA, după ce gigantul tech a fost acuzat că are monopol în domeniul publicității în industria tech. O mare parte din profitul Google...
Google a pierdut un proces antitrust important în SUA. Ce nu mai poate face gigantul tech de acum
PARTENERI
×