OpenAI ar fi distrus cărțile și concediat oamenii care au antrenat ChatGPT. Ce informații a încercat compania să ascundă

OpenAI ar fi distrus cărțile cu ajutorul cărora ar fi antrenat ChatGPT și ar fi dat afară și cei 2 angajați care s-au ocupat de această etapă. 

Publicat: 8 mai 2024, 15:18 / Actualizat: 8 mai 2024, 16:18
Reclamă

Authors Guild, din SUA, a dat în judecată OpenAI din cauza modului în care ar fi fost antrenat ChatGPT. Compania e acuzată că a folosit zeci de mii de cărți pentru ChatGPT, fără să plătească drepturi de autor. 

Potrivit noilor documente depuse în proces, OpenAI a dezvăluit că a șters 2 baze de date imense, numite books1 și books2, în care erau introduse cărțile folosite pentru antrenarea modelului GPT-3, scrie Business Insider.

Authors Guild susține că acele baze de date conțineau „peste 100.000 de cărți publicate”. Acestea se află la baza procesului legat de drepturile de autor în contextul AI.

ARTICOLUL CONTINUĂ DUPĂ RECLAMĂ

OpenAI ar fi distrus cărțile și concediat oamenii care au antrenat ChatGPT

Timp de mai multe luni, Authors Guild a încercat să obțină informații de pe OpenAi despre aceste baze de date. Inițial, compania a refuzat să dezvăluie aceste informații. Avocații OpenAI au susținut că acest pas ar încălca drepturile de confidențialitate. 

Într-un final, însă, OpenAI a recunoscut că ar fi distrus cărțile folosite pentru antrenarea modelului AI. Compania susține că au fost distruse toate copiile bazelor de date. 

Reclamă
Reclamă

Datele de înaltă calitate sunt extrem de importante pentru antrenarea modelelor AI puternice, ce au început să acapereze domeniul tech. OpenAI și alte companii similare au folosit date de pe Internet pentru acest lucru. Inclusiv cărți care se găsesc online. 

Multe dintre companiile care au creat aceste informații vor să fie plătite pentru datele folosite de noile produse AI. Companiile tech nu vor să fie forțate să plătească. În acest moment, există mai multe procese intentate în acest sector. 

În 2020, OpenAI a descris bazele de date books1 și books2 drept „culegeri de cărți de pe Internet”. Se pare că aceste cărți au reprezentat 16% din datele de antrenare pentru GPT-3. 

În plus, documentul susține că book1 și book2 conțineau 67 de miliarde de unități de date. Echivalentul a 50 de miliarde de cuvinte. Prin comparație, Biblia are 783.137 de cuvinte. 

În ciuda faptul că OpenAI s-a îmbogățit de pe urma muncii autorilor, compania susține că ar fi distrus cărțile folosite pentru modelul AI. Potrivit documentelor, bazele de date nu au mai fost folosite pentru model din 2021. În 2022, ar fi fost șterse, alături de toate copiile. În același timp, OpenAI nu a distrus niciuna dintre celelalte baze de date, care nu au drepturi de autor legate de ele. 

Angajații care s-au ocupat de aceste baze de date nu mai lucrează la OpenAI

Dincolo de faptul că OpenAI a refuzat să ofere Authors Guild bazele de date, compania nu a vrut să dezvăluie nici identitățile celor 2 angajați care s-au ocupat de ele.

Se pare că aceștia nu mai lucrează în cadrul OpenAI. Compania a fost forțată să dezvăluie identitățile lor către avocații Authors Guild. ChatGpt e acuzat și că nu își poate corecta propriile greșeli.

OpenAI, ce ar fi distrus cărțile, a cerut judecătorilor ca informațiile despre bazele de date să nu fie făcute publice. Authors Guild se opune vehement, pentru că publicul are dreptul să știe cum sunt folosite datele. 

„Modelele din spatele ChatGPT și API-ului nostru de azi nu sunt dezvoltate folosind aceste baze de date,” susține OpenAI. Dar doar pentru că nu mai sunt folosite acum, nu înseamnă că nu au fost folosite fără drepturi de autor în trecut. „Aceste baze de date, create de foști angajați care nu se mai află în OpenAI, au fost folosite ultima dată în 2021. Și au fost șterse în 2022 din cauză că nu mai erau folosite.”

Reclamă
Te-ar mai putea interesa și
Papa Francisc în scaun cu rotile, lângă o mulțime cu mâinile întinse, Vatican, martie 2023, pentru a ilustra adevărul din spatele imaginilor virale cu Papa Francisc
Vaticanul folosește inteligența artificială. Ce serviciu va fi disponibil pentru Bazilica Sf. Petru
Vaticanul folosește inteligența artificială. Ce serviciu va fi disponibil pentru Bazilica Sf. Petru
Persoană care ține un telefon negru cu simbolul Copilot pe ecran, cu Microsoft colorat pe fundal, pentru a ilustra cum Telegram integrează chatbot-ul Copilot
Microsoft oferă un premiu de 1 milion de dolari pentru utilizatorii Bing. Ce trebuie să facă pentru a câștiga
Microsoft oferă un premiu de 1 milion de dolari pentru utilizatorii Bing. Ce trebuie să facă pentru a câștiga
Donald Trump, care vrea să revoce restricțiile AI, în campania din 2024, pe fundal negru
Donald Trump vrea să revoce restricțiile impuse asupra inteligenței artificiale. Ce planuri îngrijorătoare are pentru tehnologie
Donald Trump vrea să revoce restricțiile impuse asupra inteligenței artificiale. Ce planuri îngrijorătoare are pentru tehnologie
RECOMANDĂRI USEIT.RO
1
Telefon Android la încârcat, pe fundal galben, cu fir alb. Unele trucuri pot prelungi durata de viață a bateriei dispozitivelor Android
Metoda de încărcare care protejează bateria telefonului. Cei mai mulți utilizatori nu folosesc acest truc
Experții au dezvăluit metoda de încărcare care protejează bateria telefonului pe termen lung, dar pe care puțini utilizatori o folosesc. Atunci când vine vorba de utilizarea telefonului, protejarea bateriei e unul dintre cele mai...
Metoda de încărcare care protejează bateria telefonului. Cei mai mulți utilizatori nu folosesc acest truc
2
Persoană umblă la cetrala termică albă pentru a găsi temperatura ideală
Temperatura ideală pentru centrala termică. La cât să o setezi pentru a nu-ți încărca factura
Te-ai întrebat care e temperatura ideală pentru centrala termică? Experții au dezvăluit trucuri de încălzire pe care le poți folosi pentru a nu-ți încărca factura. Descoperirea soluțiilor simple pentru reducerea costurilor la încălzire poate...
Temperatura ideală pentru centrala termică. La cât să o setezi pentru a nu-ți încărca factura
3
Utilizator care stă în fața unui laptop, cu logare pe un ecran verde. Experții au dezvăluit cum îți poate fi furată parola
Cele mai folosite parole în 2024. Hackerii le pot sparge în mai puțin de 1 secundă
Ca în fiecare an, au fost dezvăluite cele mai folosite parole în 2024, care pun conturile în pericol pentru că sunt atât de ușor de spart.  În fiecare an, zeci de milioane de conturi...
Cele mai folosite parole în 2024. Hackerii le pot sparge în mai puțin de 1 secundă
4
Calculator cu ecranul albastru, după pana globală Microsoft Windows din iulie 2024, pentru a ilustra cum Microsoft a dezvăluit câte computere au fost afectate
Când va fi „pensionat” Windows 10. După această dată, utilizatorii trebuie să plătească în plus pentru a folosi sistemul de operare Microsoft
Microsoft a dezvăluit când va fi „pensionat” Windows 10, fosta varianta a sistemului de operare, care e instalată pe peste 1 miliard de dispozitive.  Momentul în care Windows 10 nu va mai primi actualizări...
Când va fi „pensionat” Windows 10. După această dată, utilizatorii trebuie să plătească în plus pentru a folosi sistemul de operare Microsoft
5
4 astronauți care au revenit pe Pământ pe 12 martie 2024, la bordul unei capsule SpaceX, îmbrăcați în uniforme cu alb și negru
Fun
NASA încă cercetează motivul spitalizării astronautului care s-a întors de pe Stația Spațială Internațională. Agenția încă nu a dezvăluit cauza reală
NASA încă cercetează motivul spitalizării astronautului după ce acesta s-a întors pe Pământ de pe Stația Spațială Internațională. Luna trecută, 3 astronauți NASA și un cosmonaut din Rusia au ajuns la un spital din...
NASA încă cercetează motivul spitalizării astronautului care s-a întors de pe Stația Spațială Internațională. Agenția încă nu a dezvăluit cauza reală
PARTENERI
×