ChatGPT model o1 a întrecut toate așteptările. Cum a surprins experții: „Am rămas uimit”

ChatGPT model o1 a întrecut toate așteptările experților care l-au analizat și care au estimat folosul acestui model pentru domeniul științific. 

Publicat: 3 octombrie 2024, 13:10 / Actualizat: 3 octombrie 2024, 15:11
Reclamă

Experții care au ajutat la testarea celui mai nou model de limbaj OpenAI o1 susțin că reprezintă un pas important atunci când vine vorba de folosul chatbot-ului când vine vorba de știință. Până acum, au fost realizate deja numeroase descoperiri cu ajutorul inteligenței artificiale.

„În domeniul meu de fizică cuantică, oferă răspunsuri mult mai detaliate și coerente” decât modelul precedent al companiei, GPT-4o, susține Mario Krenn, directorul Artificial Scientist Lab, din cadrul Max Planck Institute for the Science of Light, Germania, scrie Nature

Krenn a fost unul dintre experții din „echipa roșie”. Aceasta a testat o versiune timpurie a o1 pentru OpenAI. Experții au luat în considerare și aportul pe care îl poate avea modelul atunci când vine vorba de știință, dar și îngrijorările legate de siguranță.

ARTICOLUL CONTINUĂ DUPĂ RECLAMĂ

ChatGPT model o1 a întrecut toate așteptările

De la lansarea publică a ChatGPT în 2022, modelele mari de limbaj care stau la baza acestor platforme s-au dezvoltat. Au mai multe date de antrenament și abilități mai puternice atunci când vine vorba de testele standardizate. 

În testele realizate de „echipa roșie”, ChatGPT model o1 a întrecut toate așteptările experților atunci când vine vorba de cât de folositor e. OpenAI susține că modelul reprezintă o schimbare semnificativă în abordarea companiei. 

Reclamă
Reclamă

Experții susțin că noul model AI ar fi petrecut mai mult timp în faza de învățare. Ca urmare, se „gândește” la răspunsuri mai mult timp. Deși răspunsurile sunt mai lente, sunt mult mai bune. Mai ales în domenii în care răspunsurile bune și rele pot fi definite clar. 

OpenAI susține că o1 „poate să judece când vine vorba de sarcini complexe și să rezolve probleme mai grele decât alte modele precedente din știință, IT sau matematică”. 

În acest moment, OpenAI permite accesul la o1-preview și o1-mini, o versiune mai mică și cu un preț mai accesibil. Aceasta e versiunea creată pentru cei care scriu linii de cod. Modelul e disponibil abonaților și anumitor dezvoltatori, în fază de testare. 

Și în testele experților, ChatGPT model o1 a întrecut toate așteptările atunci când vine vorba de abilitățile sale. 

Andrew White, chimist în cadrul FutureHouse, s-a axat pe modul în care AI poate fi aplicată în cazul biologiei moleculare. Potrivit lui White, experții au fost dezamăgiți de anumite aspecte ale GPT-4. Dar seria o1 ar fi schimbat acest lucru.

Modelul o1 e primul care a bătut experții în setul „diamant”

O1 a devenit primul model care a bătut experți la nivelul doctoratului la cele mai grele întrebări – adică setul „diamant” – în testul Graduate-Level Google-Proof Q&A Benchmark (GPQA)1. OpenAI susține că experții au obținut un procent de aproximativ 70%. Pe când o1 ar fi avut un scor mediu de 78%. Și un scor de 93% în domeniul fizicii. 

OpenAI a testat ChatGPT model o1 și în domeniul matematicii, unde a întrecut așteptările. La examenul de calificare pentru Olimpiada Internațională de Matematică, a obținut un scor de 83%. Modelul precedent, GPT-4o a rezolvat doar 13% dintre probleme. 

Kyle Kabasares, expert din cadrul Bay Area Environmental Research Institute, a folosit o1 pentru a rescrie codurile din proiectul său de doctorat. În acesta, a calculat masa găurilor negre.

„Am fost pur și simplu uimit,” a declarat Kabasares. Modelul o1 ar fi scris liniile de cod necesare într-o oră. Kabasares le-a efectuat în câteva luni de unul singur. 

Reclamă
Te-ar mai putea interesa și
Utilizator care are un telefon cu WhatsApp pe ecran. Experții au emis avertismente urgente pentru utilizatorii WhatsApp
Cercul albastru pe WhatsApp: ce înseamnă și de ce nu poți dezactiva noul simbol
Cercul albastru pe WhatsApp: ce înseamnă și de ce nu poți dezactiva noul simbol
Un robot alb care vorbește cu un adolescent care își face temele, amândoi pe canapea, pentru a ilustra ce e efectul Eliza
Un model AI a trecut de testul Turing, în premieră mondială. Cum a reușit
Un model AI a trecut de testul Turing, în premieră mondială. Cum a reușit
Laptop deschis cu OpenAI pe ecran și un telefon cu ChatGPT pe ecran, pentru a ilustra industria pe care ChatGPT o poate schimba
Funcția ChatGPT care a atras 1 milion de utilizatori într-o singură oră. Pentru ce opțiune există o „cerere biblică”
Funcția ChatGPT care a atras 1 milion de utilizatori într-o singură oră. Pentru ce opțiune există o „cerere biblică”
RECOMANDĂRI USEIT.RO
1
Doi astronauți, lângă Stația Spațială Internațională, în spațiu, cu Pământul pe fundal. Acolo vor ajunge și astronauții amatori care au plătit câte 55 de milioane de dolari pentru misiune
Riscul la care se expun astronauții care zboară spre Marte. Corpul lor nu va mai fi la fel niciodată
Puțini știu riscul la care se expun astronauții care zboară spre Marte, un drum care are efecte semnificative asupra corpului lor. Călătoriile mai lungi în spațiu vor avea loc în următoarele decenii. Pentru a...
Riscul la care se expun astronauții care zboară spre Marte. Corpul lor nu va mai fi la fel niciodată
2
Utilizator care are un telefon cu WhatsApp pe ecran. Experții au dezvăluit cum poți verifica dacă ți-a fost citit mesajul pe Android
Îți place să trimiți mesaje vocale pe WhatsApp? Ce spun psihologii despre tine
Dacă îți place să trimiți mesaje vocale pe WhatsApp, s-ar putea să ai o trăsătură pe care psihologii au scos-o în evidență.  Mesajele vocale tind să dividă utilizatorii. Unii dintre ei adoră să le...
Îți place să trimiți mesaje vocale pe WhatsApp? Ce spun psihologii despre tine
3
Femeie care a adus un laptop pe avion și îl folosește
Ce nu trebuie să faci cu un laptop pe avion. Greșeala care îți poate strica dispozitivul
Experții au dezvăluit ce nu trebuie să faci cu un laptop pe avion, o greșeală mult mai comună decât își dau seama cei mai mulți pasageri.  Pentru mulți pasageri, timpul petrecut în zbor reprezintă...
Ce nu trebuie să faci cu un laptop pe avion. Greșeala care îți poate strica dispozitivul
4
Planeta Pământ, împărțită în două. Într-o parte e verde și sănătoasă, în cealaltă e uscată, pe moarte. Planeta e ținută de o mână
Încălzirea globală ar putea distruge 40% din economia globală. Cum e posibil
Experții au estimat că încălzirea globală ar putea distruge 40% din economia globală, o scădere care va avea loc în timpul vieții noastre. Distrugerea cauzată de schimbarea climei se va resimți și la nivelul...
Încălzirea globală ar putea distruge 40% din economia globală. Cum e posibil
5
Logoul Google Chrome, înainte să fie schimbat, pe ecranul unui telefon mobil, lângă o tastatură
Google a pierdut un proces antitrust important în SUA. Ce nu mai poate face gigantul tech de acum
Google a pierdut un proces antitrust împotriva Departamentului de Justiție din SUA, după ce gigantul tech a fost acuzat că are monopol în domeniul publicității în industria tech. O mare parte din profitul Google...
Google a pierdut un proces antitrust important în SUA. Ce nu mai poate face gigantul tech de acum
PARTENERI
×