ChatGPT model o1 a întrecut toate așteptările. Cum a surprins experții: „Am rămas uimit”

ChatGPT model o1 a întrecut toate așteptările experților care l-au analizat și care au estimat folosul acestui model pentru domeniul științific. 

Publicat: 3 octombrie 2024, 13:10 / Actualizat: 3 octombrie 2024, 15:11
Reclamă

Experții care au ajutat la testarea celui mai nou model de limbaj OpenAI o1 susțin că reprezintă un pas important atunci când vine vorba de folosul chatbot-ului când vine vorba de știință. Până acum, au fost realizate deja numeroase descoperiri cu ajutorul inteligenței artificiale.

„În domeniul meu de fizică cuantică, oferă răspunsuri mult mai detaliate și coerente” decât modelul precedent al companiei, GPT-4o, susține Mario Krenn, directorul Artificial Scientist Lab, din cadrul Max Planck Institute for the Science of Light, Germania, scrie Nature

Krenn a fost unul dintre experții din „echipa roșie”. Aceasta a testat o versiune timpurie a o1 pentru OpenAI. Experții au luat în considerare și aportul pe care îl poate avea modelul atunci când vine vorba de știință, dar și îngrijorările legate de siguranță.

ARTICOLUL CONTINUĂ DUPĂ RECLAMĂ

ChatGPT model o1 a întrecut toate așteptările

De la lansarea publică a ChatGPT în 2022, modelele mari de limbaj care stau la baza acestor platforme s-au dezvoltat. Au mai multe date de antrenament și abilități mai puternice atunci când vine vorba de testele standardizate. 

În testele realizate de „echipa roșie”, ChatGPT model o1 a întrecut toate așteptările experților atunci când vine vorba de cât de folositor e. OpenAI susține că modelul reprezintă o schimbare semnificativă în abordarea companiei. 

Reclamă
Reclamă

Experții susțin că noul model AI ar fi petrecut mai mult timp în faza de învățare. Ca urmare, se „gândește” la răspunsuri mai mult timp. Deși răspunsurile sunt mai lente, sunt mult mai bune. Mai ales în domenii în care răspunsurile bune și rele pot fi definite clar. 

OpenAI susține că o1 „poate să judece când vine vorba de sarcini complexe și să rezolve probleme mai grele decât alte modele precedente din știință, IT sau matematică”. 

În acest moment, OpenAI permite accesul la o1-preview și o1-mini, o versiune mai mică și cu un preț mai accesibil. Aceasta e versiunea creată pentru cei care scriu linii de cod. Modelul e disponibil abonaților și anumitor dezvoltatori, în fază de testare. 

Și în testele experților, ChatGPT model o1 a întrecut toate așteptările atunci când vine vorba de abilitățile sale. 

Andrew White, chimist în cadrul FutureHouse, s-a axat pe modul în care AI poate fi aplicată în cazul biologiei moleculare. Potrivit lui White, experții au fost dezamăgiți de anumite aspecte ale GPT-4. Dar seria o1 ar fi schimbat acest lucru.

Modelul o1 e primul care a bătut experții în setul „diamant”

O1 a devenit primul model care a bătut experți la nivelul doctoratului la cele mai grele întrebări – adică setul „diamant” – în testul Graduate-Level Google-Proof Q&A Benchmark (GPQA)1. OpenAI susține că experții au obținut un procent de aproximativ 70%. Pe când o1 ar fi avut un scor mediu de 78%. Și un scor de 93% în domeniul fizicii. 

OpenAI a testat ChatGPT model o1 și în domeniul matematicii, unde a întrecut așteptările. La examenul de calificare pentru Olimpiada Internațională de Matematică, a obținut un scor de 83%. Modelul precedent, GPT-4o a rezolvat doar 13% dintre probleme. 

Kyle Kabasares, expert din cadrul Bay Area Environmental Research Institute, a folosit o1 pentru a rescrie codurile din proiectul său de doctorat. În acesta, a calculat masa găurilor negre.

„Am fost pur și simplu uimit,” a declarat Kabasares. Modelul o1 ar fi scris liniile de cod necesare într-o oră. Kabasares le-a efectuat în câteva luni de unul singur. 

Reclamă
Te-ar mai putea interesa și
Simbol Apple, pe fundal gri, cu un căpat al încărcătorului. Apple a dezvăluit recent accident o actalizare importanta
Apple ar pregăti lansarea unui dispozitiv nou în 2027. Ce ar putea face tehnologia de purtat
Apple ar pregăti lansarea unui dispozitiv nou în 2027. Ce ar putea face tehnologia de purtat
Utilizator care folosește un laptop cu ChatGPT, pe o masă, pentru a ilustra ce i-a cerut un utilizator modelului ChatGPT
OpenAI lansează magazinul de aplicații ChatGPT. Ce poți găsi pe el
OpenAI lansează magazinul de aplicații ChatGPT. Ce poți găsi pe el
Telefon pe ecranul căruia se află WhatsApp, pe un fundal cu logoul WhatsApp, pe verde. WhatsApp ar putea crește limita de transfer de 20 de ori
WhatsApp nu mai permite ChatGPT și Copilot pe platformă. Cum vor fi înlocuiți chatboții
WhatsApp nu mai permite ChatGPT și Copilot pe platformă. Cum vor fi înlocuiți chatboții
RECOMANDĂRI USEIT.RO
1
Consolă PlayStation 5, pe alb, pe un fundal gri cu negru. Consola e produsă de compania Sony, ce va produce mai multe console PS4 în 2022
Console de gaming care acum valorează o avere. Ce dispozitiv se vinde cu mii de dolari
Unele console de gaming valorează acum o avere, după ce unele dintre ele au strâns praf timp de peste 10 ani. Mulți utilizatori au gadget-uri vechi păstrate în cutii sau în pod, care strâng...
Console de gaming care acum valorează o avere. Ce dispozitiv se vinde cu mii de dolari
2
Persoană care ține un telefon pliabil în mâini, similar cu Huawei Pocket S, care e cel mai ieftin telefon pliabil lansat până acum
Primele imagini cu un iPhone pliabil au ajuns pe Internet. Cum ar arăta viitorul smartphone
Primele imagini cu un iPhone pliabil au ajuns pe Internet, deși Apple nu a confirmat că dezvoltă un astfel de smartphone. În ultimii ani, au apărut numeroase zvonuri legate de un potențial iPhone pliabil....
Primele imagini cu un iPhone pliabil au ajuns pe Internet. Cum ar arăta viitorul smartphone
3
Jucător care se află în fața unui calculator, la birou, diferit față de Star Citizen, jocul controversat care a strâns 500 de milioane de dolari
Cele mai așteptate jocuri video din 2026. Titlurile preferate de milioane de fani
Cele mai așteptate jocuri video din 2026 deja au încântat milioane de fani cu imaginile și trailerele lansate până acum.  Anul 2026 se anunță a fi important pentru industria de gaming. Mai mult, unele...
Cele mai așteptate jocuri video din 2026. Titlurile preferate de milioane de fani
4
Imagine cu un controller PlayStation, în fața unui panou albastru PlayStation Plus. Trei jocuri PlayStation Plus vor fi disponibile din ianuarie 2022
Jocuri PlayStation Plus din martie 2026. Ce titluri vor fi disponibile
Sony a dezvăluit la ce jocuri PlayStation Plus din martie 2026 vor avea acces abonații serviciului. Ca în fiecare lună, serviciul oferă titluri inedite. Sony a dezvăluit jocurile care vor fi disponibile în martie...
Jocuri PlayStation Plus din martie 2026. Ce titluri vor fi disponibile
5
Telefon din seria Samsung Galaxy S25, 22 ianuarie 2025, prins de un suport de metal
Samsung a dezvăluit seria Galaxy S26. Cât costă noile smartphone-uri
Samsung a dezvăluit seria Galaxy S26, cu 3 noi modele de smartphone-uri care promit o performanță mai bună decât modelele precedente. După luni întregi de zvonuri și speculații, Samsung a lansat oficial noua serie...
Samsung a dezvăluit seria Galaxy S26. Cât costă noile smartphone-uri
PARTENERI
×