ChatGPT model o1 a întrecut toate așteptările. Cum a surprins experții: „Am rămas uimit”

ChatGPT model o1 a întrecut toate așteptările experților care l-au analizat și care au estimat folosul acestui model pentru domeniul științific. 

Publicat: 3 octombrie 2024, 13:10 / Actualizat: 3 octombrie 2024, 15:11
Reclamă

Experții care au ajutat la testarea celui mai nou model de limbaj OpenAI o1 susțin că reprezintă un pas important atunci când vine vorba de folosul chatbot-ului când vine vorba de știință. Până acum, au fost realizate deja numeroase descoperiri cu ajutorul inteligenței artificiale.

„În domeniul meu de fizică cuantică, oferă răspunsuri mult mai detaliate și coerente” decât modelul precedent al companiei, GPT-4o, susține Mario Krenn, directorul Artificial Scientist Lab, din cadrul Max Planck Institute for the Science of Light, Germania, scrie Nature

Krenn a fost unul dintre experții din „echipa roșie”. Aceasta a testat o versiune timpurie a o1 pentru OpenAI. Experții au luat în considerare și aportul pe care îl poate avea modelul atunci când vine vorba de știință, dar și îngrijorările legate de siguranță.

ARTICOLUL CONTINUĂ DUPĂ RECLAMĂ

ChatGPT model o1 a întrecut toate așteptările

De la lansarea publică a ChatGPT în 2022, modelele mari de limbaj care stau la baza acestor platforme s-au dezvoltat. Au mai multe date de antrenament și abilități mai puternice atunci când vine vorba de testele standardizate. 

În testele realizate de „echipa roșie”, ChatGPT model o1 a întrecut toate așteptările experților atunci când vine vorba de cât de folositor e. OpenAI susține că modelul reprezintă o schimbare semnificativă în abordarea companiei. 

Reclamă
Reclamă

Experții susțin că noul model AI ar fi petrecut mai mult timp în faza de învățare. Ca urmare, se „gândește” la răspunsuri mai mult timp. Deși răspunsurile sunt mai lente, sunt mult mai bune. Mai ales în domenii în care răspunsurile bune și rele pot fi definite clar. 

OpenAI susține că o1 „poate să judece când vine vorba de sarcini complexe și să rezolve probleme mai grele decât alte modele precedente din știință, IT sau matematică”. 

În acest moment, OpenAI permite accesul la o1-preview și o1-mini, o versiune mai mică și cu un preț mai accesibil. Aceasta e versiunea creată pentru cei care scriu linii de cod. Modelul e disponibil abonaților și anumitor dezvoltatori, în fază de testare. 

Și în testele experților, ChatGPT model o1 a întrecut toate așteptările atunci când vine vorba de abilitățile sale. 

Andrew White, chimist în cadrul FutureHouse, s-a axat pe modul în care AI poate fi aplicată în cazul biologiei moleculare. Potrivit lui White, experții au fost dezamăgiți de anumite aspecte ale GPT-4. Dar seria o1 ar fi schimbat acest lucru.

Modelul o1 e primul care a bătut experții în setul „diamant”

O1 a devenit primul model care a bătut experți la nivelul doctoratului la cele mai grele întrebări – adică setul „diamant” – în testul Graduate-Level Google-Proof Q&A Benchmark (GPQA)1. OpenAI susține că experții au obținut un procent de aproximativ 70%. Pe când o1 ar fi avut un scor mediu de 78%. Și un scor de 93% în domeniul fizicii. 

OpenAI a testat ChatGPT model o1 și în domeniul matematicii, unde a întrecut așteptările. La examenul de calificare pentru Olimpiada Internațională de Matematică, a obținut un scor de 83%. Modelul precedent, GPT-4o a rezolvat doar 13% dintre probleme. 

Kyle Kabasares, expert din cadrul Bay Area Environmental Research Institute, a folosit o1 pentru a rescrie codurile din proiectul său de doctorat. În acesta, a calculat masa găurilor negre.

„Am fost pur și simplu uimit,” a declarat Kabasares. Modelul o1 ar fi scris liniile de cod necesare într-o oră. Kabasares le-a efectuat în câteva luni de unul singur. 

Reclamă
Te-ar mai putea interesa și
Ray-Ban Meta, ochelari smart care au fost dezvăluiți în septembrie 2023, de culoare neagră, ținuți în mână
Cum își antrenează Meta modelul AI. Utilizatorii Ray-Ban Meta AI sunt implicați
Cum își antrenează Meta modelul AI. Utilizatorii Ray-Ban Meta AI sunt implicați
Google Bard, care poate fi accesat acum de către public, pe ecranul unui smartphone care stă pe tastatură
Google a cheltuit 2.7 miliarde de dolari pentru a reangaja un singur expert AI. De ce e atât de important Noam Shazeer pentru companie
Google a cheltuit 2.7 miliarde de dolari pentru a reangaja un singur expert AI. De ce e atât de important Noam Shazeer pentru companie
Persoană care ține un telefon negru cu simbolul Copilot pe ecran, cu Microsoft colorat pe fundal, pentru a ilustra cum Telegram integrează chatbot-ul Copilot
Microsoft schimbă complet Copilot. Cum se transformă proiectul AI al companiei
Microsoft schimbă complet Copilot. Cum se transformă proiectul AI al companiei
RECOMANDĂRI USEIT.RO
1
Eclipsă solară, înconjurată de nori, în nuanțe de portocaliu, similară cu o eclipsă solară hibridă foarte rară
Eclipsa solară „inel de foc” va avea loc pe 2 octombrie. În ce zone va fi vizibil fenomenul inedit 
Eclipsa solară „inel de foc” urmează să aibă loc pe 2 octombrie în 2024 și va oferi un spectacol astronomic inedit în zonele în care va fi vizibilă. Pe 2 octombrie, o eclipsă solară...
Eclipsa solară „inel de foc” va avea loc pe 2 octombrie. În ce zone va fi vizibil fenomenul inedit 
2
Imagine din ocean, cu lumina care se strecoară printre stânci, similar cu un ocean sub suprafața Pământului
Misterul din Groapa Marianelor a fost elucidat. Ce ar fi zgomotul care se aude din adâncuri, de fapt
Experții au elucidat misterul din Groapa Marianelor, respectiv zgomotul neobișnuit care se auzea din adâncul oceanului.  Groapa Marianelor e cel mai adânc punct de pe Pământ descoperit până acum. De mai bine de 10...
Misterul din Groapa Marianelor a fost elucidat. Ce ar fi zgomotul care se aude din adâncuri, de fapt
3
Un bărbat și o femeie se antrenează la sală, cu greutăți de culoare roșie. El e îmbrăcat într-un tricou negru, ea într-un tricou gri. Experții au descoperit că din ce în ce mai mulți oameni se nasc cu o arteră în plus
Băutura care poate ajuta la menținerea masei musculare. Mulți oameni o consumă în fiecare zi
Experții au dezvăluit băutura care poate ajuta la menținerea masei musculare, dincolo de alte procese din corp pe care le poate îmbunătăți. Mulți oameni își încep dimineața cu o cafea, dar nu știu ce...
Băutura care poate ajuta la menținerea masei musculare. Mulți oameni o consumă în fiecare zi
4
Barajul Celor 3 Defileuri din China, cu apa care iese prin fante
Barajul Celor 3 Defileuri din China afectează rotația Pământului. Cum e posibil
Barajul Celor 3 Defileuri din China e o structură creată de oameni, prima de acest fel care a afectat rotația Pământului. Barajul Celor 3 Defileuri e cel mai mare baraj hidroelectric din lume. E...
Barajul Celor 3 Defileuri din China afectează rotația Pământului. Cum e posibil
5
Utilizator care ține în mână un iPhone, cu ecran cu potocaliu și mov, pe fundal alb. Telefoanele iPhone au punctul verde de pe ecranul dispozitivelor
Funcția iPhone ascunsă care ți-ar putea salva viața. Ce opțiune introduce iOS 18
Mulți utilizatori nu știu de funcția iPhone ascunsă care ți-ar putea salva viața în caz de urgență și care a fost introdusă cu cea mai recentă actualizare a sistemului de operare. O nouă funcție...
Funcția iPhone ascunsă care ți-ar putea salva viața. Ce opțiune introduce iOS 18
PARTENERI
×