Modelele de inteligență artificială dezvoltate de Google DeepMind și OpenAI au obținut pentru prima dată o performanță la nivel de medalie de aur în cadrul Olimpiadei Internaționale de Matematică (IMO), conform New Scientist.
Cele două companii consideră acest moment drept un pas important pentru AI, care ar putea rezolva probleme complexe din domenii științifice sau matematice în viitorul apropiat, chiar dacă au fost întâmpinate de scepticism din partea matematicienilor, deoarece rezultatele modelelor și modul lor de funcționare nu au fost făcute publice.
DeepMind și OpenAI au primit medalii de aur - oficial și neoficial
Olimpiada Internațională de Matematică, una dintre cele mai prestigioase competiții din lume pentru tineri matematicieni, este de mult timp considerată de cercetătorii în domeniul AI drept un test cu potențial semnificativ pentru raționamentul matematic al unui model, cât și o zonă în care aceste sisteme se confruntă cu dificultăți.
După competiția de anul trecut, desfășurată la Bath, Marea Britanie, Google DeepMind a anunțat că sistemele sale AI, numite AlphaProof și AlphaGeometry, au obținut împreună o performanță echivalentă cu medalia de argint, însă participarea acestora nu a fost evaluată oficial de comisia olimpiadei.
Pentru ediția din acest an, organizată în Queensland, Australia, companii precum Google, Huawei și ByteDance (deținătorul TikTok), alături de alți cercetători academici, au solicitat organizatorilor ca performanțele modelelor lor AI să fie evaluate oficial.
IMO a acceptat, cu condiția ca anunțurile legate de rezultate să fie făcute după 28 iulie, odată cu încheierea ceremoniilor oficiale. OpenAI a cerut să participe, dar după ce au fost informați despre procedura oficială, nu au mai răspuns și nu s-au înregistrat în competiție.
Pe 19 iulie, OpenAI a anunțat că un nou model AI dezvoltat de companie a atins un scor echivalent medaliei de aur, evaluat de trei foști câștigători IMO, în afara competiției oficiale. Potrivit OpenAI, modelul a rezolvat corect cinci din cele șase probleme în limita de timp de 4.5 ore, la fel ca participanții umani.
Două zile mai târziu, Google DeepMind a anunțat că sistemul său AI, numit Gemini Deep Think, a obținut tot medalia de aur, cu același scor și în aceleași condiții de timp. Dolinar a confirmat că acest rezultat a fost evaluat de corectorii oficiali ai IMO.
Cum s-au pregătit modelele AI pentru olimpiadă
Spre deosebire de sistemele anterioare (AlphaProof și AlphaGeometry), care au fost dezvoltate special pentru competiție și lucrau cu întrebări și răspunsuri scrise într-un limbaj de programare numit Lean, modelele din acest an au lucrat exclusiv în limbajul lor natural.
Dezvoltarea în Lean a permis verificarea imediată a corectitudinii răspunsurilor AI, dar era greu de înțeles pentru amantori sau persoanele fără expertiză. Thang Luong de la Google, care a lucrat la Gemini Deep Think, spune că abordarea prin limbaj natural ar putea oferi răspunsuri mai ușor de înțeles și ar putea fi aplicabilă sistemelor AI cu utilizare generală.
Luong mai afirmă că posibilitatea de a verifica soluțiile în cadrul unui model lingvistic de mari dimensiuni a devenit posibilă datorită progreselor de reinforcement learning (o metodă de antrenament în care AI-ul învață cum arată succesul și descoperă regulile și metodele de rezolvare prin încercare și eroare). Modelul Google ia în calcul simultan mai multe soluții, printr-un mod numit gândire paralelă, și a fost antrenat pe un set de date care a conținut probleme matematice relevante pentru IMO.
OpenAI nu a oferit multe detalii despre sistemul său, în afară de faptul că folosește reinforcement learning și metode de cercetare experimentale.
Ambele companii spun că, în lunile următoare, vor permite testarea acestor sisteme de către matematicieni, ca mai apoi să fie disponibile publicului larg.