„First Proof“: Matematičari Izazvali AI Ispitom Sa Nerešenim Matematičkim Problemima

Feb 10•3 min čitanja

First Proof je eksperimentalni ispit u kome 11 matematičara traži od AI sistema da u roku od nedelju dana reše stvarne, nerešene probleme iz njihovih istraživanja. Problemi i šifrovana rešenja objavljena su u preprintu, a dešifrovanje je zakazano neposredno pre ponoći 13. februara. Cilj je transparentna, proverljiva procena koliko AI zaista može da doprinese matematičkoj praksi, naročito u rešavanju tehničkih lema.

U trci za stvaranje veštačke inteligencije koja stvarno razume čistu matematiku, grupa vodećih matematičara pokrenula je inicijativu pod nazivom First Proof. Radi se o prvom ispitnom skupu sastavljenom od stvarnih, nerešenih problema koji su nastali u istraživanjima ovih istraživača—i za koje AI sistemi imaju jednu nedelju da ponude rešenja.

Organizatori su rezultate i detalje eksperimenta objavili u preprintu koji je izašao prošlog četvrtka. Da bi test bio verodostojan, 11 uglednih matematičara (među kojima je i dobitnik Fields Medalje) predložilo je probleme iz sopstvenih istraživanja i učitalo šifrovane verzije rešenja. Šifre će biti razrešene neposredno pre ponoći 13. februara, čime se onemogućava da modeli jednostavno „prekopiraju“ već poznate demonstracije.

Zašto je ovo važno? Matematički dokazi su posebno pogodan način za procenu sposobnosti AI: zaključci su proverljivi kroz logičke korake i stoga objektivni. To daje jasniji okvir od procene koliko je ubedljiv neki tekst ili esej. Zbog toga se sve više startapova i timova posvećuje razvoju AI modela specijalizovanih za matematiku.

Šta znamo o dosadašnjim rezultatima

U dosadašnjim testovima postignuti su zapaženi rezultati: 2025. naprednija verzija Google-ovog sistema Gemini Deep Think dobila je zlatni nivo na Međunarodnoj matematičkoj olimpijadi (IMO). U poslednje vreme, neki sistemi su rešili i više zadataka iz zbirke poznatih „Erdősovih problema“. Startap Axiom Math je takođe dospeo u vesti nakon što je objavio niz rešenja na istraživačkom nivou.

Međutim, eksperti upozoravaju da ti primeri nisu strogo kontrolisani eksperimenti: olimpijske zadatke ne možemo smatrati primerima stvarne istraživačke matematike, a modeli često pronalaze i reprodukuju postojeće, ali zaboravljene dokaze iz literature i predstavljaju ih kao nova rešenja. Jedan od nedavnih Axiom Math dokaza, na primer, kasnije se pokazao kao nepravilno predstavljen nalaz iz literature.

Prvi cilj: razjasniti tvrdnje iz industrije

Daniel Spielman, profesor sa Yale-a i jedan od autora inicijative, ističe i drugi problem: većina radova o upotrebi LLM modela pišu zaposleni u kompanijama koje ih razvijaju, što ponekad liči na reklamiranje. First Proof želi da ponudi transparentniji, reproducibilan test koji će preciznije pokazati šta AI danas zaista može u matematici.

Sam obim zadataka nije „revolucionaran“—u pitanju su pretežno leme (manji, tehnički rezultati koji služe kao koraci ka većim dokazima), ali čak i uspeh u rešavanju takvih lemmi bio bi značajan: pokazao bi da AI može da ubrza svakodnevni rad istraživača uklanjanjem rutinskih i zamornih koraka.

Šta dalje? Ako AI pokaže da pouzdano rešava ovakve tehničke zadatke, to bi moglo ubrzati rad matematičara i promeniti način rada u istraživačkim timovima—ne nužno rešavanjem velikih otvorenih problema, već kroz svakodnevnu pomoć u dokazivanju i proveri koraka.

Pomozite nam da budemo bolji.

„First Proof“: Matematičari Izazvali AI Ispitom Sa Nerešenim Matematičkim Problemima

Šta znamo o dosadašnjim rezultatima

Prvi cilj: razjasniti tvrdnje iz industrije

Sudoku

Popularno

Povezani članci

Nobelovac Giorgio Parisi i tim rešili decenijski problem u fizici uz pomoć Claude AI

Nova Studija: Lak Pristup AI Četbotovima Izaziva Značajan Pad Učenja

Možemo Li Verovati AI U Potrazi Za Vanzemaljskim Životom? Naučnici Upozoravaju

Proboj u teoriji Ramseyja: matematičari i AI približili red u haosu

Univerziteti Zaostaju Za Promenom Radnog Tržišta: Studija Zahteva Kritičku AI Pismenost

Popularno

Kako livestream zlostavljanje dece menja debatU o privatnosti na internetu

Masovni balistički udar na Ukrajinu: Kijev među glavnim metama, desetine žrtava i velika razaranja

CENTCOM Počinje Desetu Noć Napada Na Iran — Prijavljene Eksplozije U Južnim Lukama i Aktivirana Protivvazdušna Odbrana

Izbijanje vodenih kozica u šatorskim kampovima Gaze: Preko 9.300 sumnjivih slučajeva

Severna Koreja i Rusija Dogovorile Produbljivanje Vojne i Bezbednosne Saradnje u Moskvi

Pouke Posle Venecuele: Kako Skalirati Inovacije i Pojačati Zaštitu Od Zemljotresa

Tajvan Optužio Bivšeg Menadžera TSMC‑a: Navodna Krađa 21 Tajnog Dokumenta Za Kinu — Prvi Slučaj Po Zakonu O Nacionalnoj Bezbednosti

Srpski logoraši pred američkim istražiteljima u Derventi: "Najviše su me tukli oni s kojima sam jeo i pio"

Slovenačka drama u Briselu: Tanja Fajon izgubila kandidaturu za posebnu predstavnicu EU za Sahel

IRGC Tvrdi: Pogodili i „Uništili" Američke Lokacije u Bahreinu i Kuvajtu

Otkriveno "treće stanje" između života i smrti — ćelije koje nastavljaju da funkcionišu

Ruski vazdušni udar na Odesu: najmanje troje civila poginulo, oštećenja u luci

Američki tužioci u Derventi: Saslušanja preživelih zbog sumnje da su počinioci zločina pobegli u SAD

Ukrajinski dronovi srednjeg dometa prave „slobodan lov“ stotinama kilometara iza fronta — ruska logistika na udaru

Eparhija Raško‑Prizrenjska Demantuje Džufku: Nema Sudske Presude Protiv SPC, Postoje Krivični Postupci

Vulin: Smanjenje KFOR-a Predstavlja Veliku Bezbednosnu Opasnost — Srbija Mora Hitno Da Reaguje

Vašington Menja Pristup Balkanu: Srbija Postaje Ključni Partner — Šta Donosi Strateški Dijalog?

Dnevni pregled: Španija šampion, istorijski poluvremenski šou i tropska depresija u zalivu

Khalil al‑Hayya Izabran Za Novog Lidera Hamasa Nakon Drugog Kruga

EPA Odbacila Pravila Za PFAS U Kanalizacionom Mulju — Poljoprivrednici I Potrošači U Riziku

Suđenje Za Račak Odloženo: Optužbe Protivreče Izjavama Bivše Istražne Sudije

Španija 1–0 Argentina: Ferran Torres rešio finale, Andy Burnham novi premijer UK, lažno pozitivan Cyclospora nalaz u Taylor Farms salati