„Dokaz zastrašivanjem“? Kako AI (o4-mini) generiše uverljive — ali ponekad pogrešne — matematičke dokaze

Feb 21•3 min čitanja

AI is becoming very, very good at solving math proofs, raising the specter that at some point, it will be able to find solutions that even the world's best mathematicians will struggle to understand. . | Credit: James Boldry for Live Science

AI model o4-mini impresionirao je matematičare sposobnošću da formuliše uverljive dokaze, ali stručnjaci upozoravaju da takva samouverenost ne znači i tačnost. Rešenje može biti primena formalnih verifikacionih jezika kao što je Lean, koji mašinski proverava svaki korak. Ako AI naučimo da radi zajedno sa formalnim proverama, može rešavati izuzetno složene probleme — ali to otvara i filozofska pitanja o smislu dokaza koje ljudi ne razumeju.

Na tajnom skupu 2025. godine grupa vodećih svetskih matematičara testirala je najnoviji veliki jezički model kompanije OpenAI, o4-mini. Mnogi su bili zatečeni koliko su odgovori modela zvučali kao izlaganje pravog matematičara: strukturisano, autoritativno i prikladno tehničko.

Zabrinutosti: Uverljiv Stil, Moguće Greške

Iako su komentari bili puni priznanja, pojavila se i važna opreza. Ken Ono, profesor teorije brojeva na Univerzitetu Virdžinije, primetio je da model »iznosi sve s tolikom sigurnošću« da to može dovesti do preuranjenog poverenja. Terence (Terry) Tao iz UCLA upozorio je da je AI dobar u tome da zvuči kao da ima tačan odgovor, ali da ta samouverenost ne garantuje ispravnost.

Fermat proposed what's now known as his "last" theorem in 1637. The 1670 book "Arithmetica" includes Fermat's commentary, which was published after his death. | Credit: Wikimedia Commons

„Ako nešto kažete sa dovoljno autoriteta, ljudi se uplaše. Mislim da je o4-mini savladao 'dokaz zastrašivanjem',“ rekao je Ken Ono.

„Nažalost, AI je mnogo bolji u tome da zvuči kao da ima tačan odgovor nego da ga zapravo ima… uvek će delovati uverljivo,“ upozorio je Terry Tao.

Zašto je to ozbiljno?

Ako matematika ne može da proveri ili razume dokaze, ne možemo iz njih izvesti sigurne nove tehnike. Primera radi, dokaz za problem P vs. NP imao bi ogromne praktične posledice — od optimizacije industrijskih procesa do sigurnosti kriptografije. Ako takvi dokazi potiču iz sistema koje ljudi ne razumeju ili kojima ljudi slepo veruju, to stvara rizik.

Istorijski kontekst i formalna verifikacija

Ljudi često zaboravljaju da su i ljudski dokazi ponekad bili diskutabilni ili nepotpuno dokumentovani. Andrew Granville i drugi ukazuju na slučajeve u kojima su »jezičke nejasnoće« dovele do grešaka. Najpoznatiji primer je rad Endrjua Vajlsa na Fermatovoj poslednjoj teoremi: prvobitno izloženi dokaz je imao ozbiljan propust, koji je kasnije ispravljen.

Andrew Wiles describing his proof of the Taniyama-Shimura Conjecture in 1993. His initial proof contained an error, but he ultimately found a final solution which would lead to him proving Fermat's last theorem. | Credit: Science Photo Library

Da bi se smanjio rizik prihvatanja netačnih ili dvosmislenih rezultata, raste interes za formalnim verifikacionim sistemima kao što je Lean. U formalnoj verifikaciji svaki korak mora biti zapisan u preciznom formalnom jeziku, a mašina proverava logičku doslednost bez jezičkih tumačenja.

„Ako primoramo AI da isporučuje rezultate u formalno verifikovanom jeziku, to bi, u principu, rešilo većinu problema,“ rekao je Tao.

Kevin Buzzard sa Imperial College London zamišlja povratnu petlju u kojoj AI predlaže dokaz, prevodi ga u Lean, Lean prijavljuje greške, a AI pokušava da ih ispravi — proces koji bi mogao ubrzati proveru i popravke.

The four color theorem states that any map can be colored in with just four colors, such that none of the same colors touch each other. It was formally proven, largely using a computer, by 2005. | Credit: Science Photo Library

Posledice: Nove Mogućnosti, Nova Filozofska Pitanja

Ako se AI poveže sa formalnim proverama, može pomoći da se otkriju neočekivane veze između oblasti matematike i da se reše veoma složeni problemi. Marc Lackenby sa Oksforda ističe da AI može uočiti veze koje ljudima ne bi pale na pamet.

S druge strane, postoji realna mogućnost da se razviju »objektivno tačni« dokazi koji su toliko složeni da ih nijedan čovek u potpunosti ne razume. To otvara filozofsko pitanje: ako rezultat više ne možemo razumeti, koliko doprinosi ljudskom znanju i kakva je uloga matematičara u takvom procesu?

Istorija pokazuje da su i ranije postojali slučajevi gde nijedan pojedinac ne razume ceo dokaz — timovi sa desetak ili dvadeset autora gde svako razume svoj deo. I računarski asistirani dokazi (npr. teorema o četiri boje) već su ušli u matematičku praksu. Ipak, razlika je u tome što AI sada može predlagati, prilagođavati i verifikovati dokaze autonomno.

Zaključak

AI menja prirodu matematičkog dokazivanja: od socijalnog procesa ubeđivanja stručnjaka ka potencijalno automatizovanom, formalno verifikovanom procesu. To obezbeđuje moćne alate, ali i zahteva jasno razumevanje granica, odgovornosti i filozofskih implikacija — posebno kada dokazi postanu nerazumljivi ljudima ili kada samouverenost sistema nadjača stvarnu ispravnost.

Pomozite nam da budemo bolji.

„Dokaz zastrašivanjem“? Kako AI (o4-mini) generiše uverljive — ali ponekad pogrešne — matematičke dokaze

Zabrinutosti: Uverljiv Stil, Moguće Greške

Zašto je to ozbiljno?

Istorijski kontekst i formalna verifikacija

Posledice: Nove Mogućnosti, Nova Filozofska Pitanja

Zaključak

Sudoku

Popularno

Povezani članci

Možemo Li Verovati AI U Potrazi Za Vanzemaljskim Životom? Naučnici Upozoravaju

Svako Može Lažirati Naučnu Fotografiju Uz AI — Kako Sačuvati Poverenje U Nauku?

Moć generativnog AI izaziva strah: može li tehnologija otupliti ljudski um?

Nova Studija: Lak Pristup AI Četbotovima Izaziva Značajan Pad Učenja

Vrhunski matematičar sa Oksforda: „Đavo bi mogao iskoristiti AI da uništi svet“ — Upozorenje i Poziv Na Dijalog

Popularno

Kako livestream zlostavljanje dece menja debatU o privatnosti na internetu

Masovni balistički udar na Ukrajinu: Kijev među glavnim metama, desetine žrtava i velika razaranja

CENTCOM Počinje Desetu Noć Napada Na Iran — Prijavljene Eksplozije U Južnim Lukama i Aktivirana Protivvazdušna Odbrana

Izbijanje vodenih kozica u šatorskim kampovima Gaze: Preko 9.300 sumnjivih slučajeva

Severna Koreja i Rusija Dogovorile Produbljivanje Vojne i Bezbednosne Saradnje u Moskvi

Pouke Posle Venecuele: Kako Skalirati Inovacije i Pojačati Zaštitu Od Zemljotresa

Tajvan Optužio Bivšeg Menadžera TSMC‑a: Navodna Krađa 21 Tajnog Dokumenta Za Kinu — Prvi Slučaj Po Zakonu O Nacionalnoj Bezbednosti

Srpski logoraši pred američkim istražiteljima u Derventi: "Najviše su me tukli oni s kojima sam jeo i pio"

Slovenačka drama u Briselu: Tanja Fajon izgubila kandidaturu za posebnu predstavnicu EU za Sahel

IRGC Tvrdi: Pogodili i „Uništili" Američke Lokacije u Bahreinu i Kuvajtu

Otkriveno "treće stanje" između života i smrti — ćelije koje nastavljaju da funkcionišu

Ruski vazdušni udar na Odesu: najmanje troje civila poginulo, oštećenja u luci

Američki tužioci u Derventi: Saslušanja preživelih zbog sumnje da su počinioci zločina pobegli u SAD

Ukrajinski dronovi srednjeg dometa prave „slobodan lov“ stotinama kilometara iza fronta — ruska logistika na udaru

Eparhija Raško‑Prizrenjska Demantuje Džufku: Nema Sudske Presude Protiv SPC, Postoje Krivični Postupci

Vulin: Smanjenje KFOR-a Predstavlja Veliku Bezbednosnu Opasnost — Srbija Mora Hitno Da Reaguje

Vašington Menja Pristup Balkanu: Srbija Postaje Ključni Partner — Šta Donosi Strateški Dijalog?

Dnevni pregled: Španija šampion, istorijski poluvremenski šou i tropska depresija u zalivu

Khalil al‑Hayya Izabran Za Novog Lidera Hamasa Nakon Drugog Kruga

EPA Odbacila Pravila Za PFAS U Kanalizacionom Mulju — Poljoprivrednici I Potrošači U Riziku

Suđenje Za Račak Odloženo: Optužbe Protivreče Izjavama Bivše Istražne Sudije

Španija 1–0 Argentina: Ferran Torres rešio finale, Andy Burnham novi premijer UK, lažno pozitivan Cyclospora nalaz u Taylor Farms salati