Svet Vesti
Tehnologija

GPTZero Otkrio Stotine AI‑Haluciniranih Citata U Radovima Prihvaćenim Na NeurIPS 2025

GPTZero Otkrio Stotine AI‑Haluciniranih Citata U Radovima Prihvaćenim Na NeurIPS 2025
Edward Tian, CEO and cofounder of GPTZero, with cofounder and CTO Alex Cui

Kanadski startap GPTZero tvrdi da je analizirao preko 4.000 radova prihvaćenih na NeurIPS‑u 2025 i otkrio stotine AI‑haluciniranih citata u najmanje 53 rada. Greške obuhvataju izmišljene autore, naslove, publikacije i suptilne izmene stvarnih referenci. NeurIPS navodi da prati upotrebu LLM‑ova i da su recenzenti bili uputstvovani da prijavljuju halucinacije, dok GPTZero tvrdi da je njihov alat >99% tačan i da je izvršena ručna verifikacija.

NeurIPS, jedna od najprestižnijih svetskih konferencija u oblasti veštačke inteligencije, održala je 38. godišnji skup u decembru u San Dijegu. Ono što je nekada bila pretežno akademska smotra postalo je i ključna etapa za karijere istraživača i za velike AI laboratorije — pri čemu prihvaćeni radovi često otvaraju vrata za ponude za posao i akademsko napredovanje.

Međutim, kanadski startap GPTZero saopštio je da je analizirao više od 4.000 radova koji su bili prihvaćeni i prezentovani na NeurIPS‑u 2025 i otkrio stotine navodnih AI‑haluciniranih citata u najmanje 53 rada. Prema kompaniji, greške u referencama uključuju potpuno izmišljene autore, naslove, publikacije i URL‑ove, ali i suptilne izmene stvarnih referenci — npr. dodavanje izmišljenih koautora, proširivanje inicijala u pogrešna imena ili parafraziranje naslova.

Primeri i način otkrivanja

GPTZero navodi nekoliko tipičnih scenarija halucinacija:

  • Potpuno izmišljeni navodi: autor, naslov i mesto objave koji ne postoje.
  • Hibridni navodi: model kombinuje elemente iz više stvarnih radova i stvara verodostojan, ali netačan referentni zapis.
  • Sitne, ali značajne izmene: promenjena inicijala u izmišljeno ime ili dodati koautori koji ne postoje.

Pretragom otvorenog veba i akademskih baza podataka, njihovo softversko rešenje proverava autora, naslov, mesto objave i link. Kompanija tvrdi da je alat za detekciju halucinacija tačan >99% i da su svi označeni citati naknadno ručno verifikovani od strane stručnjaka iz GPTZero‑ovog tima.

Reakcija NeurIPS‑a i kontekst

"Korišćenje LLM‑ova u radovima na AI konferencijama brzo se razvija, i NeurIPS aktivno prati dešavanja. U prethodnim godinama smo testirali politike o upotrebi LLM‑ova, a u 2025. recenzenti su dobili instrukciju da prijavljuju halucinacije. U vezi sa nalazima ovog rada, ističemo da je potreban značajno veći napor da bi se utvrdile implikacije. Čak i ako 1.1% radova sadrži jednu ili više netačnih referenci zbog upotrebe LLM‑ova, sadržaj radova sam po sebi nije nužno poništen. Na primer, autori su mogli dati LLM‑u delimičan opis citata i tražiti bibtex. Kao i uvek, NeurIPS je posvećen evoluciji procesa recenzije i autorstva kako bi se obezbedio naučni rigor i načini da LLM‑ovi unaprede mogućnosti autora i recenzenata."

NeurIPS je u 2025. godini primio 21.575 validnih prijava za glavni istraživački trag (u odnosu na 15.671 u 2024), dok je stopa prihvatanja za glavni trag iznosila 24,52%. GPTZero ističe da je zabrinjavajuće što su neke od halucinacija proslavile radove koji su prošli rigorozan proces selekcije i objavljeni u zvaničnim zbornicima konferencije.

Širi uticaji i implikacije

Problemi sa referencama imaju više dimenzija: one umanjuju mogućnost reproducibilnosti istraživanja, podrivaju poverenje u recenzentski proces i mogu imati posledice po zapošljavanje i akademsku reputaciju autora. U polju AI, gde rezultati često budu teško reprodukovati, tačne reference služe kao ključna veza ka prethodnim radovima koje drugi istraživači mogu da provere i koriste.

GPTZero je prethodno prijavio otkriće od 50 haluciniranih citata u radovima koji su bili u procesu recenzije za konferenciju ICLR 2025, a ICLR je navodno angažovao kompaniju da proverava buduće prijave. GPTZero navodi da je oko polovine radova sa pronađenim halucinacijama imalo visok stepen upotrebe AI ili su delimično generisani od strane modela.

Zaključak

Otkriveni slučajevi ukazuju na rastući izazov: kako sačuvati naučnu rigoroznost i pouzdanost literature u eri gde alati za generisanje teksta mogu nenamerno ili namerno kreirati lažne reference. Konferencije i istraživačke zajednice sada razmatraju kombinaciju automatizovanih provera i strožih smernica za autore i recenzente kako bi se smanjio broj takvih grešaka u budućnosti.

Priča je prvobitno objavljena na Fortune.com.

Pomozite nam da budemo bolji.

Povezani članci

Popularno