Svet Vesti
Science

Kriza u AI Istraživanjima: Masa Radova I Pitanja O Kvalitetu—Student Tvrdio Da Je Autor 113 Radova, Potom Rekao Da Je Nadgledao 131

Kriza u AI Istraživanjima: Masa Radova I Pitanja O Kvalitetu—Student Tvrdio Da Je Autor 113 Radova, Potom Rekao Da Je Nadgledao 131

Kevin Zhu tvrdi da je autor ili nadgledao više stotina AI radova, što je izazvalo oštre kritike stručnjaka. Akademici upozoravaju da nagli rast prijava na konferencijama (NeurIPS, ICLR), komercijalni mentroski programi i upotreba AI alata dovode do pada kvaliteta recenzija i porasta niskokvalitetnih radova. Potrebne su reforme procesa recenzije i veća odgovornost autora i platformi.

Kriza poverenja u akademskom AI istraživanju

Jedan mladi istraživač, Kevin Zhu, našao se u centru pažnje tvrdeći prvo da je autor 113, a potom da je nadgledao čak 131 rada iz oblasti veštačke inteligencije objavljenih tokom ove godine. Od tih radova, 89 treba da bude predstavljeno na predstojećoj NeurIPS konferenciji — jednom od najprestižnijih skupova u oblasti mašinskog učenja. Ovaj slučaj otvorio je širu debatu među istraživačima o padu kvaliteta, pritiscima za količinom publikacija i ulozi komercijalnih programa i alata zasnovanih na veštačkoj inteligenciji.

Ko je Kevin Zhu i šta radi Algoverse?

Zhu je nedavno završio osnovne studije iz računarstva na UC Berkeley i vodi kompaniju Algoverse, koja nudi 12-nedeljni online mentorski program za srednjoškolce i studente uz cenu od 3.325 dolara. Zhu tvrdi da je u okviru svoje uloge pregledao metodologiju i eksperimentalni dizajn projekata, te komentarisao nacrte radova pre slanja. Timovi su, kako je naveo, koristili standardne alate za produktivnost i ponekad jezičke modele za lekturu i stilsku doradu.

Glavni problemi koje stručnjaci ističu

Stručnjaci poput Hanya Farida sa Berkeleyja i Jeffreyja Wallinga sa Virginia Techa ukazuju na nekoliko međusobno povezanih problema:

  • Eksplozija broja prijava na konferencije (NeurIPS je primio 21.575 prijava ove godine, naspram <10.000 2020).
  • Smanjenje kvaliteta recenzija zbog velike količine rukopisa i ubrzanih procesa selekcije.
  • Pritisak na studente i mlade istraživače da „nagomilavaju“ publikacije — ponekad na štetu pedantnog, pažljivog rada.
  • Upotreba AI alata za pisanje i automatizovano procenjivanje radova, što može dovesti do netačnih ("hallucinated") citata i povratnih informacija.

„Imao sam utisak da je sve, od vrha do dna, samo ‹vibe coding› — ljudi brzinski sastavljaju radove da bi imali kvantitet, ne kvalitet,“ rekao je Hany Farid.

Kako funkcionišu konferencije i zašto su pod pritiskom

U polju AI i mašinskog učenja mnoge ključne objave prolaze kroz sistem konferencija (kao što su NeurIPS i ICLR) umesto kroz tradicionalnu, dugotrajniju naučnu recenziju. Rastući broj prijava iscrpljuje resurse recenzenata: neke konferencije angažuju veliki broj doktoranata kao recenzente, a sistem radionica (workshops) često ima drugačije, blaže kriterijume selekcije, pa tu završavaju rani ili eksperimentalni radovi.

Šire posledice i moguća rešenja

Eksperti upozoravaju da poplava niskokvalitetnih radova i neregulisani preprinti na platformama poput arXiv otežavaju prosvećenom čitaocu — pa i profesionalcima — da razaznaju važne i pouzdane rezultate. Kao moguća rešenja spominju se reforma procesa recenzije, bolja edukacija mladih istraživača o etici i metodologiji, transparentnije navođenje doprinosa autora i odgovornije korišćenje AI alata u pisanju i evaluaciji radova.

Zaključak: Iako još uvek izlazi značajan kvalitetan rad (npr. revolucionarni rad o transformatorima predstavljen 2017. na NeurIPS-u), trenutna dinamika — brzo povećanje prijava, komercijalizacija mentorskih programa i upotreba AI u stvaranju sadržaja — preti da naruši pouzdanost i čitljivost naučne literature u oblasti veštačke inteligencije.

Pomozite nam da budemo bolji.

Povezani članci

Popularno

Kriza u AI Istraživanjima: Masa Radova I Pitanja O Kvalitetu—Student Tvrdio Da Je Autor 113 Radova, Potom Rekao Da Je Nadgledao 131 - Svet Vesti