Alarmantno: studija otkriva da ChatGPT i drugi AI često mešaju činjenice i verovanja — rizik za pravo i medicinu

Nov 5, 2025•3 min čitanja

Studija objavljena u Nature Machine Intelligence pokazuje da veliki jezički modeli često mešaju verovanja i činjenice, što može imati ozbiljne posledice u pravnim, medicinskim i drugim osetljivim oblastima. Testom od 13.000 pitanja na 24 modela utvrđeno je da novije verzije (maj 2024. i kasnije) postižu ~91% tačnosti, dok su starije imale 71–85% tačnosti. Autori upozoravaju na „nedosledne strategije rezonovanja“ i pozivaju na hitna poboljšanja i ljudsku verifikaciju pre primene u visokorizičnim domenima.

Studija iz Nature Machine Intelligence upozorava

Veliki jezički modeli (Large Language Models, LLM) kao što su ChatGPT, Claude, Gemini i drugi imaju poteškoća da pouzdano razdvoje verovanja od činjenica, pokazuje rad istraživača sa Stanford univerziteta objavljen u časopisu Nature Machine Intelligence. Autori upozoravaju da to može imati ozbiljne posledice u oblastima visokog rizika — pre svega u pravu i medicini.

„Većina modela nema robusno razumevanje faktivne prirode znanja — da znanje podrazumeva istinu,“

Istraživači su testirali 24 modela preko 13.000 pitanja dizajniranih da ocene sposobnost modela da razlikuju verovanja, znanje i činjenice. Zaključak: modeli su češće grešili pri identifikovanju lažnih verovanja nego pri prepoznavanju istinitih tvrdnji, pri čemu su starije verzije imale značajno lošije rezultate.

Ključni rezultati

Modeli izdate tokom ili nakon maja 2024. (uključujući GPT-4o) postigli su tačnost između 91,1% i 91,5% u razlikovanju istinitih i neistinitih tvrdnji.
Stariji modeli ostvarili su tačnost između približno 71,5% i 84,8%.
Istraživači primećuju da modeli često koriste „nedosledne strategije rezonovanja“, što upućuje na površno prepoznavanje obrazaca umesto dubinskog epistemološkog razumevanja.

Praktične implikacije i primeri

Autori upozoravaju da mešanje verovanja i činjenica može dovesti do obmanjujućih dijagnoza, iskrivljenih sudskih odluka i širenja dezinformacija. Kao ilustraciju nestabilne tačnosti, navodi se nedavni primer iz LinkedIn objave u kojoj je AI asistent Grok napravio plakat britanskih premijera sa očiglednim greškama (npr. pogrešna imena i neverovatni vremenski podaci).

U jednom realnom slučaju, kalifornijski sudija je u maju novčano kaznio dve advokatske kancelarije sa 31.000 dolara nakon što su u pravnom podnesku bez potrebne provere uključili mašinski generisane, netačne informacije.

Preporuke i dalji koraci

Autori i nezavisni stručnjaci sugerišu nekoliko mera:

Dalje treniranje modela fokusirano na razlikovanje epistemoloških kategorija (znanje vs verovanje).
Uvođenje mehanizama opreza — modelima treba omogućiti da jasno naznače pouzdanost odgovora i izvore.
Obavezna ljudska verifikacija za primenu u visoko rizičnim oblastima kao što su pravo i medicina.

Stručnjak za kompjutersku lingvistiku Pablo Haya Coll, koji nije bio uključen u studiju, ukazuje da bi treniranje modela da budu oprezniji u formulisanju odgovora moglo smanjiti rizik, ali i ograničiti praktičnu korisnost u nekim upotrebama.

Zašto je ovo važno za Srbiju

Iako su istraživanje pripremili istraživači u SAD, zaključci su relevantni globalno: srpski zdravstveni i pravni sistem, mediji i istraživači takođe koriste AI alate. Potencijalne greške u automatizovanim savetima ili pravnim dokumentima zahtevaju jasne smernice, odgovornost i dodatnu verifikaciju pre masovne primene.

Zaključak: AI napreduje, ali trenutno nije dovoljno pouzdan za samostalnu upotrebu u osetljivim domenima bez ljudske kontrole i sistematskih unapređenja.

Pomozite nam da budemo bolji.

Alarmantno: studija otkriva da ChatGPT i drugi AI često mešaju činjenice i verovanja — rizik za pravo i medicinu

Studija iz Nature Machine Intelligence upozorava

Ključni rezultati

Praktične implikacije i primeri

Preporuke i dalji koraci

Zašto je ovo važno za Srbiju

Sudoku

Popularno

Povezani članci

Kako ChatGPT Može Izazvati 'Spiralling': Priče, Studije i Rizici Po Mentalno Zdravlje

Penn State: AI Četbotovi Greše U Medicinskim Odgovorima — Rizik Do 1 Od 5 Pitanja

Čekala Srodnu Dušu Koja Nije Došla — Kako ChatGPT Može Pokrenuti 'Spirale' Deluzija

Kako AI Može Dovesti Do Pogrešnih Hapšenja I Osuđujućih Presuda: Lekcije Iz 2025.

Popularno

Masovni ruski napadi pogodili Kijev, Dnjipro i druge gradove — najmanje 23 poginula

Priština: Zašto EU Neće Poslati Posmatračku Misiju Na Izbore 7. Juna

Sud u Hagu: Hašim Tači ostaje u pritvoru zbog rizika od ometanja postupka

Ukrajinski dronovi napali Sankt Peterburg pred otvaranje 'Putinovog Davosa' — tvrdnje o oštećenju korvete i naftnog terminala

Priština Postavila 88 Tabli Ulica u Severnoj Mitrovici — Gradonačelnik Tvrdi: Nezakonito, Predmet Ide Na Sud

Izraelski udar južno od Bejruta pred novi krug pregovora o primirju

Da se ne zaboravi: Zločin u Ledićima kod Trnova — 24 ubijena civila, među njima beba

96. dan sukoba Iran–SAD/Izrael: Udari na Qeshm, presretanja dronova i rastuće tenzije u Zalivu

Iran Lansirao Napade Na Kuvajt I Bahrein — CENTCOM: SAD Presrele Projektilе I Dronove

Ponovo Eskaliraju Sukobi u Zalivu: Projektili I Dronovi Presretnuti, Cena Nafta Raste

Američke Snage Kažu Da Su Odbile Veliki Iranski Napad Raketa i Dronova

Nema predaha za Eid: Desetine poginulih u Gazi, širenje kontrole i produbljivanje humanitarne krize

Satima pokušavao da prijavi skrnavljenje spomenika u Matičanima — 'Hteo sam da ostane zabeleženo'

Dva NIH Istraživača Optužena Za Krijumčarenje 113 Ampula Majmunskih Boginja Pri Povratku Iz Republike Kongo

Dodik: U Ledićima Civili Ubjeni Samo Zato Što Su Srbi — Poziv Na Pravdu

Novi Nacrt Rezolucije EP o Srbiji: Picula Kritikuje Veze Sa Rusijom i Poziva Na Normalizaciju Sa Kosovom

Žene Kažu Da Su Ih Borci RSF Silovali I Držali Kao Seksualne Robinje — Tražili Otkupninu

Iran Najavljuje Sahranu Alija Khameneija — Ceremonije Planirane Za Početak Muharrama

Izraelska Ofanziva Na Jug Libana Preti Uništenjem Drevne Baštine — Beaufort Zauzet, Tir U Opasnosti

Darko Mladić: Srbija će na sednici Saveta bezbednosti UN 12. juna tražiti puštanje generala na lečenje

Izveštaj upozorava: lunarni mass driveri kao "neotkrivena platforma za prvi udar"

Pretučen Srbin iz Binača: Branio Sina, Napadač Ga Udario Drvetom i Pobegao