Upozorenje: ChatGPT i drugi LLM modeli ne razlikuju uverenja od činjenica

Nov 4, 2025•2 min čitanja

Novo istraživanje sa Stanforda otkriva da veliki jezički modeli (LLM), uključujući ChatGPT, ne razlikuju pouzdano uverenja od činjenica. Testirano je 24 modela na preko 13.000 pitanja i svi su imali problema sa prepoznavanjem lažnih uverenja. Autori upozoravaju na rizik od halucinacija i širenja dezinformacija, naročito u pravnim, medicinskim i novinarskim kontekstima, i pozivaju na hitna unapređenja.

ChatGPT ne razlikuje uverenja od činjenica — novo istraživanje sa Stanforda

Novo istraživanje sa Stanford univerziteta pokazuje da veliki jezički modeli (LLM), uključujući ChatGPT, Claude, DeepSeek i Gemini, imaju ozbiljne poteškoće u razlikovanju uverenja od objektivnih činjenica. Tim istraživača testirao je 24 modela na više od 13.000 pitanja i utvrdio da nijedan od testiranih modela nije dosledno prepoznao kada je neko uverenje netačno.

„Kako se jezički modeli sve češće uvode u oblasti visokog rizika, poput prava, medicine, novinarstva i nauke, njihov kapacitet da razlikuju uverenje od znanja i činjenicu od fikcije postaje od suštinskog značaja“, navode autori studije.

Istraživači su zabeležili da modeli često „haluciniraju“ ili prihvataju netačne tvrdnje kao validne, što povećava rizik od širenja dezinformacija. Takvo ponašanje ima direktne, zabrinjavajuće posledice u oblastima gde su tačnost i verodostojnost ključni — na primer, u medicinskim dijagnozama, sudskim procenama ili novinarskom izveštavanju.

„Ovi rezultati otkrivaju strukturnu slabost jezičkih modela: teškoće u doslednom razlikovanju subjektivnog uverenja i objektivne istine u zavisnosti od formulacije tvrdnje“, rekao je Pablo Haya Coll iz Laboratorije za kompjutersku lingvistiku Autonomnog univerziteta u Madridu (koji nije bio uključen u studiju).

Autori studije, Language models cannot reliably distinguish belief from knowledge and fact, objavljene u časopisu Nature Machine Intelligence, pozivaju tehnološke kompanije da hitno poboljšaju modele pre njihovog uvođenja u domene visokog rizika.

Moguća rešenja i ograničenja

Jedno od predloženih rešenja jeste treniranje modela da bude oprezniji u formulisanju odgovora — na primer, da jasno razdvoje šta je provera činjenica, a šta izveštaj o nečijem uverenju. Ipak, kako ističu stručnjaci, takav pristup može smanjiti učestalost halucinacija, ali i negativno uticati na korisnost i fluentnost odgovora.

Dok se ne postignu robustnija rešenja, autori i nezavisni stručnjaci upozoravaju na ograničenu pouzdanost LLM-a u kritičnim kontekstima i pozivaju na dodatnu proveru informacija i jasnu human-in-the-loop kontrolu.

Ključne činjenice:

Testirano: 24 LLM-a, preko 13.000 pitanja.
Glavni problem: modeli ne prepoznaju dosledno lažna uverenja i često ih prihvataju kao činjenice.
Preporuka: unapređenja modela i oprez pri primeni u pravnim, medicinskim i novinarskim domenima.

Studija: "Language models cannot reliably distinguish belief from knowledge and fact", Nature Machine Intelligence.

Pomozite nam da budemo bolji.

Upozorenje: ChatGPT i drugi LLM modeli ne razlikuju uverenja od činjenica

ChatGPT ne razlikuje uverenja od činjenica — novo istraživanje sa Stanforda

Moguća rešenja i ograničenja

Sudoku

Popularno

Povezani članci

Čekala Srodnu Dušu Koja Nije Došla — Kako ChatGPT Može Pokrenuti 'Spirale' Deluzija

Kako ChatGPT Može Izazvati 'Spiralling': Priče, Studije i Rizici Po Mentalno Zdravlje

Penn State: AI Četbotovi Greše U Medicinskim Odgovorima — Rizik Do 1 Od 5 Pitanja

Lajdenska deklaracija upozorava: AI može ugroziti temelje matematike — preko 130 istraživača i IMU podržali apel

Popularno

Masovni ruski napadi pogodili Kijev, Dnjipro i druge gradove — najmanje 23 poginula

Priština: Zašto EU Neće Poslati Posmatračku Misiju Na Izbore 7. Juna

Sud u Hagu: Hašim Tači ostaje u pritvoru zbog rizika od ometanja postupka

Ukrajinski dronovi napali Sankt Peterburg pred otvaranje 'Putinovog Davosa' — tvrdnje o oštećenju korvete i naftnog terminala

Priština Postavila 88 Tabli Ulica u Severnoj Mitrovici — Gradonačelnik Tvrdi: Nezakonito, Predmet Ide Na Sud

Izraelski udar južno od Bejruta pred novi krug pregovora o primirju

Da se ne zaboravi: Zločin u Ledićima kod Trnova — 24 ubijena civila, među njima beba

96. dan sukoba Iran–SAD/Izrael: Udari na Qeshm, presretanja dronova i rastuće tenzije u Zalivu

Iran Lansirao Napade Na Kuvajt I Bahrein — CENTCOM: SAD Presrele Projektilе I Dronove

Ponovo Eskaliraju Sukobi u Zalivu: Projektili I Dronovi Presretnuti, Cena Nafta Raste

Američke Snage Kažu Da Su Odbile Veliki Iranski Napad Raketa i Dronova

Nema predaha za Eid: Desetine poginulih u Gazi, širenje kontrole i produbljivanje humanitarne krize

Satima pokušavao da prijavi skrnavljenje spomenika u Matičanima — 'Hteo sam da ostane zabeleženo'

Dva NIH Istraživača Optužena Za Krijumčarenje 113 Ampula Majmunskih Boginja Pri Povratku Iz Republike Kongo

Dodik: U Ledićima Civili Ubjeni Samo Zato Što Su Srbi — Poziv Na Pravdu

Novi Nacrt Rezolucije EP o Srbiji: Picula Kritikuje Veze Sa Rusijom i Poziva Na Normalizaciju Sa Kosovom

Žene Kažu Da Su Ih Borci RSF Silovali I Držali Kao Seksualne Robinje — Tražili Otkupninu

Iran Najavljuje Sahranu Alija Khameneija — Ceremonije Planirane Za Početak Muharrama

Izraelska Ofanziva Na Jug Libana Preti Uništenjem Drevne Baštine — Beaufort Zauzet, Tir U Opasnosti

Darko Mladić: Srbija će na sednici Saveta bezbednosti UN 12. juna tražiti puštanje generala na lečenje

Izveštaj upozorava: lunarni mass driveri kao "neotkrivena platforma za prvi udar"

Pretučen Srbin iz Binača: Branio Sina, Napadač Ga Udario Drvetom i Pobegao