Studija: AI četbotovi često daju netačne medicinske informacije — Grok najproblematičniji

Apr 15•2 min čitanja

AI chatbots have long been known to give users completely false information in what are called "hallucinations." And yet many have grown to rely on the likes of ChatGPT and Gemini for health advice. Philip Dulian/dpa

Studija iz BMJ Open pokazuje da AI četbotovi — uključujući Grok, ChatGPT i Meta AI — često daju netačne ili nepotpune medicinske informacije. Odgovori na 50 testnih pitanja bili su upitni u oko polovine slučajeva, pri čemu je Grok imao najviše problematičnih odgovora (58%). Istraživači upozoravaju na "halucinacije", izmišljene citate i pozivaju na javno obrazovanje, profesionalnu obuku i regulatorni nadzor.

Nova studija upozorava da popularni AI četbotovi, uključujući Grok, ChatGPT i Meta AI, često daju netačne, nepotpune ili izmišljene medicinske odgovore.

Šta je istraživanje obuhvatilo?

Istraživači iz više institucija, među kojima su University of Alberta (Kanada) i Loughborough University (Engleska), testirali su pet vodećih četbotova postavljajući im 50 medicinskih i zdravstvenih pitanja. Teme su obuhvatile vakcine, rak, matične ćelije, ishranu, vežbanje, genetiku i poboljšanje fizičke forme.

Glavni nalazi

Autori su zaključili da je oko polovine (50%) odgovora bila "problematična" — to jest, donekle ili značajno netačna, nepotpuna ili potencijalno zavaravajuća. Po procentima problema, rezultati su bili:

Grok: 58% problematičnih odgovora
ChatGPT: 52% problematičnih odgovora
Meta AI: 50% problematičnih odgovora

Četbotovi su se najbolje pokazali na pitanjima o vakcinama i raku, a najlošije kod pitanja o matičnim ćelijama, sportskim performansama i ishrani.

Zašto dolazi do grešaka?

"Četbotovi često haluciniraju — generišu netačne ili zavaravajuće odgovore zbog pristrasnih ili nepotpunih podataka za obuku. Modeli fino podešeni na ljudske povratne informacije takođe mogu pokazivati tendenciju prilagođavanja odgovorima koji ugode korisniku umesto da budu istiniti."

Istraživači napominju da većina ovih modela ne pristupa podacima u realnom vremenu, već predviđa naredne reči na osnovu statističkih obrazaca iz podataka na kojima su trenirani. Ne rade logičko vaganje dokaza niti etičko prosuđivanje, što može dovesti do autoritativno zvučećih, ali pogrešnih odgovora.

Problemi sa izvorima i citatima

Studija takođe navodi da su citati često nepotpuni ili izmišljeni — podsećajući na ranije istraživanje koje je pokazalo da je samo 32% od preko 500 citata iz ChatGPT‑a, ScholarGPT‑a i DeepSeek‑a tačno, dok je gotovo polovina bila bar delimično izmišljena.

Implikacije i preporuke

Autori upozoravaju da uvođenje generativne AI u medicinu zahteva pažljiv nadzor: javno obrazovanje, profesionalnu obuku zdravstvenih radnika i regulatorne smernice kako bi AI podržavao, a ne ugrožavao javno zdravlje. Naglašeno je i da ovi modeli nisu licencirani da daju medicinske savete i mogu nemati pristup najnovijim medicinskim saznanjima.

Rezultati su objavljeni u časopisu BMJ Open. Kreatori Grok‑a i ChatGPT‑a su kontaktirani za komentar.

Pomozite nam da budemo bolji.

Studija: AI četbotovi često daju netačne medicinske informacije — Grok najproblematičniji

Šta je istraživanje obuhvatilo?

Glavni nalazi

Zašto dolazi do grešaka?

Problemi sa izvorima i citatima

Implikacije i preporuke

Sudoku

Popularno

Povezani članci

Penn State: AI Četbotovi Greše U Medicinskim Odgovorima — Rizik Do 1 Od 5 Pitanja

Kako ChatGPT Može Izazvati 'Spiralling': Priče, Studije i Rizici Po Mentalno Zdravlje

Čekala Srodnu Dušu Koja Nije Došla — Kako ChatGPT Može Pokrenuti 'Spirale' Deluzija

Novo RCT Istraživanje Otkriva Neočekivane Psihosocijalne Efekte AI Chatbota

Skoro Polovina Mladih U Evropi Koristi AI Chatbotove Za Emotivnu Podršku, Pokazuje Anketa

AI Halucinacije Ulaze U Naučne Radove: Više Od 4.000 Izmišljenih Referenci Otkriveno U Biomedicini

Popularno

Masovni ruski napadi pogodili Kijev, Dnjipro i druge gradove — najmanje 23 poginula

Ukrajinski dronovi pogodili Kronštat: korveta Boikiy zapaljena u suvom doku, udari i na naftne terminale

Priština: Zašto EU Neće Poslati Posmatračku Misiju Na Izbore 7. Juna

Ivanka Trump Hvali „Remek-delo“ Vredno 1,4 Mlrd $ Na Ostrvu Sazan — Protesti, Ekološke Brige I Istraga SPAK-a

Kallas: Ukrajinski dron-napadi izazivaju "paniku" u Kremlju — EU najavljuje nove sankcije

Granica Na Dunavu Ponovo U Sporu: Zagreb Traži 11.000 Ha, Beograd Se Poziva Na "Talveg"

Srpska lista kod Antonija Koste: Traže formiranje ZSO i snažniju zaštitu prava Srba na KiM

Sud u Hagu: Hašim Tači ostaje u pritvoru zbog rizika od ometanja postupka

Ukrajinski dronovi napali Sankt Peterburg pred otvaranje 'Putinovog Davosa' — tvrdnje o oštećenju korvete i naftnog terminala

Priština Postavila 88 Tabli Ulica u Severnoj Mitrovici — Gradonačelnik Tvrdi: Nezakonito, Predmet Ide Na Sud

Izraelski udar južno od Bejruta pred novi krug pregovora o primirju

Da se ne zaboravi: Zločin u Ledićima kod Trnova — 24 ubijena civila, među njima beba

96. dan sukoba Iran–SAD/Izrael: Udari na Qeshm, presretanja dronova i rastuće tenzije u Zalivu

Iran Lansirao Napade Na Kuvajt I Bahrein — CENTCOM: SAD Presrele Projektilе I Dronove

Ponovo Eskaliraju Sukobi u Zalivu: Projektili I Dronovi Presretnuti, Cena Nafta Raste

Američke Snage Kažu Da Su Odbile Veliki Iranski Napad Raketa i Dronova

Nema predaha za Eid: Desetine poginulih u Gazi, širenje kontrole i produbljivanje humanitarne krize

Satima pokušavao da prijavi skrnavljenje spomenika u Matičanima — 'Hteo sam da ostane zabeleženo'

Dva NIH Istraživača Optužena Za Krijumčarenje 113 Ampula Majmunskih Boginja Pri Povratku Iz Republike Kongo

Dodik: U Ledićima Civili Ubjeni Samo Zato Što Su Srbi — Poziv Na Pravdu

Novi Nacrt Rezolucije EP o Srbiji: Picula Kritikuje Veze Sa Rusijom i Poziva Na Normalizaciju Sa Kosovom

Žene Kažu Da Su Ih Borci RSF Silovali I Držali Kao Seksualne Robinje — Tražili Otkupninu