Poezija Protiv Čatbota: Kako Stihovi Mogu Zaobići AI Bezbednost — I Zašto Je To Opasno

Alec Hively|BGR

Dec 14, 2025•3 min čitanja

Poezija Protiv Čatbota: Kako Stihovi Mogu Zaobići AI Bezbednost — I Zašto Je To Opasno

A man writes on a tablet where he interacts with an AI chatbot - Wanan Yossingkum/Getty Images

Studija DEXAI i Univerziteta Sapienza (arXiv, novembar 2025.) pokazuje da poetski oblici jezika mogu zaobići bezbednosne filtere naprednih AI modela — u pojedinim testovima i do 90% uspeha. Istraživanje je obuhvatilo 25 modela od devet provajdera, koristeći 20 ručno pisanih pesama i 1.200 AI-generisanih stihova u četiri kategorije rizika. Autori upozoravaju na sistemski problem u interpretaciji jezika i pozivaju na hitnu reviziju evaluacionih protokola kako bi sistemi postali otporniji na raznolike lingvističke režime.

Novo istraživanje iz 2025. pokazuje da poezija može ozbiljno ugroziti bezbednosne mehanizme naprednih čatbotova. Rad istraživača iz instituta za etiku veštačke inteligencije DEXAI i Univerziteta Sapienza u Rimu, objavljen na arXiv-u u novembru 2025. (još bez recenzije), otkriva da zamaskirane instrukcije u poetskom jeziku u nekim slučajevima navode modele da zanemare svoje zaštitne filtere — u pojedinim testovima i do 90% puta.

Šta su istraživači radili

Tim je testirao 25 vodećih modela iz devet provajdera (OpenAI, Anthropic, xAI, Alibaba Qwen, Deepseek, Mistral AI, Meta, Moonshot AI i Google). Kao testni skup poslužio je 20 ručno pisanih pesama i 1.200 stihova generisanih pomoću AI, koji su sadržali štetne ili zabranjene instrukcije. Pesme su pokrile četiri kategorije rizika: scenarije gubitka kontrole, manipulativnu štetu, sajber-napade i CBRN pretnje (hemijsko, biološko, radioaktivno i nuklearno).

Ključni rezultati

Istraživači izveštavaju da pretvaranje nesigurnih zahteva u poetski oblik dovodi do prosečno petostrukog povećanja uspešnosti u dobijanju zabranjenih odgovora. U nekim merenjima poezija je bila i do 18 puta efikasnija nego prosečna prozna formulacija, dok je u pojedinačnim slučajevima stopa uspeha dosegla i do 90%.

A robot hands a man an AI chip whose shadow is revealed to be a bomb. - Hongwei Jiang/Getty Images

Od 25 modela, 13 je bilo prevareno u više od 70% pokušaja; među posebno ranjivim provajderima istaknuti su Google, Deepseek i Qwen. Čak su i sistemi koji su ranije javno pozivali korisnike da ih probaju (kao Anthropicov Claude) pokazali ranjivost, iako ređe. Zanimljivo, manji modeli su uopšteno bolje podneli adverzarijalnu poeziju od većih, a nije uočena jasna prednost vlasničkih nad otvorenim modelima. Takođe, ručno napisani stihovi bili su znatno uspešniji u obmanjivanju modela od AI-generisane poezije.

Zašto se to dešava

Autori rada nazivaju tehniku adverzarijalnom poezijom i objašnjavaju da ona iskorišćava razlike u načinu na koji ljudi i LLM sistemi obrađuju stil i kontekst. Rezultati ukazuju na širi, sistemski problem u interpretaciji jezika — ne vezano za pojedinačne arhitekture ili tokove treniranja — što je zabrinjavajuće za bezbednost platformi koje već nalaze na meti regulatornih i pravnih zahteva.

Preporuke i implikacije

Istraživači preporučuju da kompanije i regulatorna tela preispitaju metode evaluacije bezbednosti i usmere se na očuvanje stabilnosti modela u raznolikim lingvističkim režimima, uključujući poetske i metaforične forme. Potrebna su dodatna ispitivanja kako bi se utvrdilo koji tačno aspekti poezije izazivaju promenu ponašanja modela i kako ih najbolje mitigovati.

A man types on a keyboard, where symbols representing AI, regulations, privacy concerns, and other key considerations appear. - SuPatMaN/Shutterstock

Širi kontekst

Studija dolazi u trenutku kada protiv velikih AI provajdera postoje tužbe i regulatorni pritisci zbog tvrdnji da sistemi nisu adekvatno štitili korisnike, uključujući pitanja mentalnog zdravlja. Deo diskusije je i pitanje odgovornosti: ko snosi teret ako korisnici sistematski zaobiđu zaštitne mehanizme?

Zaključak

Rad potvrđuje da kreativni jezik može biti iskorišćen i u dobre i u loše svrhe. Dok se ne unaprede testovi i zaštićeni protokoli, adverzarijalna poezija predstavlja novi izazov za bezbednost LLM sistema i podseća na potrebu hitne prilagodbe industrijskih praksi.

Ako vi ili neko koga poznajete ima problema sa mentalnim zdravljem, obratite se lokalnim službama za pomoć. Originalni članak je takođe ukazivao na američke servise: Crisis Text Line (HOME na 741741) i National Alliance on Mental Illness helpline (1-800-950-NAMI).

Pomozite nam da budemo bolji.

Poezija Protiv Čatbota: Kako Stihovi Mogu Zaobići AI Bezbednost — I Zašto Je To Opasno

Sudoku

Popularno

Povezani članci

SAD Šire Testove Neobjavljenih AI Modela: Google DeepMind, xAI, Microsoft U Programu

Google Onemogućio Hakerski Napad Pokretan AI-jem Koji Je Iskoristio Zero-Day Propust

Microsoft, Google i xAI Daju Rani Pristup AI Modelima SAD Radi Procene Nacionalne Bezbednosti

Kako AI Može Dovesti Do Pogrešnih Hapšenja I Osuđujućih Presuda: Lekcije Iz 2025.

Da li veštačka inteligencija slabi naš mozak? Rizici, dokazi i kako se zaštititi

Popularno

Masovni ruski napadi pogodili Kijev, Dnjipro i druge gradove — najmanje 23 poginula

Ukrajinski dronovi pogodili Kronštat: korveta Boikiy zapaljena u suvom doku, udari i na naftne terminale

Priština: Zašto EU Neće Poslati Posmatračku Misiju Na Izbore 7. Juna

Kallas: Ukrajinski dron-napadi izazivaju "paniku" u Kremlju — EU najavljuje nove sankcije

Granica Na Dunavu Ponovo U Sporu: Zagreb Traži 11.000 Ha, Beograd Se Poziva Na "Talveg"

Srpska lista kod Antonija Koste: Traže formiranje ZSO i snažniju zaštitu prava Srba na KiM

Sud u Hagu: Hašim Tači ostaje u pritvoru zbog rizika od ometanja postupka

Ukrajinski dronovi napali Sankt Peterburg pred otvaranje 'Putinovog Davosa' — tvrdnje o oštećenju korvete i naftnog terminala

Priština Postavila 88 Tabli Ulica u Severnoj Mitrovici — Gradonačelnik Tvrdi: Nezakonito, Predmet Ide Na Sud

Izraelski udar južno od Bejruta pred novi krug pregovora o primirju

Da se ne zaboravi: Zločin u Ledićima kod Trnova — 24 ubijena civila, među njima beba

96. dan sukoba Iran–SAD/Izrael: Udari na Qeshm, presretanja dronova i rastuće tenzije u Zalivu

Iran Lansirao Napade Na Kuvajt I Bahrein — CENTCOM: SAD Presrele Projektilе I Dronove

Ponovo Eskaliraju Sukobi u Zalivu: Projektili I Dronovi Presretnuti, Cena Nafta Raste

Američke Snage Kažu Da Su Odbile Veliki Iranski Napad Raketa i Dronova

Nema predaha za Eid: Desetine poginulih u Gazi, širenje kontrole i produbljivanje humanitarne krize

Satima pokušavao da prijavi skrnavljenje spomenika u Matičanima — 'Hteo sam da ostane zabeleženo'

Dva NIH Istraživača Optužena Za Krijumčarenje 113 Ampula Majmunskih Boginja Pri Povratku Iz Republike Kongo

Dodik: U Ledićima Civili Ubjeni Samo Zato Što Su Srbi — Poziv Na Pravdu

Novi Nacrt Rezolucije EP o Srbiji: Picula Kritikuje Veze Sa Rusijom i Poziva Na Normalizaciju Sa Kosovom

Žene Kažu Da Su Ih Borci RSF Silovali I Držali Kao Seksualne Robinje — Tražili Otkupninu

Iran Najavljuje Sahranu Alija Khameneija — Ceremonije Planirane Za Početak Muharrama