Svet Vesti
Bezbednost

SAD Šire Testove Neobjavljenih AI Modela: Google DeepMind, xAI, Microsoft U Programu

SAD Šire Testove Neobjavljenih AI Modela: Google DeepMind, xAI, Microsoft U Programu
FILE PHOTO: The Google logo is pictured at the entrance to the Google offices in London, Britain January 18, 2019. REUTERS/Hannah McKay/File Photo

Administracija Donalda Trumpa proširila je program koji omogućava američkim naučnicima pristup neobjavljenim AI modelima radi procene bezbednosnih rizika, uključujući Google DeepMind, xAI i Microsoft. OpenAI i Anthropic već sarađuju sa U.S. Center for AI Standards and Innovation (CAISI) na testiranju modela, među kojima je i GPT‑5.5‑Cyber. Fokus je na "dokazivim rizicima" kao što su sajbernapadi, razvoj hemijskih i bioloških pretnji i korupcija podataka, a CAISI je otkrio ranjivosti koje su neke kompanije već ispravile.

WASHINGTON, 5. maj (Reuters) — Administracija Donalda Trumpa najavila je proširenje programa koji američkim državnim naučnicima omogućava pristup neobjavljenim modelima veštačke inteligencije radi procene bezbednosnih rizika. U proširenje su uključeni Google DeepMind, xAI i Microsoft, dok su OpenAI i Anthropic već dobrovoljno sarađivali sa U.S. Center for AI Standards and Innovation (CAISI).

Šta znamo o proverama

Na koje rizike se SAD fokusiraju?

CAISI se fokusira na takozvane „dokazive rizike“ — praktično demonstrabilne pretnje koje bi mogle da dovedu do stvarne štete. U prvi plan spadaju rizici da napredni modeli pomognu u izvođenju sajbernapada na kritičnu infrastrukturu, razvoj hemijskog ili biološkog oružja, manipulacija i korupcija podataka za obučavanje modela, kao i curenje osetljivih informacija (npr. zdravstvenih podataka).

Šta će kompanije dati na pregled?

OpenAI je saopštio da radi sa CAISI na testiranju varijante GPT‑5.5‑Cyber, namenjene za odbrambene funkcije u oblasti sajberbezbednosti. Microsoft će sarađivati na izradi zajedničkih skupova podataka i tokova rada za procenu naprednih AI modela, bez preciziranja konkretnih modela. Anthropic je omogućio pristup javnim i neobjavljenim modelima za proces "red‑teaming" i dostavio dokumentaciju o poznatim ranjivostima i bezbednosnim mehanizmima. Google DeepMind je potvrdio da će dati pristup svojim proprietarnim modelima i podacima. xAI se zasad nije oglasio.

Šta su SAD do sada otkrile?

Rad sa CAISI je već otkrio ranjivosti koje su neke firme ispravile. Anthropic je naveo da su trikovi poput lažnog navođenja ljudske revizije ili suptilne zamene karaktera mogli da zaobiđu bezbednosne zaštite, što je kompanija zakrпila. OpenAI je ranije prijavio da su testovi otkrili potencijalne propuste u ChatGPT Agent sistemu koji bi omogućili napadaču da preuzme kontrolu nad resursima koje agent koristi i da se lažno predstavlja korisniku na drugim veb‑servisima.

Šira saradnja i smernice

Kompanije kao što su Meta, Amazon i Inflection AI takođe su se pristale na nezavisne provere modela radi bio‑i sajberbezbednosnih rizika. Naučni timovi koji rade pod okriljem CAISI‑ja objavili su dobrovoljne smernice za smanjivanje rizika curenja privatnih zdravstvenih podataka i pogrešnih odgovora modela, a trenutno pripremaju i preporuke za provajdere kritične infrastrukture (komunikacije, hitne službe i dr.) kako bi testirali i zabezbedili svoje AI sisteme.

Šta sledi? CAISI nastavlja testiranja i razvoj smernica dok kompanije prilagođavaju modele i mehanizme zaštite. Cilj je da se identifikuju i uklone ranjivosti pre nego što ih mogu iskoristiti zlonamerni akteri ili državni protivnici.

Napomena: Informacije se zasnivaju na izveštaju Reutersa od 5. maja i izjavama kompanija uključenih u proces.

Pomozite nam da budemo bolji.

Povezani članci

Popularno