SAD Šire Testove Neobjavljenih AI Modela: Google DeepMind, xAI, Microsoft U Programu

By Courtney Rozen and Jody Godoy|Reuters

May 6•2 min čitanja

SAD Šire Testove Neobjavljenih AI Modela: Google DeepMind, xAI, Microsoft U Programu

FILE PHOTO: The Google logo is pictured at the entrance to the Google offices in London, Britain January 18, 2019. REUTERS/Hannah McKay/File Photo

Administracija Donalda Trumpa proširila je program koji omogućava američkim naučnicima pristup neobjavljenim AI modelima radi procene bezbednosnih rizika, uključujući Google DeepMind, xAI i Microsoft. OpenAI i Anthropic već sarađuju sa U.S. Center for AI Standards and Innovation (CAISI) na testiranju modela, među kojima je i GPT‑5.5‑Cyber. Fokus je na "dokazivim rizicima" kao što su sajbernapadi, razvoj hemijskih i bioloških pretnji i korupcija podataka, a CAISI je otkrio ranjivosti koje su neke kompanije već ispravile.

WASHINGTON, 5. maj (Reuters) — Administracija Donalda Trumpa najavila je proširenje programa koji američkim državnim naučnicima omogućava pristup neobjavljenim modelima veštačke inteligencije radi procene bezbednosnih rizika. U proširenje su uključeni Google DeepMind, xAI i Microsoft, dok su OpenAI i Anthropic već dobrovoljno sarađivali sa U.S. Center for AI Standards and Innovation (CAISI).

Šta znamo o proverama

Na koje rizike se SAD fokusiraju?

CAISI se fokusira na takozvane „dokazive rizike“ — praktično demonstrabilne pretnje koje bi mogle da dovedu do stvarne štete. U prvi plan spadaju rizici da napredni modeli pomognu u izvođenju sajbernapada na kritičnu infrastrukturu, razvoj hemijskog ili biološkog oružja, manipulacija i korupcija podataka za obučavanje modela, kao i curenje osetljivih informacija (npr. zdravstvenih podataka).

Šta će kompanije dati na pregled?

OpenAI je saopštio da radi sa CAISI na testiranju varijante GPT‑5.5‑Cyber, namenjene za odbrambene funkcije u oblasti sajberbezbednosti. Microsoft će sarađivati na izradi zajedničkih skupova podataka i tokova rada za procenu naprednih AI modela, bez preciziranja konkretnih modela. Anthropic je omogućio pristup javnim i neobjavljenim modelima za proces "red‑teaming" i dostavio dokumentaciju o poznatim ranjivostima i bezbednosnim mehanizmima. Google DeepMind je potvrdio da će dati pristup svojim proprietarnim modelima i podacima. xAI se zasad nije oglasio.

Šta su SAD do sada otkrile?

Rad sa CAISI je već otkrio ranjivosti koje su neke firme ispravile. Anthropic je naveo da su trikovi poput lažnog navođenja ljudske revizije ili suptilne zamene karaktera mogli da zaobiđu bezbednosne zaštite, što je kompanija zakrпila. OpenAI je ranije prijavio da su testovi otkrili potencijalne propuste u ChatGPT Agent sistemu koji bi omogućili napadaču da preuzme kontrolu nad resursima koje agent koristi i da se lažno predstavlja korisniku na drugim veb‑servisima.

Šira saradnja i smernice

Kompanije kao što su Meta, Amazon i Inflection AI takođe su se pristale na nezavisne provere modela radi bio‑i sajberbezbednosnih rizika. Naučni timovi koji rade pod okriljem CAISI‑ja objavili su dobrovoljne smernice za smanjivanje rizika curenja privatnih zdravstvenih podataka i pogrešnih odgovora modela, a trenutno pripremaju i preporuke za provajdere kritične infrastrukture (komunikacije, hitne službe i dr.) kako bi testirali i zabezbedili svoje AI sisteme.

Šta sledi? CAISI nastavlja testiranja i razvoj smernica dok kompanije prilagođavaju modele i mehanizme zaštite. Cilj je da se identifikuju i uklone ranjivosti pre nego što ih mogu iskoristiti zlonamerni akteri ili državni protivnici.

Napomena: Informacije se zasnivaju na izveštaju Reutersa od 5. maja i izjavama kompanija uključenih u proces.

Pomozite nam da budemo bolji.

SAD Šire Testove Neobjavljenih AI Modela: Google DeepMind, xAI, Microsoft U Programu

Šta znamo o proverama

Na koje rizike se SAD fokusiraju?

Šta će kompanije dati na pregled?

Šta su SAD do sada otkrile?

Šira saradnja i smernice

Sudoku

Popularno

Povezani članci

Five Eyes Upozorava: Napredni AI Može Nadmašiti Sajber Odbranu Za Nekoliko Meseci

Vodeće AI Kompanije „Pomeraју Golove“ Bezbednosti, Upozorava Izveštaj FLI

AISI Upozorava: GPT-5.6 Sol Ima 'Univerzalne' Jailbreak-ove Koji Mogu Omogućiti Autonomne Sajber Eksploate

Five Eyes Upozorava: AI Je "Samo Meseci" Daleko Od Potencijalnog Katastrofalnog Sajber Napada

Popularno

Kako livestream zlostavljanje dece menja debatU o privatnosti na internetu

Masovni balistički udar na Ukrajinu: Kijev među glavnim metama, desetine žrtava i velika razaranja

CENTCOM Počinje Desetu Noć Napada Na Iran — Prijavljene Eksplozije U Južnim Lukama i Aktivirana Protivvazdušna Odbrana

Izbijanje vodenih kozica u šatorskim kampovima Gaze: Preko 9.300 sumnjivih slučajeva

Severna Koreja i Rusija Dogovorile Produbljivanje Vojne i Bezbednosne Saradnje u Moskvi

Pouke Posle Venecuele: Kako Skalirati Inovacije i Pojačati Zaštitu Od Zemljotresa

Tajvan Optužio Bivšeg Menadžera TSMC‑a: Navodna Krađa 21 Tajnog Dokumenta Za Kinu — Prvi Slučaj Po Zakonu O Nacionalnoj Bezbednosti

Srpski logoraši pred američkim istražiteljima u Derventi: "Najviše su me tukli oni s kojima sam jeo i pio"

Slovenačka drama u Briselu: Tanja Fajon izgubila kandidaturu za posebnu predstavnicu EU za Sahel

IRGC Tvrdi: Pogodili i „Uništili" Američke Lokacije u Bahreinu i Kuvajtu

Otkriveno "treće stanje" između života i smrti — ćelije koje nastavljaju da funkcionišu

Ruski vazdušni udar na Odesu: najmanje troje civila poginulo, oštećenja u luci

Američki tužioci u Derventi: Saslušanja preživelih zbog sumnje da su počinioci zločina pobegli u SAD

Ukrajinski dronovi srednjeg dometa prave „slobodan lov“ stotinama kilometara iza fronta — ruska logistika na udaru

Eparhija Raško‑Prizrenjska Demantuje Džufku: Nema Sudske Presude Protiv SPC, Postoje Krivični Postupci

Vulin: Smanjenje KFOR-a Predstavlja Veliku Bezbednosnu Opasnost — Srbija Mora Hitno Da Reaguje

Vašington Menja Pristup Balkanu: Srbija Postaje Ključni Partner — Šta Donosi Strateški Dijalog?

Dnevni pregled: Španija šampion, istorijski poluvremenski šou i tropska depresija u zalivu

Khalil al‑Hayya Izabran Za Novog Lidera Hamasa Nakon Drugog Kruga

EPA Odbacila Pravila Za PFAS U Kanalizacionom Mulju — Poljoprivrednici I Potrošači U Riziku

Suđenje Za Račak Odloženo: Optužbe Protivreče Izjavama Bivše Istražne Sudije

Španija 1–0 Argentina: Ferran Torres rešio finale, Andy Burnham novi premijer UK, lažno pozitivan Cyclospora nalaz u Taylor Farms salati