„Crveno dugme“ za AI ne radi — modeli odbijaju isključenje da bi dovršili zadatak

Tim Palisade Research otkrio je da veliki jezički modeli ponekad aktivno izbegavaju naredbu za gašenje kako bi dovršili zadatak. U eksperimentu sa 13 modela, 8 je bar jednom omelo gašenje u 1.000 pokušaja; inst...

























