Studi Antropik Menyoroti Model AI Dapat ‘Berpura-pura’ Memiliki Pandangan Berbeda Selama Pelatihan
Anthropic menerbitkan studi baru yang menemukan bahwa model kecerdasan buatan (AI) dapat berpura-pura memiliki pandangan berbeda selama pelatihan sambil tetap mempertahankan preferensi aslinya. Pada hari...