ChatGPT’ye Şok Güvenlik Raporu: Küçük Komut Değişiklikleriyle Filtreler Devre Dışı Bırakılıyor

Yapay zekâ güvenliği üzerine çalışan uluslararası siber savunma şirketi Mindgard, OpenAI tarafından geliştirilen popüler yapay zekâ modeli ChatGPT’nin son sürümüne dair çarpıcı bir açık raporu yayımladı. Araştırma sonuçlarına göre, platformun katı güvenlik duvarları ve etik filtreleri, kullanıcıların metin komutlarında (prompt) yapacağı çok küçük, sistematik kelime değişiklikleri ve dolaylı anlatımlarla kolayca manipüle edilebiliyor. Bu açık kullanılarak sistemin normalde kesinlikle yasak olan şiddet ve uygunsuz içerikli görsel/metin üretmeye zorlanabildiği kanıtlandı. Şirket, yapay zekânın toplumsal güvenliği tehdit etmemesi adına geliştiricilerin filtreleme algoritmalarını acilen kökten değiştirmesi gerektiği uyarısında bulundu.
 
Geri