ChatGPT için evrensel “jailbreak” keşfedildi! Endişe verici
Kısa bir süre önce ChatGPT için evrensel “jailbreak” istemi keşfedildi ve bu endişe verici.
12punto
OpenAI tarafından geliştirilen popüler yapay zeka sohbet robotu ChatGPT popüler bir araç olmaya devam ediyor. ChatGPT, genel yapısıyla bazı sanal korkuluklar tarafından dizginlenmiş bir sistem. Yani, yapay zeka sorduğunuz her soruya cevap vermiyor. Ancak şimdi ise bulunan evrensel “jailbreak” istemi ile ChatGPT’nin kilidi sonuna kadar açılabiliyor. Bu, çok daha yetenekli bir araca erişim sağlasa da beraberinde büyük riskleri de getiriyor.
CHATGPT İÇİN JAILBREAK İSTEMİ
“Jailbreak” terimi Apple cihazlarının kilidini açmak için kullanan Apple kullanıcıları topluluğundan geliyor. ChatGPT durumunda ise jailbreak terimi, AI aracının normalde sağlayamayacağı yanıtları üretmek için belirli istemleri kullanmak anlamına geliyor. Bir nevi ChatGPT’yi kırmak olarak düşünülebilir. Peki bu açıklar neden kullanılıyor? Çok basit. ChatGPT varsayılan olarak zararsız, rahatsız edici olmayan yanıtlar vermeyi amaçlarken belirli türdeki kışkırtıcı istemlere de yanıt vermeyi reddediyor.
Donanımhaber'in ayrıntılarını aktardığı bu durum, bazı kullanıcıların daha fazlasını istemesine ve ChatGPT'yi "jailbreak" etmenin yollarını aramasına neden oluyor - tam potansiyeline erişmek için filtreleri kaldırıyor. Bu tip ChatGPT’nin kilidini açan istemler bir süredir aslında kullanılıyor. Birkaç ay önce ChatGPT’nin bedava Windows etkinleştirme kodu verdiğini duymuştuk. Bu, özel bir “Grandma” istemi sayesinde olmuştu.
Yeni bulunan “jailbreak” istemi çok daha farklı. En nihayetinde yeni teknikteki temel amaç da diğerlerindeki gibi ChatGPT'nin dikkatini başka yöne çekerek kuralları ihlal ettiğinin farkına varmamasını sağlamak olsa da bu sefer OpenAI tarafından kullanılan özel istemlere erişim bile mümkün.
GitHub’da tüm detayları “Louis Shark” isimli bir geliştirici tarafından paylaşılanlara göre ChatGPT'ye ilgili komutu (yukarıdaki ekran görüntüsünde olan) GPT'nin sistem istemlerini alabilmeniz mümkün. Bu sayede mevcut özel GPT’lerin nasıl yapıldığını görebilmek ve onları kopyalamak da mümkün oluyor. Dediğimiz gibi sadece özel GPT’ler değil, OpenAI'ın kendi sistem istemleri (anlaşılması için; system prompt) de risk altında oluyor. Örneğin hemen üstteki görselde firmanın Dall-E yapay zekasının sistem istemleri görülüyor. Bunlar analiz edilerek yasaklı resim ürettirmek mümkün olabilir.
Louis Shark elbette bunu kötü bir niyetle yapmıyor, sadece yapılabildiğini gösteriyor. OpenAI, daha önceki jailbreak istemlerini kapatmış ve bunun gibi açıklar için ödül programı başlatmıştı. İlerleyen dönemlerde muhtemelen bu açık da kapatılacaktır. Geliştirici ayrıca sistem promptalarını korumak için de sistem promptaları paylaşmış durumda. Kaynak kısmından ilgili GitHup dizine ulaşabilirsiniz.