ChatGPT için evrensel “jailbreak” keşfedildi! Endişe verici
Kısa bir süre önce ChatGPT için evrensel “jailbreak” istemi keşfedildi ve bu endişe verici.
OpenAI tarafından geliştirilen popüler yapay zeka sohbet robotu ChatGPT popüler bir araç olmaya devam ediyor. ChatGPT, genel yapısıyla bazı sanal korkuluklar tarafından dizginlenmiş bir sistem. Yani, yapay zeka sorduğunuz her soruya cevap vermiyor. Ancak şimdi ise bulunan evrensel “jailbreak” istemi ile ChatGPT’nin kilidi sonuna kadar açılabiliyor. Bu, çok daha yetenekli bir araca erişim sağlasa da beraberinde büyük riskleri de getiriyor.
CHATGPT İÇİN JAILBREAK İSTEMİ
“Jailbreak” terimi Apple cihazlarının kilidini açmak için kullanan Apple kullanıcıları topluluğundan geliyor. ChatGPT durumunda ise jailbreak terimi, AI aracının normalde sağlayamayacağı yanıtları üretmek için belirli istemleri kullanmak anlamına geliyor. Bir nevi ChatGPT’yi kırmak olarak düşünülebilir. Peki bu açıklar neden kullanılıyor? Çok basit. ChatGPT varsayılan olarak zararsız, rahatsız edici olmayan yanıtlar vermeyi amaçlarken belirli türdeki kışkırtıcı istemlere de yanıt vermeyi reddediyor.
Donanımhaber'in ayrıntılarını aktardığı bu durum, bazı kullanıcıların daha fazlasını istemesine ve ChatGPT'yi "jailbreak" etmenin yollarını aramasına neden oluyor - tam potansiyeline erişmek için filtreleri kaldırıyor. Bu tip ChatGPT’nin kilidini açan istemler bir süredir aslında kullanılıyor. Birkaç ay önce ChatGPT’nin bedava Windows etkinleştirme kodu verdiğini duymuştuk. Bu, özel bir “Grandma” istemi sayesinde olmuştu.
Yeni bulunan “jailbreak” istemi çok daha farklı. En nihayetinde yeni teknikteki temel amaç da diğerlerindeki gibi ChatGPT'nin dikkatini başka yöne çekerek kuralları ihlal ettiğinin farkına varmamasını sağlamak olsa da bu sefer OpenAI tarafından kullanılan özel istemlere erişim bile mümkün.
GitHub’da tüm detayları “Louis Shark” isimli bir geliştirici tarafından paylaşılanlara göre ChatGPT'ye ilgili komutu (yukarıdaki ekran görüntüsünde olan) GPT'nin sistem istemlerini alabilmeniz mümkün. Bu sayede mevcut özel GPT’lerin nasıl yapıldığını görebilmek ve onları kopyalamak da mümkün oluyor. Dediğimiz gibi sadece özel GPT’ler değil, OpenAI'ın kendi sistem istemleri (anlaşılması için; system prompt) de risk altında oluyor. Örneğin hemen üstteki görselde firmanın Dall-E yapay zekasının sistem istemleri görülüyor. Bunlar analiz edilerek yasaklı resim ürettirmek mümkün olabilir.
Louis Shark elbette bunu kötü bir niyetle yapmıyor, sadece yapılabildiğini gösteriyor. OpenAI, daha önceki jailbreak istemlerini kapatmış ve bunun gibi açıklar için ödül programı başlatmıştı. İlerleyen dönemlerde muhtemelen bu açık da kapatılacaktır. Geliştirici ayrıca sistem promptalarını korumak için de sistem promptaları paylaşmış durumda. Kaynak kısmından ilgili GitHup dizine ulaşabilirsiniz.
Haber Kaynağı : 12punto
İlgili Haberler
Çok Okunanlar
Hasan Arat'tan Fenerbahçe'ye Rafa Silva'lı 'Talisca' yanıtı
Ebru Baki Sözcü'den ayrıldı mı?
21 Kasım Perşembe maç programı: Bugün maç var mı, hangi maçlar var, saat kaçta?
UEFA Uluslar Ligi'nde Türkiye'nin rakibi kim olacak? Play-off maçı ne zaman?
Atatürk için 21 Kasım 1938'de yapılan resmi cenaze töreninin fotoğrafları
İUP maaşı ödeme tarihi ne zaman? İUP maaşları ne zaman yatacak?
Fenerbahçe En-Nesyri için Al-Nassr'den gelen rekor bonservisi reddetti
20 Kasım reyting sonuçları 2024: Annem Ankara, Kuruluş Osman, Leyla
Yenidoğan Çetesi üyesi Renas Kılıç'tan skandal itiraf
Bu akşam TV'de ne var? 21 Kasım Perşembe TRT 1, Kanal D, Star TV, Show TV, ATV