Google'ın yapay zekası görselleri anlamlandırmaya başladı

Google, yapay zeka tabanlı arama deneyimini geliştirmeye devam ediyor. Şirketin AI Modu adını verdiği arama odaklı sohbet botu, artık sadece metinlerle değil, görsellerle de etkileşim kurabiliyor. Bu yeni özellik sayesinde kullanıcılar, görseller üzerinden sorular sorarak detaylı yanıtlar alabiliyor. Google, bu güncellemeyi Android ve iOS platformlarında, Google uygulaması aracılığıyla milyonlarca kullanıcısına sunmuş durumda.

12punto 08 Nisan 2025

Güncelleme, Gemini yapay zeka modelinin özel bir versiyonu ile Google Lens teknolojisinin birleşimine dayanıyor. Kullanıcılar, bir fotoğraf çekerek ya da cihazlarından görsel yükleyerek yapay zekâya içerik hakkında sorular sorabiliyor. Sistem, yalnızca görseldeki nesneleri tanımakla kalmıyor, aynı zamanda bu nesnelerin bağlamını da değerlendiriyor. Bu sayede kullanıcılar, görseldeki nesneler hakkında bilgi almakla kalmayıp, aynı zamanda onları çevreleyen ilişkiler ve görselin genel anlamı hakkında da derinlemesine bilgi ediniyorlar.

Google Arama ürün yöneticisi Robby Stein, bu güncellemeyi, önceki görsel arama çalışmalarının daha gelişmiş bir aşaması olarak tanımlıyor. Yapay zeka artık şekil, renk, malzeme ve düzen gibi unsurları okuyarak sahnenin tümünü anlıyor. Görseldeki her nesne, yalnızca bağımsız bir varlık olarak değil, diğer öğelerle ilişkili bir bütün olarak ele alınıyor. Bu özellik, AI Modu'nun kullanıcılara daha doğal ve anlamlı yanıtlar sunmasını sağlıyor.

Yapay zeka, görselleri analiz ederken 'fan-out' adı verilen bir yaklaşımı kullanıyor. Bu yöntemle, görseldeki her bir nesneye yönelik birçok paralel sorgu oluşturuluyor. Bu sayede, görselin tüm detaylarıyla ilgili katmanlı ve bağlam açısından tutarlı bir yanıt sunulabiliyor. Örneğin, bir kitaplık fotoğrafı incelendiğinde sistem, kitapları tanıyabiliyor, benzer içerikler önerebiliyor ve okuma önerilerinde bulunabiliyor.

Bu yenilik, sadece görsel tanıma ile sınırlı kalmıyor; aynı zamanda kullanıcılarla etkileşime girerek soruları da yanıtlıyor. Kullanıcı, görselle ilgili daha fazla bilgi talep ettiğinde sistem, ek sorgular üreterek yeni önerilerde bulunabiliyor. Bu özellik, AI Modu’nu sadece statik bir analiz aracı olmaktan çıkarıp, dinamik bir asistan haline getiriyor. Her görsel, sistem için bilgiye ulaşma noktasında bir başlangıç noktası haline geliyor.

Google, AI Modu’nu ilk kez geçen ay Google One AI Premium abonelerine sınırlı erişimle sunmuştu. Ancak, bu güncellemeyle birlikte özellik artık yalnızca ücretli abonelere özel değil. Şirket, Labs programı kapsamında milyonlarca kullanıcıya erişim sunduğunu duyurdu. Bu da, daha fazla kişinin gelişmiş görsel arama deneyiminden faydalanabileceği anlamına geliyor.