Google bugün yapay zeka tarafından üretilen görsellerde şeffaflığa doğru bir adım attı. Google DeepMind, üretken sanat için bir filigran/tanımlama aracı olan ‘SynthID’yi duyurdu. Şirket, teknolojinin insan gözüyle görülemeyen dijital bir filigranı doğrudan bir görüntünün piksellerine yerleştirdiğini söylüyor. SynthID ilk olarak Google’ın bulut tabanlı yapay zeka araçları paketinde bulunan sanat üreticisi Imagen’i kullanan “sınırlı sayıda” müşteriye sunuluyor. Üretken sanatla ilgili pek çok sorundan biri (sanatçıların çalışmaları üzerinde eğitim almanın etik sonuçları dışında) deep fake’ler oluşturma potansiyelidir. Örneğin, Papa’nın sosyal medyada viral olan yeni hip-hop kıyafeti (MidJourney ile oluşturulan bir yapay zeka görüntüsü), üretici araçlar geliştikçe daha yaygın hale gelebilecek şeylerin erken bir örneğiydi. Yapay zeka tarafından üretilen sanatın kullanıldığı siyasi reklamlar gibi bir şeyin Twitter’da dolaşan komik bir görüntüden çok daha fazla zarar verebileceğini görmek için fazla hayal gücüne gerek yok. Temmuz ayında Beyaz Saray’da yapılan bir toplantı sonrasında yedi yapay zeka şirketinin geliştirmeyi kabul ettiği gönüllü taahhütlerden biri de “içeriğin yapay zeka tarafından oluşturulduğunun anlaşılmasına yardımcı olmak için sesli ve görsel içeriğe filigran eklenmesi” idi. Google böyle bir sistemi başlatan ilk şirket oldu. Google, SynthID’nin teknik uygulaması hakkında çok fazla ayrıntıya girmiyor (muhtemelen geçici çözümleri önlemek için), ancak filigranın basit düzenleme teknikleriyle kolayca kaldırılamayacağını söylüyor. Şirket bugün yayınlanan bir DeepMind blog yazısında “Algılanamazlık ve görüntü manipülasyonlarına karşı sağlamlık arasında doğru dengeyi bulmak zordur” diye yazdı.
DeepMind’ın SynthID proje liderleri Sven Gowal ve Pushmeet Kohli, “SynthID’yi görüntü kalitesinden ödün vermeyecek şekilde tasarladık. Filtreler eklemek, renkleri değiştirmek ve çeşitli kayıplı sıkıştırma şemalarıyla kaydetmek gibi değişikliklerden sonra bile filigranın algılanabilir kalmasına izin verdik. En yaygın olarak JPEG’ler için kullanılır” diye yazdı. SynthID’nin tanımlama kısmı görüntüyü üç dijital filigran güven seviyesine göre derecelendiriyor: Tespit edildi, tespit edilmedi ve muhtemelen tespit edildi. Araç, görüntünün piksellerine gömülü olduğu için Google, sisteminin Adobe’nin şu anda açık beta sürümünde bulunan Photoshop üretme özelliklerinde kullandığı gibi meta veri tabanlı yaklaşımlarla birlikte çalışabileceğini söylüyor. SynthID, biri filigranlama diğeri de tanımlama için olmak üzere bir çift derin öğrenme modeli içeriyor. Google, bu iki modelin farklı görüntüler üzerinde eğitilerek birleşik bir makine öğrenimi modeliyle sonuçlandığını söylüyor. Gowal ve Kohli, “Birleşik model, filigranlı içeriği doğru bir şekilde tanımlamak ve filigranı orijinal içerikle görsel olarak hizalayarak algılanamazlığı iyileştirmek de dahil olmak üzere bir dizi hedefe göre optimize edilmiştir” diye yazdı. Google bunun mükemmel bir çözüm olmadığını kabul ederek “aşırı görüntü manipülasyonlarına karşı kusursuz olmadığını” ekledi. Ancak filigranı “insanların ve kuruluşların yapay zeka tarafından üretilen içerikle sorumlu bir şekilde çalışmasını sağlamak için umut verici bir teknik yaklaşım” olarak tanımlıyor. Şirket, aracın metin (ChatGPT gibi), video ve ses üretmekle görevli olanlar da dahil olmak üzere diğer yapay zeka modellerine genişletilebileceğini söylüyor. Filigranlar derin sahtekarlıklara karşı yardımcı olabilse de, SynthID’yi benimseyen hizmetlerin sürekli güncelleme gerektirmesi nedeniyle dijital filigranın bilgisayar korsanlarıyla bir silahlanma yarışına dönüştüğünü hayal etmek kolaydır. Buna ek olarak, önde gelen üretken araçlardan biri olan Stable Diffusion’ın açık kaynaklı yapısı, SynthID’nin veya benzer herhangi bir çözümün sektör genelinde benimsenmesini zorlaştırabilir. Halihazırda yerel bilgisayarlarda çalışabilen sayısız özel yapı mevcut. Her şeye rağmen Google, SynthID’yi “yakın gelecekte” üçüncü tarafların kullanımına sunarak en azından sektör genelinde yapay zeka şeffaflığını artırmayı umuyor.