Google, yeni bir metinden görüntüye aracı da dahil olmak üzere, üretici yapay zeka cephesinde bir dizi güncelleme sunuyor. ImageFX’in farkı, “etkileyici çipler” içeren bir arayüze sahip olması. Buradaki fikir, bunların “üretkenliğinizin ve fikirlerinizin bitişik boyutlarını hızlı bir şekilde denemenize” yardımcı olacağıdır. ImageFX’in ilk sürümünün yanı sıra Google, MusicFX ve TextFX’i de geliştirdiğini söylüyor. Şirket, MusicLM modelinde yeni özelliklerin yanı sıra daha hızlı müzik üretimi ve daha yüksek kaliteli ses içeren yükseltmeler yaptığını iddia ediyor. Oluşturulan şarkılar artık 70 saniyeye kadar sürebiliyor. TextFX’e gelince, Google navigasyonu ve genel kullanıcı deneyimini iyileştirmek amacıyla kullanılabilirlik güncellemelerini sundu. MusicFX ile oluşturulan ImageFX görüntüleri ve sesleri, özellikle Arama veya Chrome’da göründüklerinde bunların yapay zeka kullanılarak oluşturulduğunu açıkça göstermeyi amaçlayan dijital bir filigran olan SynthID ile etiketlenir. ImageFX kreasyonları IPTC meta verilerini de içerecek. Google’a göre bu, “insanlara yapay zeka ile oluşturulmuş görsellerimizle karşılaştıklarında daha fazla bilgi sunacak”
ABD, Kenya, Yeni Zelanda ve Avustralya’daki kullanıcılar bugünden itibaren AI Test Mutfağı’nda bu yeni ve yenilenmiş araçları deneyebilirler. Şimdilik sadece İngilizce dilinde mevcutlar. Imagen 2 modeli ImageFX’in yeni görüntü oluşturma özelliklerine güç veriyor. Ayrıca Bard, Arama, Reklamlar, Çalışma Alanındaki Duet AI ve Vertex AI’daki yeni üretken yapay zeka seçeneklerini yönlendiren teknolojidir. Google, Imagen 2’nin şimdiye kadarki en yüksek kalitede yapay zeka ile oluşturulmuş görüntüleri sunmaya yardımcı olduğunu söylüyor. Şirket, modelin görüntüleri, yapaylıklardan uzak tutmaya yardımcı olduğunu ve bu tür araçların şimdiye kadar zorlandığı görüntü oluşturma alanlarını geliştirdiğini belirtiyor. Buna ek olarak Google, Imagen 2 eğitim verilerinin güvenliğine “önemli yatırımlar” yaptığını ve şiddet içeren, saldırgan veya cinsellik barındıran içerikler gibi sorunlu çıktıları sınırlamak ve adı geçen kişilerin görüntülerini oluşturma riskini azaltmak adına filtreler uygulamak için korkuluklar eklediğini söylüyor. Bunun nedeni modelin fotogerçekçi görüntüler üretme yeteneğinin geliştirilmiş olması. Şirket ayrıca potansiyel olarak sorunlu ve zararlı içeriği tespit etmek ve engellemek için “kapsamlı rakip testleri” gerçekleştirdiğini iddia ediyor. Diğer yandan, Gemini Pro in Bard bugünden itibaren daha geniş çapta kullanıma sunuldu. Artık 40’tan fazla dilde ve 230’dan fazla ülke ve bölgenin kuzeyinde erişilebilir durumda. Ayrıca Google, bugünden itibaren çoğu ülkedeki kişilerin ücretsiz olarak Bard dilinde İngilizce görseller oluşturabileceğini söylüyor. Bu görseller SynthID filigranları içerecek.