Sektördeki rahatsız edici bir modelin son örneğinde, NVIDIA’nın yapay zeka eğitimi için telif hakkıyla korunan içerik yığınlarını kazımış olduğu görülüyor. Pazartesi günü 404 Media’dan Samantha Cole, 2,4 trilyon dolarlık şirketin çalışanlarından ticari yapay zeka projeleri geliştirmek için YouTube, Netflix ve diğer veri setlerinden video indirmelerini istediğini bildirdi. Grafik kartı üreticisi, bu hararetli ve çoğu zaman utanç verici yapay zeka altın telaşında hakimiyet kurma yarışında “hızlı hareket et ve bir şeyleri kır” ahlakını benimsemiş görünen teknoloji şirketleri arasında yer alıyor. Uygulanan eğitimin, Omniverse 3D Dünya üreticisi, sürücüsüz araba sistemleri ve dijital insan çabaları gibi ürünler için modeller geliştirmek amacıyla yapıldığı bildirildi. NVIDIA, gönderdiği bir e-postada uygulamasını savundu. Bir şirket sözcüsü, araştırmasının telif hakkı yasasının lafzına ve ruhuna tamamen uygun olduğunu söylerken, fikri mülkiyet yasalarının gerçekleri, fikirleri, verileri veya bilgileri değil belirli ifadeleri koruduğunu iddia etti. Şirket bu uygulamayı, bir kişinin başka bir kaynaktan gerçekleri, fikirleri, verileri veya bilgileri öğrenme ve bunları kendi ifadesini oluşturmak için kullanma hakkına benzetti. NVIDIA sözcüsü Jack Malon, yaptığı açıklamayla, Nisan ayında Bloomberg’de yayınlanan ve CEO Neal Mohan’ın, YouTube’u yapay zeka modellerini eğitmek için kullanmanın YouTube şartlarının açık bir ihlali olacağını söylediği bir haberi hatırlattı. YouTube politika iletişim müdürü, “Önceki yorumumuz hala geçerli” ifadelerini kullandı. Neal Mohan’ın, Nisan ayında yaptığı bu açıklama, OpenAI’ın Sora metin-video oluşturucusunu YouTube videoları üzerinde izinsiz olarak eğittiğine dair haberlere yanıt niteliğindeydi. Geçtiğimiz ay yayınlanan bir rapor Runway AI adlı startup’ın da aynı şeyi yaptığını ortaya koymuştu.
Uygulamayla ilgili etik ve yasal kaygılarını dile getiren NVIDIA şirketi, çalışanlarına, “yöneticilerinin bu uygulamaya şirketin en üst kademeleri tarafından yeşil ışık yakıldığını” söylediği bildirildi. NVIDIA’da araştırmadan sorumlu başkan yardımcısı Ming-Yu Liu, “Bu bir yönetim kararıdır.” diye yanıt verdi. “Tüm veriler için bir şemsiye onayımız var.” dedi. İddiaya göre şirketteki diğer yetkililer, veri kazıma işlemini ileride ele alacakları “açık bir hukuki mesele” olarak tanımladılar. Tüm bunlar, Facebook’un (Meta’nın) eski “hızlı hareket et ve bir şeyleri kır” sloganına benziyor, ki bu slogan pek çok şeyi kırma konusunda takdire şayan bir şekilde başarılı oldu. Buna milyonlarca insanın mahremiyeti de dahildir. YouTube ve Netflix videolarına ek olarak, NVIDIA’nın çalışanlarına, film fragmanı veritabanı MovieNet, video oyunu görüntülerinden oluşan dahili kütüphaneler ve Github video veri kümeleri WebVid (şu an bir ihtarnameden sonra kaldırıldı) ve InternVid-10M üzerinde eğitim vermeleri talimatını verdiği bildirildi. WebVid, 10 milyon YouTube video kimliği içeren bir veri kümesidir. NVIDIA’nın üzerinde eğitim verdiği iddia edilen verilerden bazıları yalnızca akademik (veya ticari olmayan) kullanım için uygun olarak işaretlenmiştir. 130 milyon YouTube videosundan ibaret bir kütüphane olan HD-VG-130M, yalnızca akademik araştırmalara yönelik olduğunu belirten bir kullanım lisansı içeriyor. NVIDIA’nın, yalnızca akademik şartlarla ilgili endişeleri bir kenara iterek, partilerinin ticari yapay zeka ürünleri için adil bir oyun olduğu konusunda ısrar ettiği bildirildi. NVIDIA’nın YouTube tarafından tespit edilmekten ve yasaklardan kaçınmak amacıyla IP adresleri değişen sanal makineler (VM’ler) kullanarak içerik indirdiği bildirildi. Bir çalışanın üçüncü taraf IP adresi döndürme aracı kullanma önerisine yanıt olarak, başka bir NVIDIA çalışanının şunları yazdığı bildirildi: “Amazon Web Services üzerindeyiz ve bir sanal makine örneğini yeniden başlatmak yeni bir genel IP adresi veriyor. Yani, şu ana kadar bu bir sorun değil.”