Gelişmekte olan yapay zeka alanı, tescilli dijital içeriği tartışmalı yeni bir ekonomik savaş alanına dönüştürdü. Veri lisanslama modelini uygulamak için önemli bir adım atan sosyal tartışma platformu Reddit, yapay zeka şirketi Perplexity’nin yanı sıra üç adet veri toplama şirketi SerApi, OxyLabs ve AWMProxy’yi de hedef alan kapsamlı bir dava açtı. Bu yasal işlem, söz konusu kuruluşların Reddit’in kullanıcılar tarafından oluşturulan içeriğini sistematik olarak topladığını ve kullandığını, yerleşik ödeme ve lisanslama yapılarını atlattığını iddia ediyor. Bu dava, yapay zeka kuruluşlarına karşı sosyal medya devinin “ikinci yüksek profilli” yasal mücadelesini işaret ediyor. Bu davadan önce, Anthropic’in Claude sohbet robotunu eğitmek için Reddit’in materyallerini kullanmasıyla ilgili de bir dava açılmıştı.
Korunan İçerik Lisanslama İşletmesi
2023 yılından bu yana Reddit, ayrıntılı gönderiler, yorumlar ve etkileşimleri içeren geniş kullanıcı veri havuzunu, yapay zeka modeli geliştirme için ticari değeri yüksek bir varlık olarak stratejik olarak yeniden konumlandırdı. Bu değişim, içerik akışlarına programlı erişim isteyen kuruluşlar için lisans ücretleri gerektiren özel bir fiyatlandırma modeliyle destekleniyor. Şirket bugüne kadar, Google ve OpenAI gibi teknoloji devleriyle yüksek değerli veri lisanslama ortaklıkları kurarak bilgi tabanının gelirleştirilmesini daha da sağlamlaştırdı. Mevcut davada, kamuya açık arama motoru sonuçlarından sistematik olarak veri toplanmasının, davalıların müzakere edilen mâli yükümlülüklerini atlatmak için kasıtlı olarak kullandıkları bir mekanizma olduğu iddia ediliyor. Reddit, hem önemli miktarda mâli tazminat hem de daha önce toplanan tüm verilerin gelecekte satılmasını veya kullanılmasını yasaklayan kalıcı bir yargı kararı talep ediyor.
Sanık Tarafların Sınıflandırılması
Şikayetteki davalılar, veri gelirleştirmenin bölünmüş bir ekosistemini temsil etmektedir. AI destekli bir “cevap motoru” olan Perplexity, modelin iyileştirilmesi için muazzam veri setlerine ihtiyaç duyan, tartışmasız en tanınmış isim olsa da, SerApi, OxyLabs ve AWMProxy’nin davaya dahil edilmesi, veri toplamanın temel altyapısına odaklanıldığını göstermektedir. Bu üç kuruluş, arama dizinlerinden web içeriğinin endüstriyel ölçekte çıkarılmasını ve ticarileştirilmesini kolaylaştıran proxy ağları ve yapılandırılmış veri API’leri gibi hizmetler sunmak konusunda uzmanlaşmıştır. Perplexity’nin katılımı, yetkisiz içerik kopyalama ve web sitelerinin içerik toplama tercihlerini bildirmek için kullandıkları standart bir sinyal mekanizması olan robots.txt protokolünü açıkça ihlal ettiği yönündeki önceki raporlar nedeniyle “özellikle” incelenmektedir.
Veri Kaçırmanın Deneysel Kanıtı
Reddit davasının merkezinde, yetkisiz veri akışını izole etmek ve izlemek için tasarlanmış kontrollü, teknik bir kavram kanıtı bulunmaktadır. Mahkeme dosyalarına göre, Reddit daha önce Perplexity’ye resmi bir durdurma ve vazgeçme bildirimi göndermiş, AI firması bunu kabul etmiş, ancak Reddit’in verilerini kullanmadığını iddia etmişti. Bu iddiaya karşı çıkmak için Reddit, Google’ın arama motoru tarafından taranabilir ve indekslenebilir, başka hiçbir yerde doğrudan erişilebilir olmayan sentetik bir içerik sondası oluşturdu. Kısa bir süre içinde, Perplexity cevap motoruna yöneltilen sorgular, bu kontrollü gönderinin benzersiz içeriğini tam olarak yeniden üreten sonuçlar verdi. Bu bulgu, Reddit’in yasal argümanının temelini oluşturuyor: “Perplexity’nin, Reddit’in içeriğini ‘cevap motoruna’ dahil etmesinin tek makul mekanizması, kendisinin ve/veya ortak davalılarının Google arama dizininden Reddit içeriğini sistematik olarak toplama eylemlerinin birleşimidir,”
Perplexity'nin 'Açık Erişime' İlişkin Tutumu
Dava ile ilgili sorulara yanıt olarak Perplexity, kullanıcı haklarına ve kamuya açık bilgilere net erişim ilkesine bağlılığını vurgulayan bir açıklama yayınladı. Henüz resmi olarak yasal belgeleri almadığını doğrulayan şirket, açıklık ve kamu yararına yönelik tehditler olarak nitelendirdiği şeylere karşı “kararlılıkla mücadele edeceğini” taahhüt etti. Bu savunma, şirketin faaliyetlerini bilgi erişilebilirliği ve algoritmik şeffaflık gibi daha geniş bir bağlamda ele almaktadır.
Politika Yoluyla Veri Egemenliğini Güçlendirmek
Bu dava, Reddit’in veri sınırlarını korumak için giderek daha sıkı önlemler almasıyla oldukça tutarlıdır. Platform, 2024 yılında bilinmeyen web tarayıcıları ve botların hız sınırlaması da dahil olmak üzere teknik kısıtlamaları aşamalı olarak uygulamaya koydu. Ayrıca şirket, Internet Archive’in Wayback Machine gibi kuruluşlara sağlanan arşiv erişimine ilişkin gelecekteki kısıtlamaları da duyurdu. Bu kısıtlamalar 2025 ortasında yürürlüğe girmişti. Bu teknik kontrolleri tamamlayan bir diğer unsur, Reddit’in web kazıma işlemlerini düzenleyen yeni yasal çerçeveleri savunmasıdır. Şirket, açık lisans koşullarını evrensel olarak tanınan robots.txt dosyasına doğrudan yerleştirmeyi amaçlayan bir mekanizma olan Really Simple Licensing (RSL) standardını aktif olarak benimsemiştir ve böylece üçüncü tarafların özel web verilerini tarama ve kullanma şekline ilişkin kanuni parametreleri yeniden tanımlamaya çalışmaktadır. Bu agresif strateji, platformun kullanıcılar tarafından oluşturulan fikri mülkiyetin yetkili dağıtıcısı olarak kendini konumlandırma konusundaki kararlılığını vurgulamaktadır.




