OpenAI, yapay zeka modellerini eğitmek için kullanmayı planladığı veri kümelerini üçüncü taraflardan toplamak üzere yeni bir ortaklık programı başlatıyor. ‘OpenAI Veri Ortaklıkları’ adlı girişim, halihazırda kamunun çevrimiçi olarak kolayca erişemediği büyük ölçekli özel ve kamusal bilgileri arayacak. Şirket, toplayacağı verilerin mutlaka nicel veya metin formatında olması gerekmediğini, programın görüntü, ses veya video da kabul edeceğini söylüyor. Şirket özellikle, “insan niyetini” ifade ettiği sürece “herhangi bir konuda” ve “herhangi bir dilde” veri arayışında olduğunu söylüyor ve bunu uzun biçimli makalelere veya yazıya dökülmüş konuşmalara benzetiyor. OpenAI tarafından toplanan insan merkezli verilerin, şirketin konuşulan kelimeleri yazıya dökmek için kullanılan otomatik konuşma tanıma teknolojisi gibi araçları geliştirmesine yardımcı olması bekleniyor. Bu girişim aynı zamanda ChatGPT’nin kullanıcılarla sohbet tarzında etkileşim kurmak için sesli sorguları desteklemeye yönelik son genişlemesiyle de uyumlu. Yapay zeka modellerini, insan benzeri konuşmaları nasıl sürdüreceğini öğreten daha fazla bilgiye maruz bırakmak, bu özelliği ve işlevsel olarak takip edecek diğer araçları daha da geliştirecektir.
Veri ortaklığı programı boyunca yürütülen model testleri, kullanıcılara daha karmaşık ve anlamlı yanıtlar sunmak üzere güncellenen OpenAI’ın, tüketiciye yönelik GPT-4 Turbo’sunun yeteneklerini de doğal olarak genişletecek. OpenAI, İzlanda hükümeti gibi yetkili kurumlar da dahil olmak üzere ilgili kuruluşlarla çalışmaya başladığını söylüyor. OpenAI, seçilmiş veri kümeleri aracılığıyla GPT-4’ün İzlanda dilinde yapılan sorguları anlama yeteneğini geliştirmek için çalıştığını söylüyor. Özel ya da kamu kuruluşu programa katılmak isterse, bir temsilci şirketin web sitesinde, bir form göndermek suretiyle paylaşmak istediği veri türü ve boyutu hakkında bilgi paylaşabilir. Veri setleri için iki yol vardır. Bunlardan ilki, dil modellerinin eğitimiyle ilgili veri kümeleri için ideal olan ‘Açık Kaynak’ arşividir. Ancak, buraya yapılan gönderimler herkesin kullanımına açık olacak. Alternatif olarak OpenAI, bir şirketin “temel modellerini” ve “ince ayarlı ve özel modellerini” içerdiğini söylediği özel yapay zeka modellerini eğitmek için kanalize edilecek “özel veri seti yolu” aracılığıyla bilgi gönderebileceğini söylüyor. Bu, verilerini gizli tutmak isteyen şirketler veya kurumlar için tavsiye ediliyor. Ancak aynı bağlamda OpenAI, hassas veya kişisel bilgiler içeren veri kümeleri aramadığını söylüyor. ChatGPT şimdiden yükselen kullanıcı tabanıyla rekorlar kırdı. Dünya çapında yaklaşık 400 milyon aylık aktif kullanıcısı var, bu da gizliliğin araç için sadece bir odak noktası olmaya devam edeceği anlamına geliyor. Daha önce Samsung çalışanları, hassas verileri yapay zeka modeline sızdırdıkları için sıcak koltuğa oturtulmuştu. OpenAI, bir kullanıcı bir katılım formu aracılığıyla açıkça bilgi göndermediği sürece modellerini eğitmek için API’si tarafından üretilen verileri kullanmadığını iddia etse de, tüm gözler şirketin bu girişim aracılığıyla toplanan verileri, bilhassa da özel veri kümelerini nasıl ele aldığında olacak.